以下是小编为大家准备的用python分割TXT文件成4K的TXT文件(共含6篇),仅供参考,大家一起来看看吧。同时,但愿您也能像本文投稿人“yue了”一样,积极向本站投稿分享好文章。
python连接mysql数据库示例(做增删改操作
python实现系统状态监测和故障转移实例方
ssh批量登录并执行命令的python实现代码
Python Trie树实现字典排序
python中的yield使用方法
python赋值操作方法分享
Python中的CURL PycURL使用例子
Python中实现远程调用(RPC、RMI)简单例
重命名批处理python脚本
使用python绘制人人网好友关系图示例
Python入门教程 超详细1小时学会
python 中文乱码问题深入分析
比较详细Python正则表达式操作指
Python字符串的encode与decode研
Python open读写文件实现脚本
Python enumerate遍历数组示例应
Python 深入理解yield
Python+Django在windows下的开发
python 文件和路径操作函数小结
python 字符串split的用法分享
作者:Sephiroth 字体:[增加 减小] 类型:
这篇文章主要介绍了Python实现分割文件及合并文件的方法,涉及Python针对文件的分割与合并操作相关技巧,通过自定义函数split与join实现了文件的分割与合并操作,需要的朋友可以参考下
本文实例讲述了Python实现分割文件及合并文件的方法,分享给大家供大家参考。具体如下:
分割文件split.py如下:
#!/usr/bin/python########################################################################### split a file into a set of parts; join.py puts them back together;# this is a customizable version of the standard unix split command-line # utility; because it is written in Python, it also works on Windows and# can be easily modified; because it exports a function, its logic can # also be imported and reused in other applications;##########################################################################import sys, skilobytes = 1024megabytes = kilobytes * 1000chunksize = int(1.4 * megabytes) # default: roughly a floppydef split(fromfile, todir, chunksize=chunksize): if not os.path.exists(todir): # caller handles errors os.mkdir(todir) # make dir, read/write parts else: for fname in os.listdir(todir): # delete any existing files os.remove(os.path.join(todir, fname)) partnum = 0 input = open(fromfile, ‘rb‘) # use binary mode on Windows while 1: # eof=empty string from read chunk = input.read(chunksize) # get next part <= chunksize if not chunk: break partnum = partnum+1 filename = os.path.join(todir, (‘part%04d‘ % partnum)) fileobj = open(filename, ‘wb‘) fileobj.write(chunk) fileobj.close # or simply open().write() input.close() assert partnum <= 9999 # join sort fails if 5 digits return partnumif __name__ == ‘__main__‘: if len(sys.argv) == 2 and sys.argv[1] == ‘-help‘: print ‘Use: split.py [file-to-split target-dir [chunksize]]‘ else: if len(sys.argv) < 3: interactive = 1 fromfile = raw_input(‘File to be split? ‘) # input if clicked todir = raw_input(‘Directory to store part files? ‘) else: interactive = 0 fromfile, todir = sys.argv[1:3] # args in cmdline if len(sys.argv) == 4: chunksize = int(sys.argv[3]) absfrom, absto = map(os.path.abspath, [fromfile, todir]) print ‘Splitting‘, absfrom, ‘to‘, absto, ‘by‘, chunksize try: parts = split(fromfile, todir, chunksize) except: print ‘Error during split:‘ print sys.exc_info()[0], sys.exc_info()[1] else: print ‘Split finished:‘, parts, ‘parts are in‘, absto if interactive: raw_input(‘Press Enter key‘) # pause if clicked
合并文件join_file.py如下:
#!/usr/bin/python########################################################################### join all part files in a dir created by split.py, to recreate file. # This is roughly like a ‘cat fromdir/* > tofile‘ command on unix, but is # more portable and configurable, and exports the join operation as a # reusable function. Relies on sort order of file names: must be same # length. Could extend split/join to popup Tkinter file selectors.##########################################################################import os, sysreadsize = 1024def join(fromdir, tofile): utput = open(tofile, ‘wb‘) parts = os.listdir(fromdir) parts.sort() for filename in parts: filepath = os.path.join(fromdir, filename) fileobj = open(filepath, ‘rb‘) while 1: filebytes = fileobj.read(readsize) if not filebytes: break output.write(filebytes) fileobj.close() output.close()if __name__ == ‘__main__‘: if len(sys.argv) == 2 and sys.argv[1] == ‘-help‘: print ‘Use: join.py [from-dir-name to-file-name]‘ else: if len(sys.argv) != 3: interactive = 1 fromdir = raw_input(‘Directory containing part files? ‘) tofile = raw_input(‘Name of file to be recreated? ‘) else: interactive = 0 fromdir, tofile = sys.argv[1:] absfrom, absto = map(os.path.abspath, [fromdir, tofile]) print ‘Joining‘, absfrom, ‘to make‘, absto try: join(fromdir, tofile) except: print ‘Error joining files:‘ print sys.exc_info()[0], sys.exc_info()[1] else: print ‘Join complete: see‘, absto if interactive: raw_input(‘Press Enter key‘) # pause if clicked
希望本文所述对大家的Python程序设计有所帮助,
用VB实现对库文件的分割备份
用VB实现对库文件的分割备份
殷鹏
在设计信息管理程序时,数据库的软盘备份与恢复是我们经常遇到的'一个问题。如果仅仅使用文件复制指令,那么在文件大小超过软盘容量时,就会出现错误。下面我来介绍一种用VB实现的对文件进行分割备份的方法。假设在E:CLASS目录下有一个名为CLASSES.MDB的文件,3.8M,我们现在要按照每个1.4M,把它分割成3个文件进行备份,然后,再恢复成CLASSES1.MDB文件。启动VB,新建一个工程,添加一个模块,将下列代码填入模块的声明中:
Type FileSection
Bytes() As Byte
FileLen As Long
End Type
Type SectionedFile
Files() As FileSection
NumberOfFiles As Long
End Type
Type FileInfo
OrigProjSize As Long
OrigFileName As String
FileCount As Integer
FileStartNum As Long
End Type
然后,在Form1中添加两个按钮,分别命名为cmdBackup,Caption:“备份”;cmdRestore,Caption:“恢复”。
分别双击按钮,填入以下代码:
Private Sub cmdBackup_Click()
Dim SplitFileName As String '待备份的文件名
Dim Split As Long '备份文件的大小
Dim SaveName As String '备份文件名
Dim fNum As Integer '可用的文件号
Dim NumFil As Long '备份文件的数目
Dim FilesLen As Long '待备份文件的大小
Dim CurrentFile As SectionedFile '参数结构
SplitFileName = “e:classclasses.mdb”
Split
FilesLen = FileLen(SplitFileName)
fNum = FreeFile
Open SplitFileName For Binary As fNum '计算备份参数
NumFil = CInt(FilesLen / Split
ReDim CurrentFile.Files(1 To NumFil)
For i = 1 To NumFil
; ReDim CurrentFile.Files(i).Bytes(1 To Split
CurrentFile.Files(i).FileLen = UBound(CurrentFile.Files(i).Bytes)
Next
For i = 1 To NumFil
Get #fNum, , CurrentFile.Files(i).Bytes
Next
ReDim CurrentFile.Files(NumFil).Bytes(1 To FilesLen - ((NumFil - 1) * Split
CurrentFile.NumberOfFiles = NumFil
Get #fNum, , CurrentFile.Files(NumFil).Bytes
CurrentFile.Files(NumFil).FileLen = UBound(CurrentFile.Files(NumFil).Bytes)
Close #fNum
For i = 1 To CurrentFile.NumberOfFiles '分割备份
SaveName = SplitFileName & “.” & Format(BeginningNumber - 1 + i, “00#”)
fNum = FreeFile
Open SaveName For Binary As fNum
Put #fNum, 1, CurrentFile.Files(i)
Close #fNum
Next
Dim FileInfoFile As FileInfo '相关数据写入临时文件
FileInfoFile.FileCount = NumFil
FileInfoFile.OrigFileName = SplitFileName
FileInfoFile.OrigProjSize = FileLen(SplitFileName)
FileInfoFile.FileStartNum = BeginningNumber
SaveName = SplitFileName & “.tpl”
fNum = FreeFile
Open SaveName For Binary As #fNum
Put #fNum, , FileInfoFile
Close #fNum
End Sub
Private Sub cmdRestore_Click()
Dim OutName As String '恢复后文件名
Dim fNum As Integer '可用的文件号
Dim tmpFileName As String '临时文件名
Dim File As SectionedFile '参数结构
Dim FileInfo As FileInfo '临时文件的结构
tmpFileName = “e:classclasses.mdb.tpl”
OutName = “e:classclasses1.mdb”
> fNum = FreeFile
Open tmpFileName For Binary As #fNum '取得相关数据
Get #fNum, , FileInfo
Close #fNum
ReDim File.Files(1 To FileInfo.FileCount) '打开备份文件
For i = 1 To FileInfo.FileCount
OpenName = FileInfo.OrigFileName & “.” & Format((FileInfo.FileStartNum - 1 + i), “00#”)
fNum = FreeFile
Open OpenName For Binary As #fNum
Get #fNum, 1, File.Files(i)
Close #fNum
Next
fNum = FreeFile
Open OutName For Binary As #fNum '恢复
For i = 1 To FileInfo.FileCount
Put #fNum, , File.Files(i).Bytes
Next
Close #fNum
End Sub
运行该例程,点击“备份”按钮,用资源管理器看看E:CLASS目录,可以看到分割后的三个文件:CLASSES.MDB.000、CLASSES.MDB.001、CLASSES.MDB.002,大小分别为:1.33M、1.33M、1.1M,还有一个存放参数的文件:CLASSES.MDB.TPL,大小:1K。点击“恢复”按钮,这些文件又被恢复成了CLASSES1.MDB。
以上程序在PWIN98、VB6环境下运行通过。需要的朋友可以加入拷贝到A盘等语句,这样,一个实用的备份与恢复程序就完成了。
作者:殷鹏
邮编:235000
地址:安徽省淮北市教育巷A栋706号
Email: yinpeng@21cn.com
这篇文章主要介绍了Python中使用不同编码读写txt文件详解,本文给出不同编码下的读写文件代码方法,需要的朋友可以参考下
代码如下:
import os
import codecs
filenames=os.listdir(os.getcwd)
ut=file(“name.txt”,“w”)
for filename in filenames:
out.write(filename.decode(“gb2312”).encode(“utf-8”))
out.close()
将执行文件的当前目录及文件名写入到name.txt文件中,以utf-8格式保存
如果采用ANSI编码保存,用如下代码写入即可:
代码如下:
out.write(filename)
打开文件并写入
引用codecs模块,对该模块目前不了解,在此记录下方法,有空掌握该模块功能及用法。
代码如下:
import codecs
file=codecs.open(“lol.txt”,“w”,“utf-8”)
file.write(u“我”)
file.close()
读取ANSI编码的文本文件和utf-8编码的文件
读取ANSI编码文件
建立一个文件test.txt,文件格式用ANSI,内容为:
代码如下:
abc中文
用python来读取
代码如下:
# coding=gbk
print open(“Test.txt”).read()
结果:abc中文
读取utf-8编码文件(无BOM)
把文件格式改成UTF-8:
代码如下:
结果:abc涓
显然,这里需要解码:
代码如下:
# -*- coding: utf-8 -*-
import codecs
print open(“Test.txt”).read().decode(“utf-8”)
结果:abc中文
读取utf-8编码文件(有BOM)
某些软件在保存一个以UTF-8编码的文件时,默认会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM)。在有些软件可以控制是否插入BOM。如果在有BOM的情况下,在读取时需要自己去掉这些字符,python中的codecs module定义了这个常量:
代码如下:
# -*- coding: utf-8 -*-
import codecs
data = open(“Test.txt”).read()
if data[:3] == codecs.BOM_UTF8:
data = data[3:]
print data.decode(“utf-8”)
结果:abc中文
在看下面的例子:
代码如下:
# -*- coding: utf-8 -*-
data = open(“name_utf8.txt”).read()
u=data.decode(“utf-8”)
print u[1:]
打开utf-8格式的文件并读取utf-8字符串后,解码变成unicode对象,
但是会把附加的三个字符同样进行转换,变成一个unicode字符。该字符不能被打印。所以为了正常显示,采用u[1:]的方式,过滤到第一个字符。
注意:在处理unicode中文字符串的时候,必须首先对它调用encode函数,转换成其它编码输出。
设置python默认编码
代码如下:
import sys
reload(sys)
sys.setdefaultencoding(“utf-8”)
print sys.getdefaultencoding()
今天碰到了 python 编码问题, 报错信息如下
代码如下:
Traceback (most recent call last):
File “ntpath.pyc”, line 108, in join
UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0xa1 in position 36: ordinal not in range(128)
显然是当前的编码为ascii, 无法解析0xa1(十进制为161, 超过上限128). 进入python console后, 发现默认编码确实是 ascii, 验证过程为:
在python2.6中无法调用sys.setdefaultencoding()函数来修改默认编码,因为python在启动的时候会调用site.py文件,在这个文件中设置完默认编码后会删除sys的setdefaultencoding方法。不能再被调用了. 在确定sys已经导入的情况下, 可以reload sys这个模块之后, 再 sys.setdefaultencoding(‘utf8‘)
代码如下:
import sys
reload(sys)
sys.setdefaultencoding(“utf-8”)
print sys.getdefaultencoding()
确实有效, 根据 limodou 讲解, site.py 是 python 解释器启动后, 默认加载的一个脚本. 如果使用 python -S 启动的话, 将不会自动加载 site.py.
上面写的挺嗦的.
==================================
如何永久地将默认编码设置为utf-8呢? 有2种方法:
==================================
第一个方法<不推荐>: 编辑site.py, 修改setencoding()函数, 强制设置为 utf-8不推荐>
第二个方法<推荐>: 增加一个名为 sitecustomize.py, 推荐存放的路径为 site-packages 目录下推荐>
sitecustomize.py 是在 site.py 被import 执行的, 因为 sys.setdefaultencoding() 是在 site.py 的最后删除的, 所以, 可以在 sitecustomize.py 使用 sys.setdefaultencoding().
代码如下:
import sys
sys.setdefaultencoding(‘utf-8‘)
既然 sitecustomize.py 能被自动加载, 所以除了设置编码外, 也可以设置一些其他的东西
字符串的编码
代码如下:
s1=‘中文‘
像上面那样直接输入的字符串是按照代码文件的编码来处理的,如果是unicode编码,有以下三种方式:
代码如下:
1 s1 = u‘中文‘
2 s2 = unicode(‘中文‘,‘gbk‘)
3 s3 = s1.decode(‘gbk‘)
unicode是一个内置函数,第二个参数指示源字符串的编码格式。
decode是任何字符串具有的方法,将字符串转换成unicode格式,参数指示源字符串的编码格式。
encode也是任何字符串具有的方法,将字符串转换成参数指定的格式。
-04-04python模拟登陆阿里妈妈生成商品推广链接
-09-09Python strip lstrip rstrip使用方法
-03-03python 字符串split的用法分享
2013-11-11python二叉树的实现实例
2013-11-11教你安装python Django(图文)
2014-04-04python判断、获取一张图片主色调的2个实例
2014-05-05Python getopt模块处理命令行选项实例
2014-01-01使用scrapy实现爬网站例子和实现网络爬虫(蜘蛛)的步骤
-01-01Python Mysql数据库操作 Perl操作Mysql数据库
2013-11-11linux环境下安装pyramid和新建项目的步骤
python中精确输出JSON浮点数的方法
python中关于日期时间处理的问答集锦
linux系统使用python监测系统负载脚本分享
python用字典统计单词或汉字词个数示例
python调用windows api锁定计算机示例
python教程之用py2exe将PY文件转成EXE文件
python 获取本机ip地址的两个方法
python 测试实现方法
python使用cookielib库示例分享
python中的对象拷贝示例 python引用传递
Python入门教程 超详细1小时学会
python 中文乱码问题深入分析
比较详细Python正则表达式操作指
Python字符串的encode与decode研
Python open读写文件实现脚本
Python enumerate遍历数组示例应
Python 深入理解yield
Python+Django在windows下的开发
python 文件和路径操作函数小结
python 字符串split的用法分享
★ 工作文件
★ 文件管理制度
★ 规范文件
★ 文件范文
★ 文件范本