首页 > 实用文档 > 其他范文

用python分割TXT文件成4K的TXT文件

2022-08-10 09:06:57| 收藏本文下载本文作者：yue了

以下是小编为大家准备的用python分割TXT文件成4K的TXT文件（共含6篇），仅供参考，大家一起来看看吧。同时，但愿您也能像本文投稿人“yue了”一样，积极向本站投稿分享好文章。

篇1：用python分割TXT文件成4K的TXT文件

热点排行

Python入门教程超详细1小时学会

python 中文乱码问题深入分析

比较详细Python正则表达式操作指

Python字符串的encode与decode研

Python open读写文件实现脚本

Python enumerate遍历数组示例应

Python 深入理解yield

Python+Django在windows下的开发

python 文件和路径操作函数小结

python 字符串split的用法分享

篇2：Python实现分割文件及合并文件的方法

作者：Sephiroth 字体：[增加减小] 类型：

这篇文章主要介绍了Python实现分割文件及合并文件的方法,涉及Python针对文件的分割与合并操作相关技巧,通过自定义函数split与join实现了文件的分割与合并操作,需要的朋友可以参考下

本文实例讲述了Python实现分割文件及合并文件的方法，分享给大家供大家参考。具体如下：

分割文件split.py如下：

#!/usr/bin/python########################################################################### split a file into a set of parts; join.py puts them back together;# this is a customizable version of the standard unix split command-line # utility; because it is written in Python, it also works on Windows and# can be easily modified; because it exports a function, its logic can # also be imported and reused in other applications;##########################################################################import sys, skilobytes = 1024megabytes = kilobytes * 1000chunksize = int(1.4 * megabytes) # default: roughly a floppydef split(fromfile, todir, chunksize=chunksize): if not os.path.exists(todir): # caller handles errors os.mkdir(todir) # make dir, read/write parts else: for fname in os.listdir(todir): # delete any existing files os.remove(os.path.join(todir, fname)) partnum = 0 input = open(fromfile, ‘rb‘) # use binary mode on Windows while 1: # eof=empty string from read chunk = input.read(chunksize) # get next part <= chunksize if not chunk: break partnum = partnum+1 filename = os.path.join(todir, (‘part%04d‘ % partnum)) fileobj = open(filename, ‘wb‘) fileobj.write(chunk) fileobj.close # or simply open().write() input.close() assert partnum <= 9999 # join sort fails if 5 digits return partnumif __name__ == ‘__main__‘: if len(sys.argv) == 2 and sys.argv[1] == ‘-help‘: print ‘Use: split.py [file-to-split target-dir [chunksize]]‘ else: if len(sys.argv) < 3: interactive = 1 fromfile = raw_input(‘File to be split? ‘) # input if clicked todir = raw_input(‘Directory to store part files? ‘) else: interactive = 0 fromfile, todir = sys.argv[1:3] # args in cmdline if len(sys.argv) == 4: chunksize = int(sys.argv[3]) absfrom, absto = map(os.path.abspath, [fromfile, todir]) print ‘Splitting‘, absfrom, ‘to‘, absto, ‘by‘, chunksize try: parts = split(fromfile, todir, chunksize) except: print ‘Error during split:‘ print sys.exc_info()[0], sys.exc_info()[1] else: print ‘Split finished:‘, parts, ‘parts are in‘, absto if interactive: raw_input(‘Press Enter key‘) # pause if clicked

合并文件join_file.py如下：

#!/usr/bin/python########################################################################### join all part files in a dir created by split.py, to recreate file. # This is roughly like a ‘cat fromdir/* > tofile‘ command on unix, but is # more portable and configurable, and exports the join operation as a # reusable function. Relies on sort order of file names: must be same # length. Could extend split/join to popup Tkinter file selectors.##########################################################################import os, sysreadsize = 1024def join(fromdir, tofile): utput = open(tofile, ‘wb‘) parts = os.listdir(fromdir) parts.sort() for filename in parts: filepath = os.path.join(fromdir, filename) fileobj = open(filepath, ‘rb‘) while 1: filebytes = fileobj.read(readsize) if not filebytes: break output.write(filebytes) fileobj.close() output.close()if __name__ == ‘__main__‘: if len(sys.argv) == 2 and sys.argv[1] == ‘-help‘: print ‘Use: join.py [from-dir-name to-file-name]‘ else: if len(sys.argv) != 3: interactive = 1 fromdir = raw_input(‘Directory containing part files? ‘) tofile = raw_input(‘Name of file to be recreated? ‘) else: interactive = 0 fromdir, tofile = sys.argv[1:] absfrom, absto = map(os.path.abspath, [fromdir, tofile]) print ‘Joining‘, absfrom, ‘to make‘, absto try: join(fromdir, tofile) except: print ‘Error joining files:‘ print sys.exc_info()[0], sys.exc_info()[1] else: print ‘Join complete: see‘, absto if interactive: raw_input(‘Press Enter key‘) # pause if clicked

希望本文所述对大家的Python程序设计有所帮助，

篇3：用VB实现对库文件的分割备份

用VB实现对库文件的分割备份

殷鹏

在设计信息管理程序时，数据库的软盘备份与恢复是我们经常遇到的'一个问题。如果仅仅使用文件复制指令，那么在文件大小超过软盘容量时，就会出现错误。下面我来介绍一种用VB实现的对文件进行分割备份的方法。假设在E:CLASS目录下有一个名为CLASSES.MDB的文件，3.8M，我们现在要按照每个1.4M，把它分割成3个文件进行备份，然后，再恢复成CLASSES1.MDB文件。启动VB,新建一个工程，添加一个模块，将下列代码填入模块的声明中：

Type FileSection

Bytes() As Byte

FileLen As Long

End Type

Type SectionedFile

Files() As FileSection

NumberOfFiles As Long

End Type

Type FileInfo

OrigProjSize As Long

OrigFileName As String

FileCount As Integer

FileStartNum As Long

End Type

然后，在Form1中添加两个按钮，分别命名为cmdBackup,Caption:“备份”；cmdRestore，Caption:“恢复”。

分别双击按钮，填入以下代码：

Private Sub cmdBackup_Click()

Dim SplitFileName As String '待备份的文件名

Dim Split As Long '备份文件的大小

Dim SaveName As String '备份文件名

Dim fNum As Integer '可用的文件号

Dim NumFil As Long '备份文件的数目

Dim FilesLen As Long '待备份文件的大小

Dim CurrentFile As SectionedFile '参数结构

SplitFileName = “e:classclasses.mdb”

Split = 1400000

FilesLen = FileLen(SplitFileName)

fNum = FreeFile

Open SplitFileName For Binary As fNum '计算备份参数

NumFil = CInt(FilesLen /

Split)

ReDim CurrentFile.Files(1 To NumFil)

For i = 1 To NumFil

; ReDim CurrentFile.Files(i).Bytes(1 To

Split)

CurrentFile.Files(i).FileLen = UBound(CurrentFile.Files(i).Bytes)

For i = 1 To NumFil

Get #fNum, , CurrentFile.Files(i).Bytes

ReDim CurrentFile.Files(NumFil).Bytes(1 To FilesLen - ((NumFil - 1) *

Split))

CurrentFile.NumberOfFiles = NumFil

Get #fNum, , CurrentFile.Files(NumFil).Bytes

CurrentFile.Files(NumFil).FileLen = UBound(CurrentFile.Files(NumFil).Bytes)

Close #fNum

For i = 1 To CurrentFile.NumberOfFiles '分割备份

SaveName = SplitFileName & “.” & Format(BeginningNumber - 1 + i, “00#”)

fNum = FreeFile

Open SaveName For Binary As fNum

Put #fNum, 1, CurrentFile.Files(i)

Close #fNum

Dim FileInfoFile As FileInfo '相关数据写入临时文件

FileInfoFile.FileCount = NumFil

FileInfoFile.OrigFileName = SplitFileName

FileInfoFile.OrigProjSize = FileLen(SplitFileName)

FileInfoFile.FileStartNum = BeginningNumber

SaveName = SplitFileName & “.tpl”

fNum = FreeFile

Open SaveName For Binary As #fNum

Put #fNum, , FileInfoFile

Close #fNum

End Sub

Private Sub cmdRestore_Click()

Dim OutName As String '恢复后文件名

Dim fNum As Integer '可用的文件号

Dim tmpFileName As String '临时文件名

Dim File As SectionedFile '参数结构

Dim FileInfo As FileInfo '临时文件的结构

tmpFileName = “e:classclasses.mdb.tpl”

OutName = “e:classclasses1.mdb”

> fNum = FreeFile

Open tmpFileName For Binary As #fNum '取得相关数据

Get #fNum, , FileInfo

Close #fNum

ReDim File.Files(1 To FileInfo.FileCount) '打开备份文件

For i = 1 To FileInfo.FileCount

OpenName = FileInfo.OrigFileName & “.” & Format((FileInfo.FileStartNum - 1 + i), “00#”)

fNum = FreeFile

Open OpenName For Binary As #fNum

Get #fNum, 1, File.Files(i)

Close #fNum

fNum = FreeFile

Open OutName For Binary As #fNum '恢复

For i = 1 To FileInfo.FileCount

Put #fNum, , File.Files(i).Bytes

Close #fNum

End Sub

运行该例程，点击“备份”按钮，用资源管理器看看E:CLASS目录，可以看到分割后的三个文件：CLASSES.MDB.000、CLASSES.MDB.001、CLASSES.MDB.002，大小分别为：1.33M、1.33M、1.1M，还有一个存放参数的文件：CLASSES.MDB.TPL，大小：1K。点击“恢复”按钮，这些文件又被恢复成了CLASSES1.MDB。

以上程序在PWIN98、VB6环境下运行通过。需要的朋友可以加入拷贝到A盘等语句，这样，一个实用的备份与恢复程序就完成了。

作者：殷鹏

邮编：235000

地址：安徽省淮北市教育巷A栋706号

Email: yinpeng@21cn.com

篇4：Python中使用不同编码读写txt文件详解

这篇文章主要介绍了Python中使用不同编码读写txt文件详解,本文给出不同编码下的读写文件代码方法,需要的朋友可以参考下

代码如下:

import os

import codecs

filenames=os.listdir(os.getcwd)

ut=file(“name.txt”,“w”)

for filename in filenames:

out.write(filename.decode(“gb2312”).encode(“utf-8”))

out.close()

将执行文件的当前目录及文件名写入到name.txt文件中，以utf-8格式保存

如果采用ANSI编码保存，用如下代码写入即可：

代码如下:

out.write(filename)

打开文件并写入

引用codecs模块，对该模块目前不了解，在此记录下方法，有空掌握该模块功能及用法。

代码如下:

import codecs

file=codecs.open(“lol.txt”,“w”,“utf-8”)

file.write(u“我”)

file.close()

读取ANSI编码的文本文件和utf-8编码的文件

读取ANSI编码文件

建立一个文件test.txt，文件格式用ANSI，内容为:

代码如下:

abc中文

用python来读取

代码如下:

# coding=gbk

print open(“Test.txt”).read()

结果：abc中文

读取utf-8编码文件（无BOM）

把文件格式改成UTF-8：

代码如下:

结果：abc涓

显然，这里需要解码：

代码如下:

# -*- coding: utf-8 -*-

import codecs

print open(“Test.txt”).read().decode(“utf-8”)

结果：abc中文

读取utf-8编码文件（有BOM）

某些软件在保存一个以UTF-8编码的文件时，默认会在文件开始的地方插入三个不可见的字符（0xEF 0xBB 0xBF，即BOM）。在有些软件可以控制是否插入BOM。如果在有BOM的情况下，在读取时需要自己去掉这些字符，python中的codecs module定义了这个常量：

代码如下:

# -*- coding: utf-8 -*-

import codecs

data = open(“Test.txt”).read()

if data[:3] == codecs.BOM_UTF8:

data = data[3:]

print data.decode(“utf-8”)

结果：abc中文

在看下面的例子：

代码如下:

# -*- coding: utf-8 -*-

data = open(“name_utf8.txt”).read()

u=data.decode(“utf-8”)

print u[1:]

打开utf-8格式的文件并读取utf-8字符串后，解码变成unicode对象，

但是会把附加的三个字符同样进行转换，变成一个unicode字符。该字符不能被打印。所以为了正常显示，采用u[1:]的方式，过滤到第一个字符。

注意：在处理unicode中文字符串的时候，必须首先对它调用encode函数，转换成其它编码输出。

设置python默认编码

代码如下:

import sys

reload(sys)

sys.setdefaultencoding(“utf-8”)

print sys.getdefaultencoding()

今天碰到了 python 编码问题, 报错信息如下

代码如下:

Traceback (most recent call last):

File “ntpath.pyc”, line 108, in join

UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 0xa1 in position 36: ordinal not in range(128)

显然是当前的编码为ascii, 无法解析0xa1(十进制为161, 超过上限128). 进入python console后, 发现默认编码确实是 ascii, 验证过程为:

在python2.6中无法调用sys.setdefaultencoding()函数来修改默认编码，因为python在启动的时候会调用site.py文件，在这个文件中设置完默认编码后会删除sys的setdefaultencoding方法。不能再被调用了. 在确定sys已经导入的情况下, 可以reload sys这个模块之后, 再 sys.setdefaultencoding(‘utf8‘)

代码如下:

import sys

reload(sys)

sys.setdefaultencoding(“utf-8”)

print sys.getdefaultencoding()

确实有效, 根据 limodou 讲解, site.py 是 python 解释器启动后, 默认加载的一个脚本. 如果使用 python -S 启动的话, 将不会自动加载 site.py.

上面写的挺嗦的.

==================================

如何永久地将默认编码设置为utf-8呢? 有2种方法:

==================================

第一个方法<不推荐>: 编辑site.py, 修改setencoding()函数, 强制设置为 utf-8

第二个方法<推荐>: 增加一个名为 sitecustomize.py, 推荐存放的路径为 site-packages 目录下

sitecustomize.py 是在 site.py 被import 执行的, 因为 sys.setdefaultencoding() 是在 site.py 的最后删除的, 所以, 可以在 sitecustomize.py 使用 sys.setdefaultencoding().

代码如下:

import sys

sys.setdefaultencoding(‘utf-8‘)

既然 sitecustomize.py 能被自动加载, 所以除了设置编码外, 也可以设置一些其他的东西

字符串的编码

代码如下:

s1=‘中文‘

像上面那样直接输入的字符串是按照代码文件的编码来处理的，如果是unicode编码，有以下三种方式：

代码如下:

1 s1 = u‘中文‘

2 s2 = unicode(‘中文‘,‘gbk‘)

3 s3 = s1.decode(‘gbk‘)

unicode是一个内置函数，第二个参数指示源字符串的编码格式。

decode是任何字符串具有的方法，将字符串转换成unicode格式，参数指示源字符串的编码格式。

encode也是任何字符串具有的方法，将字符串转换成参数指定的格式。

篇5：用python实现的可以拷贝或剪切一个文件列表中的所有文件

-04-04python模拟登陆阿里妈妈生成商品推广链接

-09-09Python strip lstrip rstrip使用方法

-03-03python 字符串split的用法分享

2013-11-11python二叉树的实现实例

2013-11-11教你安装python Django（图文）

2014-04-04python判断、获取一张图片主色调的2个实例

2014-05-05Python getopt模块处理命令行选项实例

2014-01-01使用scrapy实现爬网站例子和实现网络爬虫(蜘蛛)的步骤

-01-01Python Mysql数据库操作 Perl操作Mysql数据库

2013-11-11linux环境下安装pyramid和新建项目的步骤

篇6：用python实现的可以拷贝或剪切一个文件列表中的所有文件

热点排行

Python入门教程超详细1小时学会

python 中文乱码问题深入分析

比较详细Python正则表达式操作指

Python字符串的encode与decode研

Python open读写文件实现脚本

Python enumerate遍历数组示例应

Python 深入理解yield

Python+Django在windows下的开发

python 文件和路径操作函数小结

python 字符串split的用法分享

★ RC4文件加密的python实现方法

★ 工作文件

★ 文件管理制度

★ 规范文件

★ 文件范文

★ 文件范本

★ 用WinZip帮你打印文件列表

★ psd文件用什么打开_psd知识

★ 一秒钟完成文件搜索用Everything

★ Python文件读取的3种方法及路径转义

用python分割TXT文件成4K的TXT文件（合集6篇）

欢迎下载DOC格式的用python分割TXT文件成4K的TXT文件，但愿能给您带来参考作用！

推荐度：

点击下载文档文档为doc格式

猜你喜欢

NEW

用python分割TXT文件成4K的TXT文件

篇1：用python分割TXT文件成4K的TXT文件

最近更新

热点排行

篇2：Python实现分割文件及合并文件的方法

篇3：用VB实现对库文件的分割备份

篇4：Python中使用不同编码读写txt文件详解

篇5：用python实现的可以拷贝或剪切一个文件列表中的所有文件

篇6：用python实现的可以拷贝或剪切一个文件列表中的所有文件

最近更新

热点排行

用python分割TXT文件成4K的TXT文件（合集6篇）

相关文章

热门推荐

猜你喜欢

用python分割TXT文件成4K的TXT文件

篇1：用python分割TXT文件成4K的TXT文件

最近更 新

热 点 排 行

篇2：Python实现分割文件及合并文件的方法

篇3：用VB实现对库文件的分割备份

篇4：Python中使用不同编码读写txt文件详解

篇5：用python实现的可以拷贝或剪切一个文件列表中的所有文件

篇6：用python实现的可以拷贝或剪切一个文件列表中的所有文件

最近更 新

热 点 排 行

用python分割TXT文件成4K的TXT文件（合集6篇）

相关文章

热门推荐

猜你喜欢

最近更新

热点排行

最近更新

热点排行