【转】python⽂件读写——withopen语句
读写⽂件是最常见的IO操作。Python内置了读写⽂件的函数,⽤法和C是兼容的。
读写⽂件前,我们先必须了解⼀下,在磁盘上读写⽂件的功能都是由操作系统提供的,现代操作系统不允许普通的程序直接操作磁盘,所以,读写⽂件就是请求操作系统打开⼀个⽂件对象(通常称为⽂件描述符),然后,通过操作系统提供的接⼝从这个⽂件对象中读取数据(读⽂件),或者把数据写⼊这个⽂件对象(写⽂件)。
读⽂件
要以读⽂件的模式打开⼀个⽂件对象,使⽤Python内置的open()函数,传⼊⽂件名和标⽰符:
>>> f = open('/Users/', 'r')
标⽰符'r'表⽰读,这样,我们就成功地打开了⼀个⽂件。
如果⽂件不存在,open()函数就会抛出⼀个IOError的错误,并且给出错误码和详细的信息告诉你⽂件不存在:
>>> f=open('/Users/', 'r')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
FileNotFoundError: [Errno 2] No such file or directory: '/Users/'
如果⽂件打开成功,接下来,调⽤read()⽅法可以⼀次读取⽂件的全部内容,Python把内容读到内存,⽤⼀个str对象表⽰:
>>> f.read()
'Hello, world!'
最后⼀步是调⽤close()⽅法关闭⽂件。⽂件使⽤完毕后必须关闭,因为⽂件对象会占⽤操作系统的资源,并且操作系统同⼀时间能打开的⽂件数量也是有限的:
>>> f.close()
由于⽂件读写时都有可能产⽣IOError,⼀旦出错,后⾯的f.close()就不会调⽤。所以,为了保证⽆论是否出错都能正确地关闭⽂件,我们可以使⽤try ... finally来实现:
try:
f = open('/path/to/file', 'r')
ad())
finally:
if f:
f.close()
但是每次都这么写实在太繁琐,所以,Python引⼊了with语句来⾃动帮我们调⽤close()⽅法:
with open('/path/to/file', 'r') as f:
ad())
这和前⾯的try ... finally是⼀样的,但是代码更佳简洁,并且不必调⽤f.close()⽅法。
调⽤read()会⼀次性读取⽂件的全部内容,如果⽂件有10G,内存就爆了,所以,要保险起见,可以反
复调⽤read(size)⽅法,每次最多读取size个字节的内容。另外,调⽤readline()可以每次读取⼀⾏内容,调⽤readlines()⼀次读取所有内容并按⾏返回list。因此,要根据需要决定怎么调⽤。
如果⽂件很⼩,read()⼀次性读取最⽅便;如果不能确定⽂件⼤⼩,反复调⽤read(size)⽐较保险;如果是配置⽂件,调⽤readlines()最⽅便:
python怎么读的for line adlines():
print(line.strip()) # 把末尾的'\n'删掉
写⽂件
写⽂件和读⽂件是⼀样的,唯⼀区别是调⽤open()函数时,传⼊标识符'w'或者'wb'表⽰写⽂本⽂件或写⼆进制⽂件:
>>> f = open('/Users/', 'w')
>>> f.write('Hello, world!')
>>> f.close()
你可以反复调⽤write()来写⼊⽂件,但是务必要调⽤f.close()来关闭⽂件。当我们写⽂件时,操作系统往往不会⽴刻把数据写⼊磁盘,⽽是放到内存缓存起来,空闲的时候再慢慢写⼊。只有调⽤close()⽅法时,操作系统才保证把没有写⼊的数据全部写⼊磁盘。忘记调⽤close()的后果是数据可能只写了⼀部分到磁盘,剩下的丢失了。所以,还是⽤with语句来得保险:
with open('/Users/', 'w') as f:
f.write('Hello, world!')
要写⼊特定编码的⽂本⽂件,请给open()函数传⼊encoding参数,将字符串⾃动转换成指定编码
字符编码
要读取⾮UTF-8编码的⽂本⽂件,需要给open()函数传⼊encoding参数,例如,读取GBK编码的⽂件:
>>> f = open('/Users/', 'r', encoding='gbk')
>>> f.read()
'测试'
遇到有些编码不规范的⽂件,你可能会遇到UnicodeDecodeError,因为在⽂本⽂件中可能夹杂了⼀些⾮法编码的字符。遇到这种情况,open()函数还接收⼀个errors参数,表⽰如果遇到编码错误后如何处理。最简单的⽅式是直接忽略:
>>> f = open('/Users/', 'r', encoding='gbk', errors='ignore')
⼆进制⽂件
前⾯讲的默认都是读取⽂本⽂件,并且是UTF-8编码的⽂本⽂件。要读取⼆进制⽂件,⽐如图⽚、视频等等,⽤'rb'模式打开⽂件即可:
>>> f = open('/Users/michael/test.jpg', 'rb')
>>> f.read()
b'\xff\xd8\xff\xe1\x00\x18Exif\' # ⼗六进制表⽰的字节
总结:以后读写⽂件都使⽤with open语句,不要再像以前那样⽤f = open()这种语句了
对于多个⽂件的读写,可以写成以下两种⽅式:
with open('/home/xbwang/Desktop/','r') as f:
with open('/home/xbwang/Desktop/','r') as f1:
with open('/home/xbwang/Desktop/output_','r') as f2:
........
........
........
with open('/home/xbwang/Desktop/','r') as f:
........
with open('/home/xbwang/Desktop/','r') as f1:
........
with open('/home/xbwang/Desktop/output_','r') as f2:
.
.......
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论