Python3中打开⽂件的⽅式(Withopen)
⽂章⽬录
0.背景知识 & IO操作的类型
python⽂件读写⽂件是最常见的IO操作。Python内置了读写⽂件的函数,⽤法和C是兼容的。
读写⽂件前,我们先必须了解⼀下,在磁盘上读写⽂件的功能都是由操作系统提供的,现代操作系统不允许普通的程序直接操作磁盘。
读写⽂件就是请求操作系统打开⼀个⽂件对象(通常称为⽂件描述符),然后,通过操作系统提供的接⼝从这个⽂件对象中读取数据(读⽂件),或者把数据写⼊这个⽂件对象(写⽂件)
常见的IO操作的类型如下:
type info
r以只读⽅式打开⽂件。⽂件的指针将会放在⽂件的开头。这是默认模式。
w打开⼀个⽂件只⽤于写⼊。如果该⽂件已存在则将其覆盖。如果该⽂件不存在,创建新⽂件。
a 打开⼀个⽂件⽤于追加。如果该⽂件已存在,⽂件指针将会放在⽂件的结尾。也就是说,新的内容将会被写⼊到已有内容之后。如果该⽂件不存在,创建新⽂件进⾏写⼊。
rb以⼆进制格式打开⼀个⽂件⽤于只读。⽂件指针将会放在⽂件的开头。这是默认模式。
wb以⼆进制格式打开⼀个⽂件只⽤于写⼊。如果该⽂件已存在则将其覆盖。如果该⽂件不存在,创建新⽂件。
ab 以⼆进制格式打开⼀个⽂件⽤于追加。如果该⽂件已存在,⽂件指针将会放在⽂件的结尾。也就是说,新的内容将会被写⼊到已有内容之后。如果该⽂件不存在,创建新⽂件进⾏写⼊。
r+打开⼀个⽂件⽤于读写。⽂件指针将会放在⽂件的开头。
w+打开⼀个⽂件⽤于读写。如果该⽂件已存在则将其覆盖。如果该⽂件不存在,创建新⽂件。
a+打开⼀个⽂件⽤于读写。如果该⽂件已存在,⽂件指针将会放在⽂件的结尾。⽂件打开时会是追加模式。如果该⽂件不存在,创建新⽂件⽤于读写。
rb+以⼆进制格式打开⼀个⽂件⽤于读写。⽂件指针将会放在⽂件的开头。
wb+以⼆进制格式打开⼀个⽂件⽤于读写。如果该⽂件已存在则将其覆盖。如果该⽂件不存在,创建新⽂件。
ab+以⼆进制格式打开⼀个⽂件⽤于追加。如果该⽂件已存在,⽂件指针将会放在⽂件的结尾。如果该⽂件不存在,创建新⽂件⽤于读写。
1.常规⽅式:读取⽂件-----open()
step1: 打开
f =open('/Users/','r')
r 表⽰读取⽂件,我们就成功地打开了⼀个⽂件
但是, 如果⽂件不存在,open()函数就会抛出⼀个IOError的错误,并且给出错误码和详细的信息告诉你⽂件不存在,错误情况如下:
f=open('/Users/','r')
Traceback (most recent call last):
File "<stdin>", line 1,in<module>
FileNotFoundError:[Errno 2] No such file or directory:'/Users/'
step2: 读取
如果⽂件打开成功,接下来,调⽤read()⽅法可以⼀次读取⽂件的全部内容,Python把内容读到内存,⽤⼀个str对象表⽰:
'Hello, world!'
python怎么读取桌面上的文件step3: 关闭
最后⼀步是调⽤close()⽅法关闭⽂件。⽂件使⽤完毕后必须关闭,因为⽂件对象会占⽤操作系统的资源,并且操作系统同⼀时间能打开的⽂件数量也是有限的:
f.close()
由于⽂件读写时都有可能产⽣IOError,⼀旦出错,后⾯的f.close()就不会调⽤。所以,为了保证⽆论
是否出错都能正确地关闭⽂件,我们可以使⽤try … finally来实现:
最终⽅案:
try:
f =open('/path/to/file','r')
ad())
finally:
if f:
f.close()
2.推荐⽅式:读取⽂件-----With Open
1).读取⽅式
每次如果都按照如上最终⽅案去写的话,实在太繁琐。Python引⼊了with语句来⾃动帮我们调⽤close()⽅法
重点:with 的作⽤就是⾃动调⽤close()⽅法
with open('/path/to/file','r')as f:
print( f.read())
# 这和前⾯的try ... finally是⼀样的,但是代码更佳简洁,并且不必调⽤f.close()⽅法
如果遇到超⼤⽂件,需要注意:
调⽤read()会⼀次性读取⽂件的全部内容,如果⽂件有10G,内存就爆了。
要保险起见,可以反复调⽤read(size)⽅法,每次最多读取size个字节的内容。例如,read(1024) 每次读取1024个字节的数据内容
调⽤readline()可以每次读取⼀⾏内容,调⽤readlines()⼀次读取所有内容并按⾏返回list。因此,要根据需要决定怎么调⽤。
如果⽂件很⼩,read()⼀次性读取最⽅便;如果不能确定⽂件⼤⼩,反复调⽤read(size)⽐较保险;如果是配置⽂件,调⽤readlines()最⽅便:
for line adlines():
print( line.strip())
# 读取⽂件之后,⽂字末尾会出现'\n'
# strip() 函数中可以把⽬标内容line⾥⾯所有的空格,空⾏等都删除掉,只剩余⽂字内容
2).常见的坑
读取静态⽂件的函数,最好不要写相对路径
(1)如上图,Fold001⽂件夹下⾯有个read_file.py⽂件,这个⽂件读取⽂件,代码如上图,这样可以正常引⽤
(2)但如果引⽤静态⽂件的函数,被其他函数再次调⽤的时候。 例如被Fold002⾥⾯的函数read.py调⽤,那么readfile()函数相当于是在read.py所在⽬录执⾏的,那么静态⽂件相对于read.py的路径,就不是上图的路径了,否者会运⾏会报错,如下
3).跳过第⼀⾏内容(字段名)
with open(file_path,'r', encoding='utf-8-sig')as f:
next(f)# 最终读取到的内容,直接跳过第⼀⾏了
all_line_list = f.readlines()
3.写⼊内容----open()函数
写⽂件和读⽂件是⼀样的,唯⼀区别是调⽤open()函数时,传⼊标识符’w’或者’wb’表⽰写⽂本⽂件或写⼆进制⽂件:
f =open('/Users/','w')
f.write('Hello, world!')
f.close()
open函数使⽤注意地⽅:
你可以反复调⽤write()来写⼊⽂件,但是务必要调⽤f.close()来关闭⽂件。
当我们写⽂件时,操作系统往往不会⽴刻把数据写⼊磁盘,⽽是放到内存缓存起来,空闲的时候再慢慢写⼊。
只有调⽤close()⽅法时,操作系统才保证把没有写⼊的数据全部写⼊磁盘。忘记调⽤close()的后果是数据可能只写了⼀部分到磁盘,剩下的丢失了。所以,还是⽤with语句来得保险
4.写⼊内容----- With Open函数
with open('/Users/','w')as f:
f.write('Hello, world!')
要写⼊特定编码的⽂本⽂件,请给open()函数传⼊encoding参数,将字符串⾃动转换成指定编码字符编码
5.打开⾮utf-8编码的⽂件
要读取⾮UTF-8编码的⽂本⽂件,需要给open()函数传⼊encoding参数,例如,读取GBK编码的⽂件:
with open('/Users/','r', encoding='gbk')as f:
遇到有些编码不规范的⽂件,你可能会遇到UnicodeDecodeError,因为在⽂本⽂件中可能夹杂了⼀些⾮法编码的字符。
open()函数还接收⼀个errors参数,errors=‘ignore’ 表⽰遇到编码错误的时候直接忽略
with open('/Users/','r', encoding='gbk',errors='ignore')as f:
6.打开⼆进制⽂件
前⾯讲的默认都是读取⽂本⽂件,并且是UTF-8编码的⽂本⽂件。要读取⼆进制⽂件,⽐如图⽚、视频等等,⽤’rb’模式打开⽂件即可:
with open('/Users/michael/test.jpg','rb')as f:
# b'\xff\xd8\xff\xe1\x00\x18Exif\' ⼗六进制表⽰的字节
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论