#20 Python文件
前面几节枯燥的模块终于结束了,想要完全掌握前几节的模块需要不断的练习才行,毕竟眼过千遍不如手过一遍嘛。在一些项目需求里,要对文件进行IO操作,毕竟重要数据不可能打印到屏幕上而不去保存,Python对的文件IO操作并不是很复杂,相信你很快就能掌握它!
文件IO操作
对于一个文件的操作,无非不过创建、删除、读、写,创建和删除在OS模块里面已经说过,那只剩下读和写了,也就是IO(Input,Output)操作了。
接下来,将以徐志摩的《再别康桥》为例子,深入解读Python中文件IO操作
轻轻的我走了,
正如我轻轻的来;
我轻轻的招手,
作别西天的云彩。
那河畔的金柳, 是夕阳中的新娘; 波光里的艳影, 在我的心头荡漾。 软泥上的青荇,
油油的在水底招摇;
在康河的柔波里,
我甘心做一条水草!
那榆荫下的一潭, 不是清泉,是天上虹; 揉碎在浮藻间, 沉淀着彩虹似的梦。 寻梦?撑一支长篙,
向青草更青处漫溯⑷;
满载一船星辉,
在星辉斑斓里放歌。
但我不能放歌, 悄悄是别离的笙箫; 夏虫也为我沉默, 沉默是今晚的康桥! 悄悄的我走了,
正如我悄悄的来;
我挥一挥衣袖,
不带走一片云彩。
打开文件
Python获得文件句柄的方式与c及其类似,使用内置函数open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None) 「file表示文件名、mode表示打开方式(默认为读)、buffering表示寄存区缓冲大小(负值为系统默认,0为没有寄存区缓存,1为文件会寄存行,大于1的整数为寄存区缓存大小)、encoding表示文件编码、newline表示换行符(默认为)」
1 | f = open('再别康桥.txt') # 以默认读的方式打开再别康桥,注意:文件路径(此时程序和再别康桥在同一路径) |
对于不同的文件,有不同的处理方式,常用的mode参数如下:
1 | 模式 描述 |
这些模式看似复杂,其实内部规律很清晰,接下来将用文件的读和写来充分了解这些模式
文件的读
read() 「读取文件指针之后的所有内容,并返回字符串」
这里提到了一个新概念:文件指针,想象一下,你在读书,你的手指头指着你正在读的地方,你没读一个字,你的手指头就跟着向后动一下,你的手指头就是文件指针,以上模式中,除了a、a+、ab+文件指针在文件末尾之外,其他的都是在文件开头
1 | In [2]: f = open('再别康桥.txt') # 默认读的方式打开文件 |
1 | In [9]: f = open('再别康桥.txt', 'w') # 以写的模式打开文件,此时这个文件的内容已经被删除了😰 |
1 | In [1]: f = open('test.jpg', 'rb') # 以二进制方式打开文件 |
readline() 「读一行」 1
2
3
4
5
6
7
8
9
10
11
12
13In [1]: f = open('再别康桥.txt')
In [2]: f.readline() # 读一行
Out[2]: '轻轻的我走了,\n'
In [3]: f.readline() # 再读一行
Out[3]: '正如我轻轻的来;\n'
In [4]: f.readline()
Out[4]: '我轻轻的招手,\n'
In [5]: f.readline()
Out[5]: '作别西天的云彩。\n'
readlines() 「按行读取文件,将所有的行保存为一个列表」
1 | In [6]: f = open('再别康桥.txt') |
文件迭代 「open函数打开一个文件后,这个句柄本身是可迭代对象」 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17In [8]: f = open('再别康桥.txt')
In [9]: for line in f: # 直接迭代文件
...: print(line)
...:
轻轻的我走了,
正如我轻轻的来;
我轻轻的招手,
作别西天的云彩。
----
那河畔的金柳,
(将后面的输出省略了)
文件的写
write(text) 「text表示要写入文件的内容,并返回写入的字符数」 1
2
3
4
5
6
7In [13]: f = open('new_file.txt', 'w') # 以写的方式打开文件,如果文件不存在则创建,如果存在则删除原有内容
In [14]: f.write('hello') # 写入hello
Out[14]: 5
In [15]: f.write('word\n') # 写入word并换行
Out[15]: 5
注意:如果这时候去查看文件内容,发现里面还是空荡荡的,为什么呢?因为寄存区缓存的原因,默认是使用系统的寄存区缓存机制,想要立刻写入文件可以改变buffering的值,也可以使用close()方法关闭文件(关闭文件时所有内容都会写入文件)、再或者使用flush()方法立即将寄存区内容写入文件
1 | In [23]: f.flush() # 使用flush()方法立即刷入 |
1 | In [25]: f = open('new_file.txt', 'a') # 以追加模式打开,如果文件存在则打开文件,如果不存在则新建文件 |
1 | In [31]: f = open('new_file.txt', 'a') |
1 | In [33]: f = open('new_file.txt', 'a+') # 使用追加读的方式打开文件 |
writelines(lines) 「将一个列表或元组序列写入文件,需要换行自己加」
1 | In [39]: f = open('new_file.txt', 'w') |
关闭文件
close() 「关闭文件,如果将寄存区有缓存则写入文件」 1
In [48]: f.close()
文件其他方法
tell() 「返回当前文件指针位置」
seek(offset, whence=0) 「offset代表要设置的文件指针位置」
name 「返回当前文件名」