这一小节的内容主要是python的文件操作函数和相关内容。
文件:就是把一些数据存放起来,可以让程序下一次执行的时候直接使用而不必重新制作一份。
> 文件类型:
文本文件:以文字存储为主,读写均以“字符”为单位。
二进制文件:以图形、声音、影像为存储内容的形式,读写均以”字节“为单位。
文件后缀:
文本类型:txt、py、doc、docx、pdf、csv、xls、xml、html……
二进制类型:jpg、png、MP3、wav、mp4、mov、avi……
后缀名主要是为了帮助操作系统识别文件类型,以选择合适的打开方式6
打开文件
open(文件名,访问模式)
f = open('test.txt', 'w')
关闭文件
f = open('test.txt', 'w') #打开文件,w模式(写模式) f.close() # 关闭这个文件
相对路径和绝对路径
绝对路径:从盘符开始的路径
相对路径:相对当前源码所在的路径
绝对路径中为了不让\产生转义效果,需要在路径前面添加字母 r否则需要在将每个\进行转义,写为\
f = open(r"D:\helloworld\python_workspace\demo3\test.txt","w") f.write("hello world") f.close()
中文编码问题
f = open(r"D:\helloworld\python_workspace\demo3\test.txt","w") f.write("你好,世界") f.close() f = open("test.txt","w",encoding="UTF-8") #可以通过encoding指定写入中文的字符集 f.write("你好,世界") f.close()
写数据(write)
f = open('test.txt', 'w') f.write('hello world, i am here!') f.close()
注意: 如果文件不存在那么创建;如果存在那么就先清空,然后写入数据
写数据(writelines)
f = open("test.txt","w",encoding="UTF-8") #写法一: f.write("十年生死两茫茫\n不思量\n自难忘\n千里孤坟\n无处话凄凉\n") #通过换行符实现输出多行效果 #写法二: content = ["十年生死两茫茫\n","不思量\n","自难忘\n","千里孤坟\n"."无处话凄凉\n"] f.writelines(content) #通过writelines一次性写出列表的每个元素 #写法三: content = ["十年生死两茫茫","不思量","自难忘","千里孤坟","无处话凄凉"] f.write("\n".join(content)) #使用字符串的join函数,为每个元素添加换行 符 f.close()
读数据(read)
使用read(num)可以从文件中读取数据,num表示要从文件中读取的数据的长度(单位是字符),如果没有传入num,那么就表示读取文件中所有的数据
#准备好需要读取的数据文件 f = open("test2.txt","w",encoding="UTF-8") f.write("十年生死两茫茫。不思量,自难忘") f.close() #----------------------------------------------------------- f = open("test2.txt","r",encoding="UTF-8") #data = f.read() #没有指定读取的字符数,表示读取文件中所有的数据 #print(data) data = f.read(2) print("读取到的文件内容:",data) data = f.read(4) #文件读取过程中的指针的定位会向后移动指定"字符数" print("读取到的文件内容:",data) f.close()
读数据(readline)
#准备好需要读取的数据文件 f = open("test2.txt","w",encoding="UTF-8") f.write("十年生死两茫茫\n"*10) f.close() #----------------------------------------------------------- f = open("test2.txt","r",encoding="utf-8") while True: content = f.readline() if content: print(f"{content}",end="") else: #print("content:",content,type(content)) break; f.close()
读数据(readlines)
f **加粗样式**= open("test2.txt","r",encoding="utf-8") content = f.readlines() print(content,type(content)) #输出的类型为列表类型(list) #遍历列表中的内容,并在前面添加行号 #写法一: # i = 1 # for data in content: # print(f"{i}:{data}",end="") # i+=1 #方法二: for i data in enumerate(content): print(f"{i}:{data}",end="") f.close()
所在位置(tell)
tell,返回指针当前所在的位置(指针所在位置前面的字节数)
#准备好需要读取的数据文件 f = open("test3.txt","w",encoding="gbk") f.write("十年生死两茫茫") f.close() #----------------------------------------------------------- f = open("test3.txt","r",encoding="gbk") content = f.read(2) print(content) content = f.read(4) print(content) print("当前指针所在位置:",f.tell()) #UTF-8中1个汉字3个字节,GBK中1个汉字为2个字节 f.clos()
定位(seek)
seek,定位文件读取的指针所在位置(字节)
seek的语法规则:
seek(offset[, whence])
offset – 开始的偏移量,也就是代表需要移动偏移的字节数
whence:可选,默认值为 0。
给offset参数一个定义,表示要从哪个位置开始偏移;
0代表从文件开头开始算起,1代表从当前位置开始算起,2代表文件末尾算起。
访问模式
open(“text.txt”,mode=“r+”) #mode 设定的就是访问模式,决定以进行的文件操作能力
案例:复制图片
fin = open("鬼刀.jpg",mode="rb") fout = open("鬼刀_copy2.jpg",mode="wb") data = fin.read(100) print(data,type(data)) #输出的内容以b开头表示bytes(字节)方式读取的字符串,是以十六进制表 #示的内容 while True: data = fin.read(100) #每次读取100个字符(自定义的缓冲区大小) if data: fout.write(data) else: break while True: data = fin.read(100) if data != b"": #此处需要注意为b"" fout.write(data) else: break fin.close() fout.close()
复制出的图片: