open()
函数,传入文件名和标示符:>>> f = open('/Users/michael/test.txt', 'r')
read()
方法可以一次读取文件的全部内容,Python把内容读到内存,用一个str
对象表示:>>> f.read() 'Hello, world!'
close()
方法关闭文件。文件使用完毕后必须关闭,因为文件对象会占用操作系统的资源,并且操作系统同一时间能打开的文件数量也是有限的:>>> f.close()
with
语句来自动帮我们调用close()
方法:try ... finally
的作用一样的,但是代码更佳简洁,并且不必调用f.close()
方法。with open('/path/to/file', 'r') as f: print(f.read())
read()
一次性读取最方便;如果不能确定文件大小,反复调用read(size)
比较保险;如果是配置文件,调用readlines()
最方便:for line in f.readlines(): print(line.strip()) # 把末尾的'\n'删掉
>>> f = open('/Users/michael/test.jpg', 'rb') >>> f.read() b'\xff\xd8\xff\xe1\x00\x18Exif\x00\x00...' # 十六进制表示的字节
读取非UTF-8编码的文本文件,需要给open()
函数传入encoding
参数,例如,读取GBK编码的文件:
>>> f = open('/Users/michael/gbk.txt', 'r', encoding='gbk') >>> f.read() '测试'
遇到有些编码不规范的文件,你可能会遇到UnicodeDecodeError
,因为在文本文件中可能夹杂了一些非法编码的字符。遇到这种情况,open()
函数还接收一个errors
参数,表示如果遇到编码错误后如何处理。最简单的方式是直接忽略:
>>> f = open('/Users/michael/gbk.txt', 'r', encoding='gbk', errors='ignore')
以'w'
模式写入文件
以'a'
追加(append)模式写入
>>> f = open('/Users/michael/test.txt', 'w') >>> f.write('Hello, world!') >>> f.close()
你可以反复调用write()
来写入文件,但是务必要调用f.close()
来关闭文件。当我们写文件时,操作系统往往不会立刻把数据写入磁盘,而是放到内存缓存起来,空闲的时候再慢慢写入。只有调用close()
方法时,操作系统才保证把没有写入的数据全部写入磁盘。忘记调用close()
的后果是数据可能只写了一部分到磁盘,剩下的丢失了。所以,还是用with
语句来得保险:
with open('/Users/michael/test.txt', 'w') as f: f.write('Hello, world!')
文件内容如下
项目名称,版本号 导体结构检查,V1.0 导体结构及单丝直径检查,V1.0
希望转成以下形式[[导体结构检查,V1.0],[导体结构及单丝直径检查,V1.0]]
代码如下
line_list=[] file_list=[] def read_list(): f = open(path, "r") lines = f.readlines() for line in lines: line_list = line.strip().split(',') file_list.append(line_list) return file_list
import xlrd workbook = xlrd.open_workbook('./test.xlsx')
# 方式一、用sheet名字 sheet = workbook.sheet_by_name('Sheet1') # 方式二、用索引 sheet = workbook.sheet_by_index(0)#根据索引顺序获取sheet
rows = sheet_name.nrows # 获取行数 cols = sheet_name.ncols # 获取列数
# 方式一、获取指定行或列的全部数据 sheet.col_values(0) # 获取第一列的全部数据 sheet.row_values(0) # 获取第一行的全部数据 # 方式二、获取指定的单元格数据 sheet.cell_value(0, 1) #获取第1列第2行的数据
import xlwt book = xlwt.Workbook()#新建一个excel
sheet = book.add_sheet('case1_sheet')#添加一个sheet页
sheet.write(row,col,value)# 在某行某列中写入值
book.save('test.xls')#保存到当前目录下
JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。
python操作json文件通过了两种方法:
# 读取JSON文件,文件内容: [{'a': 'b'}] import json with open('./2.json', 'r', encoding='utf-8')as fp: json_data = json.load(fp) print("文件数据:", json_data) print(type(json_data))
文件数据: [{'a': 'b'}]
<class 'list'>
# 将字典数据写入到JSON文件中 dict1 = {"name": "sxy", "sex": "男"} with open('./1.josn', 'a', encoding='utf-8')as fp: json.dump(dict1, fp, ensure_ascii=False) # ensure_ascii=False,表示返回值可以包含非ascii值