1.什么是编码?
编码指的是人类理解的数据转换为计算机理解的0和1的过程。
2.什么是编码表,编码表有哪些?
一组使用特定编码的规则,
编码表:
ASCII:1个byte(字节),8个bit(位),可以存放2*8=128个英文字母特殊符号等
GBK: 2个byte(字节),16个比特位,可以存放2*16次方个不同的信息(中文汉字10万多,常用大多数汉字65535个)
Unicode:每个国家搞一套编码,万国码。对于的资源浪费,编码长度是固定的
UTF-8:长度可变的编码表,节省资源
3.八进制和十六进制的诞生
二进制编码过长,形成阅读障碍,高进制编码因此而生
二进制:0,1
八进制:0,1,2,3,4,5,6,7
十六进制:0,1,2,3,4,5,6,7,8,9,a,b,c,d,e,f
python3处理我们输入的字符:默认用unicode编码,所以你用什么语言都可输入。
4.数据硬盘存储和网络传输的编码规则
使用的是UTF-8,节省资源提高性能。当我们点击保存的时候,系统自动将unicode转换位UTF-8
5.编码和解码
一些中文网站,还在用GBK,所以会有编码解码的过程
编码:encode()方法
解码:decode()方法
eg:
print('吴枫'.endode('utf-8'))
print('\xe5\x90\xb4\xe6\x9e\xab'.decode('utf-8'))
说明:用什么encode()就用什么decode()
6.python中的编码和浏览器网址中的区别?
百度收索:吴枫(参数部分)
%E5%90%B4%E6%9E%AB
全链接地址:https://www.baidu.com/s?wd=%E5%90%B4%E6%9E%AB
Python中的编码:
python中的\x别浏览器中替换为%
python中’吴枫‘的utf-8编码:\xe5\x90\xb4\xe6\x9e\xab
7.文件的读写
a) 读取文件
步骤:1.打开文件,2.读取文件,3.关闭文件
打开文件:
file1=open('url','r',encoding='utf-8')
读取文件:
filecontent = file1.read()
print(filecontent)
关闭文件:
file1.close()
注意:
路径分为绝对路径和相对路径.
绝对路径:windows和mac的地址有区别,window的路径中包含'\',
这个在python中是转义字符,通常需要把‘\’改为‘\\’
相对路径:当.py文件和要读写的文件在同一文件夹,用相对路径即可
b) 写入文件
步骤:1.打开文件2.写入文件3。关闭文件
打开文件:
file1=open('url','w',encoding='utf-8')#第二个参数为w,打开文件后会清空所有的内容再写入
file1=open('url',r',encoding='utf-8')#第二个参数为r,打开文件后保留原有内用,追加写入新数据
写入文件:
file1.write('张无忌\n')
file.write('宋青书\n')
关闭文件:
file1.close()