一、字符串
1、字符串编码发展:
1)ASCII码: 一个字节去表示
(8个比特(bit)作为一个字节(byte),因此,一个字节能表示的最大的整数就是255(二进制11111111 = 十进制255))
2)Unicode:两个字节表示(将各国的语言(中文编到GB2312,日文编到Shift_JIS,韩文编到Eur-kr......) 统一到一个编码里)
3) UTF-8:为了节省空间,可变长编码应运而生;(英文1个字节;中文3个字节)
----Python3默认使用的是utf-8编码方式
2、网络传输使用的编码解码方式:
encode()--使用指定编码方式将字符串编码为bytes(字节),便于网络传输;(编码)
decode()--从网络或磁盘上读取字节流【读到的数据(data)就是bytes】,再转换为字符串(解码)
3、字符串常用方法:
1)len(str):返回字符个数或字节个数
len('Hellow world!')
2) chr(整数编码):返回Unicode编码x对应的字符(即ASCII码值)(x可以是10进制, 也可以是16进制的形式的数字)
3)ord(字符):返回单个字符表示的Unicode编码;(与chr()函数相对应)
打印十二星座:
4) find(str, beg=0, end=len(string))---检测字符串中是否包含子字符串str,返回索引值;
----------------若在索引范围内找不到子字符串,则返回-1
参数:str:指定检索的字符串;
beg:指定字符串索引的起始位置;
end:指定字符串索引的结束位置;
5)index(str, beg=0, end=len(string))-- 与find()函数差不多;
区别-----若在索引范围内找不到子字符串,则返回异常值;
6)in/not in 判断一个字符串是否包含另一个字符串中
7)upper() 将原字符的所有字母转换为大写
lower() 将原字符的所有字母转换为小写
8)isupper() 所有字母都是大写 ,返回布尔值True,否则,返回False
islower() 所有字母都是小写 ,返回布尔值True,否则,返回False
4、 格式化输出:
1)基本格式:<字符串>.format(<逗号分隔的参数>)
2)格式控制:
s = "python" print("格式化:{0:10}".format(s)) #默认使用空格填充,默认左对齐,宽度为10 print("格式化:{0:*>10}".format(s)) #填充字符为*,右对齐,宽度为10 print("格式化:{0:*<10}".format(s)) #填充字符为*,左对齐,宽度为10 print("格式化:{0:-^20}".format(s)) #填充字符为-,居中对齐,宽度为20
5、字符串拼接
1)str1+str2
2) str1str2
3) str1*3
6、索引和切片:
1)索引:获取某一个字符s[下标];
从左往右数:0
从右往左数:-1
2)切片:获取片段 name[起始,结束,步长];
获取顺序:步长>0,从左往右;
步长<0,从右往左
2022-07-15