今天在写入文件时候遇到了中文乱码的问题。
问题描述: 字符串转以utf-8编码的字符数组 bytes,然后使用 bytes.decode("utf-8")写入文件中。html指定为utf-8编码,结果页面出现中文乱码。
出现问题的原因是因为生成的html文件是以gbk编码存储的,代码如下:
# 在 open 方法中指定 encoding="utf-8" 生成的test.html文件会以 utf-8编码,否则在我的电脑上会以 gbk 编码 with open("test.html", "w", encoding="utf-8") as f: f.write(bytes.decode("utf-8"))
记录一下现在浏览器客户端使用的编码由什么标签指定:
# meta 标签, 且包含 http-equiv="Content-Type" 那么content中的charset属性指定浏览器使用的字符集 <meta http-equiv="Content-Type" content="text/html;charset=utf-8">