提示错误:
UnicodeEncodeError: 'gbk' codec can't encode character '\ufb01' in position 2620: illegal multibyte sequence
解决方法:
问题的原因在于Python 3里面字符串的默认编码是Unicode的
取的网页上面的内容,在代码里面是存在字符串变量里的,Windows下面新建的文本文件默认的编码是gbk(Windows简体中文版的系统默认编码就是gbk),当把从网页上读取的内容写到文本文件里面去的时候,意味着把一个unicode的字符序列写入到一个编码是gbk的文件,最后就出错了,解决方法就是在打开一个文件的时候,指定文件的编码,让它以指定的编码打开。
with open(read_file, 'r', encoding='utf-8') as file_object:
content = file_object.read()