Python教程

python字符串-编码(encode)

本文主要是介绍python字符串-编码(encode),对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

encode方法用于使用指定的编码格式对字符串进行编码。

语法

encode(encoding='utf-8', errors='strict')

参数

  • encoding: 编码格式,默认为‘utf-8’。
  • errors: 不同错误的处理方案,默认值为strict。
    • strict:遇到非法字符就抛出异常。
    • ignore:忽略非法字符。
    • replace:用“?”替换非法字符。
    • xmlcharrefreplace:使用 xml 的字符引用。

返回值

  • 编码后的字符串。

示例

str = '我爱我的爸妈'
print('默认为utf-8编码:', str.encode())
print('utf-8明示编码:', str.encode('UTF-8'))
print('GBK编码:', str.encode('GBK', 'strict'))
try:
    print('BIG5编码:', str.encode('BIG5', 'strict'))
except UnicodeError as err:
    print('出错了:', err)

print('BIG5编码,igonre参数忽略非法字符:', str.encode('BIG5', 'ignore'))
默认为utf-8编码: b'\xe6\x88\x91\xe7\x88\xb1\xe6\x88\x91\xe7\x9a\x84\xe7\x88\xb8\xe5\xa6\x88'
utf-8明示编码: b'\xe6\x88\x91\xe7\x88\xb1\xe6\x88\x91\xe7\x9a\x84\xe7\x88\xb8\xe5\xa6\x88'
GBK编码: b'\xce\xd2\xb0\xae\xce\xd2\xb5\xc4\xb0\xd6\xc2\xe8'
出错了: 'big5' codec can't encode character '\u7231' in position 1: illegal multibyte sequence
BIG5编码,igonre参数忽略非法字符: b'\xa7\xda\xa7\xda\xaa\xba\xaa\xa8'

help()

Help on built-in function encode:

encode(encoding='utf-8', errors='strict') method of builtins.str instance
    Encode the string using the codec registered for encoding.
    
    encoding
      The encoding in which to encode the string.
    errors
      The error handling scheme to use for encoding errors.
      The default is 'strict' meaning that encoding errors raise a
      UnicodeEncodeError.  Other possible values are 'ignore', 'replace' and
      'xmlcharrefreplace' as well as any other name registered with
      codecs.register_error that can handle UnicodeEncodeErrors.
这篇关于python字符串-编码(encode)的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!