python3 之 字符串编码小结(Unicode、utf-8、gbk、gb2312等)
python3 解释器默认编码为Unicode,由str类型进行表示。二进制数据使用byte类型表示。 字符串通过编 码转换成字节串,字 节码通过解码成为字符串。 encode:str-->bytes decode:bytes --> str 下面给出一个实例: 1 mystr = '人生苦短,我学Python' 2 print('原始字符串mystr:',mystr) #原始字符串mystr: 人生苦短,我学Python 3 4 5 #将字符串进行编码 6 mystr_to_utf8 = mystr.encode('utf-8')#默认就是Unicode,不用再decode 7 mystr_to_gbk = mystr.encode('gbk') 8 9 10 #打印编码后的字节串(字面值) 11 print('utf-8编码后的字节串:',mystr_to_utf8) 12 #utf-8编码后的字节串: b'\xe4\xba\xba\xe7\x94\x9f\xe8\x8b\xa6\xe7\x9f\xad\xef\xbc\x8c\xe6\x88\x91\xe5\xad\xa6Python' 13 14 print('gbk编码后的字节串:',mystr_to_gbk) 15 #gbk编码后的字节串: b'\xc8\xcb\xc9\xfa\xbf\xe0\xb6\xcc\xa3