Python编码decode和encode
Python编码decode和encode 常见编码介绍: GB2312编码:适用于汉字处理、汉字通信等系统之间的信息交换; GBK编码:是汉字编码标准之一,是在 GB2312-80 标准基础上的内码扩展规范,使用了双字节编码 ASCII编码:是对英语字符和二进制之间的关系做的统一规定。主要是老美用. *****日本、韩国其他国家也有自己的编码规则,如果多语言混用就出现乱码,所以unicode产生 Unicode编码:这是一种世界上所有字符的编码。当然了它没有规定的存储方式。 UTF-8编码:是 Unicode Transformation Format - 8 bit 的缩写, UTF-8 是 Unicode 的一种实现方式。它是可变长的编码方式,可以使用 1~4 个字节表示一个字符,可根据不同的符号而变化字节长度。如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间,UTF-8的一个好处在于,原有的ASCII的编码可以在UTF-8下继续工作。 编码转换 字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。 decode的作用是将其他编码的字符串转换成unicode编码 ,如str1.decode(