python —— 编码
编码: 用来存放一位0或1,就是计算机里最小的存储单位,叫做【位】,也叫【比特】(bit)。我们决定8个比特构成一个【字节】(byte),这是计算机里最常用的单位。 1 byte = 8 bit 也就是一个字节等于8比特 编码表按照时间顺序有以下: 编码表就是计算机世界的字典 计算机是有自己的工作区的,这个工作区被称为“内存”,数据在内存当中处理时,使用的格式是Unicode,统一标准. 在python3当中,程序处理我们输入的字符串,是默认使用Unicode编码,所以输入什么语言都可以识别。 1. 数据在硬盘上存储,或者是在网络上传输,用的是UTF-8,因为节省空间 ,但我们不必操心如何转换utf-8和Unicode ,当我们点击保存的时候,程序已经“默默地”帮我们做好了编码工作。 2.一些中文的文件和中文网站 ,还在使用GBK,和GB2312。 有时候面对不同的编码的数据,我们要进行一些操作来实现转换。这里就涉及接下来要讲的【encode】(编码)和【decode】(解码)的用法。 编码:即将把人类的语言转换为计算机语言,就是【编码】 encode(); 解码:decode() print ( '吴枫' . encode ( 'utf-8' ) ) print ( '吴枫' . encode ( 'gbk' ) ) print ( b '\xe5\x90\xb4\xe6\x9e