python基础篇10-py2和py3编码
编码基础 编码概述 基本概念很简单。首先,我们从一段信息即消息说起,消息以人类可以理解、易懂的表示存在。我打算将这种表示称为“明文”(plain text)。对于说英语的人,纸张上打印的或屏幕上显示的英文单词都算作明文。其次,我们需要能将明文表示的消息转成另外某种表示,我们还需要能将编码文本转回成明文。从明文到编码文本的转换称为“编码”,从编码文本又转回成明文则为“解码”。 python解释器在加载 .py 文件中的代码时,会对内容进行编码。python2 默认编码方式是ascii码,python3 默认编码方式utf-8。 ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,其最多只能用 8 位来表示(一个字节),即:2**8 = 256-1,所以,ASCII码最多只能表示 255 个符号。 编码方式 ascii: 只能支持英文、特殊字符、数字,用一个字节表示一个字符。最多只能表示 255 个符号; 万国码(unicode): 所有的字符和符号由4个字节来表示。占资源较多;(早期所有字符使用2个字节表示,现在已经废弃) UTF-8: 是对Unicode的升级。UTF-8最少使用一个字节表示一个字符。一个字节表示一个英文字符