python进阶学习笔记2
01字符串编码 ord()和chr()函数 python 3中字符串是以Unicode编码实现,对单个字符,可以使用ord()函数获取字符的完整表示,chr()函数把编码转为对应的字符: >> > print ( '包含中文的str' ) 包含中文的 str >> > ord ( 'A' ) 65 >> > ord ( '中' ) 20013 >> > chr ( 66 ) 'B' >> > chr ( 20091 ) '乻' >> > chr ( 20089 ) '乹' >> > chr ( 20099 ) len()函数计算str字符数 也可以计算bytes的字节数(python字符串类型是str,在内存中是Unicode表示,在网络中传输,或者保存到磁盘上就需要变为以字节为单位的bytes) python对bytes类型的数据用带b前缀的单引号或双引号表示。 x=b’ABC’ >> > len ( b 'ABC' ) 3 >> > len ( '中文' ) 2 编码encode()方法和解码decode()方法 以Unicode表示的str通过encode()方法可以编码为指定的bytes 反过来,如果从网络或磁盘上读取了字节流,那么读到的数据就是bytes此时要用decode()方法解码。 >> > '中文' . encode ( "utf-8" ) b '\xe4\xb8