机内码

字符集与编码(九)——GB2312,GBK,GB18030

試著忘記壹切 提交于 2020-01-07 18:44:44
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 前面的一些篇章更多谈论了Unicode的相关话题,虽然也有提到GBK等编码,但都没细说,这里打算系统说一下。GB系列包括GB2312,GBK,GB18030. 前面已经提过,GB=Guo Biao=国标=国家标准,至于所谓的2312就是一编号了,没有其它特别的意义,18030类似。GBK没有编号,所以它实际上并不是国家标准,只是一个事实标准,GBK中K指“扩展”的意思。 最早的是GB2312,我们从它开始说起。 GB2312 以下为一简介(官方文档见" 国家标准化管理委员会 "网站: http://gbread.sac.gov.cn/bzzyReadWebApp/standardresources.action?m=readFile&bzNum=GB%202312-1980&flag=1 ,用IE打开,它要安装一个ActiveX插件): GB 2312-1980,全称《信息交换用汉字编码字符集 基本集》,由国家标准总局于1980年3月9号发布,1981年5月1日实施,通行于大陆。新加坡等地也使用此编码。它是一个简化字的编码规范,也包括其他的符号、字母、日文假名等,共7445个图形字符,其中汉字占6763个。 上述官网地址无法下载,如果你想下载,可试下这个 ftp://ftp.oreilly.com