刨根究底字符编码之二——关键术语解释(下)
关键术语解释(下) 一、第1层 抽象字符表ACR (Abstract Character Repertoire抽象字符清单):明确字符的范围(即确定支持哪些字符) 1. 抽象字符表ACR 是一个编码系统支持的所有抽象字符的集合,可以简单理解为无序的字符集合,用于确定字符的范围,即要支持哪些字符。 抽象字符表ACR的一个重要特点是字符的无序性,即其中的字符并没有编排数字顺序,当然也就没有数字编号。 2. “ 抽象 ”字符不具有某种特定的字形,不应与具有某种特定字形的“ 具体 ”字符混淆。 3. 字符表可以是 封闭的(即字符范围是固定的) ,即除非创建一个新的标准,否则 不允许 添加新的字符,比如ASCII字符表和ISO/IEC 8859系列都是这样的例子;字符表也可以是 开放的(即字符范围是不固定的) ,即 允许 不断添加新的字符,比如Unicode字符表和一定程度上Code Page代码页(代码页后文会有详细解释)是这方面的例子。 二、第2层 编号字符集CCS(Coded Character Set):用数字编号表示字符(即用数字给字符编号) 【注: 一般将“ Coded Character Set ”翻译为“编码字符集”或“已编码字符集”,但这里的“编码”二字容易导致与后文的“编码方式”及“编码模式 ” 中的“编码”二字混淆,带来理解上的困扰,因此觉得翻译为“编号字符集”为宜。】