字符集 show character set可查看可用 字符集(将一系列字符的编码规则组合起来就形成字符集) 显示了字符集名称,描述信息,默认校对集(default collation)和单字符的最大长度(maxLen) 下表展示了可用字符集的部分。 常用字符集有latinl,gbk,utf8 字符集 单字符最大长度 支持的语言 Latinl 1字节 西欧字符,希腊字符等 Gbk 2字节 简体和繁体中文,日文,韩文 Utf8 3字节 世界上大部分国家的文字 单字符占用的存储空间越多,所支持的语言越多 标准的UTF-8(RFC 3629)规定一个字符最多使用4个字节 Mysql从5.5.3版本开始新增了utf8mb4,将一个字符扩展到4个字节。 考虑RFC 3629规范,应使用utf8mb4 校对集 SHOW COLLATION Mysql中提供了很多校对集,用于为 不同字符集指定比较和排序规则。 latinl 字符集默认校对集为latinnl_swedish_ci 校对集用 _ 分隔3部分。第一个部分是对应的字符集,第二部分是国家名,结尾是ci,cs,或bin。其中ci表示不区分大小写,cs表示区分大小写,bin表示二进制方式比较 通过SHOW COLLATION 可以查看mysql可用的校对集。 下图显示了一部分的展示结果。 显示了校对名称(collation) 对应字符集