CDH集群部署hive建表中文乱码

匿名 (未验证) 提交于 2019-12-02 23:51:01

背景:部署CDH集群的 hive 服务,选用 mysql 作为 hive 元数据的存储数据库,通过 hive cli 建表时发现中文注释均乱码。

现象:hive端建表中文注释乱码。

定位:

于是查看hive库表的编码,分别通过如下方式查看hive库和随机某个表的编码,发现hive表的编码是 lantin1,问题也就出在这里。

查看hive库编码:

查看hive表编码:

解决方法:

将hive表中所有关于注释的编码有 lantin1 修改为 utf-8。

alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8; alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8; alter table PARTITION_PARAMS  modify column PARAM_VALUE varchar(4000) character set utf8; alter table PARTITION_KEYS  modify column PKEY_COMMENT varchar(4000) character set utf8; alter table  INDEX_PARAMS  modify column PARAM_VALUE  varchar(4000) character set utf8;

至此,hive 端建表中文注释乱码问题已解决。

【参考资料】

https://my.oschina.net/jackieyeah/blog/742088.

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!