metastore元数据库表整理
笔者工作中有时候会用到HIVE META 元数据库,临时查找相关信息比较麻烦,主要常用的表如下,以备后续查阅 表名 说明 关联键 DBS 所有hive库的基本信息 DB_ID TBLS 所有hive表的基本信息 TBL_ID,SD_ID TABLE_PARAM 表的相关属性信息,如是否外部表,表注注释及一些文件的统计信息等 TBL_ID COLUMNS Hive表字段信息(字段注释,字段名,字段类型,字段序号) SD_ID SDS 所有hive表、表分区所对应的hdfs数据目录和数据格式 SD_ID,SERDE_ID SERDE_PARAM 序列化反序列化信息,如行分隔符、列分隔符、NULL的表示字符等 SERDE_ID PARTITIONS Hive表分区信息 PART_ID,SD_ID,TBL_ID PARTITION_KEYS Hive分区表分区键 TBL_ID PARTITION_KEY_VALS Hive表分区名(键值) PART_ID TBL_PRIVS hive 权限相关信息,多数是空的 TBL_GRANT_ID 嘿嘿,这次偷下懒,改天画下图 1,有时候需要批量找出某些特征表相关信息的时候,临时组织sql比较麻烦,先记录下之前的sql 对外封装hive meta接口的时候比较有用 #比如找出表名,列名,列类型,注释,及字段序号,去掉where条件可以找出所有表