HIve高级函数
最近使用了hive一些高级函数,在此记录一下 一:Hive是什么 Hive是面向大数据的数据仓库,是一种将SQL转换为mapreduce的工具。 二:hive表 内表、外表、分区、桶表、location、压缩这些都是表的属性,每个之间没有什么关系(内表外表不可以同时存在)。也就是说一个表既可以是内表,也可是分区表桶表,也可以规定存放路径还可压缩 内表 内表其实就是将拷贝到Hive的目录下,表和数据关联,表删除数据删除。 create table if not exists table_test ( aa string ) row format delimited fields terminated by '\001' location '/hive/table/table_test'; 以上的语句就是建一个内表,一行是一条记录,字段之间按照\001分割,数据最终存放的位置是/hive/table/table_test。 装载数据: insert into table_test select aa from table_aa; 或 load data inpath '/hive/date/table_test' overwrite into table table_test;(overwrite是覆盖数据,可去掉) 外表