Hive的基本介绍以及常用函数
一、Hive的简介: Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。 优点: 1 ) 操作接口采用类SQL语法,提供快速开发的能力(简单、容易上手)。 2 ) 避免了去写MapReduce,减少开发人员的学习成本。 3 ) Hive的执行延迟比较高,因此Hive常用于数据分析,对实时性要求不高的场合。 4 ) Hive优势在于处理大数据,对于处理小数据没有优势,因为Hive的执行延迟比较高。 5 ) Hive支持用户自定义函数,用户可以根据自己的需求来实现自己的函数。 缺点: 1 )Hive的HQL表达能力有限 2 )Hive的效率比较低 二、Hive的架构图 三、Hive的数据类型 基本数据类型: Hive数据类型 Java数据类型 TINYINT byte SMALINT short INT int BIGINT long BOOLEAN boolean FLOAT float DOUBLE double STRING string TIMESTAMP 时间类型 BINARY 字节数组 集合 STRUCT 和c语言中的struct类似,都可以通过“点”符号访问元素内容。例如,如果某个列的数据类型是STRUCT{first