第一节:hive的产生背景
第二节:hive的介绍
一、概念
二、特点
三、基于hadoop
四、数据仓库
1、数据仓库工具
2、数据库和数据仓库的区别
(1)数据类型
(2)使用场景上
(3)模式上
数据写入的时候进行校验(例如数据库中5个字段都是int类型的,在写的时候插入String类型就插不进去,所以是写入的时候进行校验的)
(4)事务支持
第三节:hive的架构
一、用户接口层
1、概念
给客户端使用的
2、CLI(命令行)
hive的命令行操作界面
3、JDBC/ODBC
4、web ui
二、跨语言服务层(thrift server)
三、元数据存储层(meta store)
表和hdfs数据的路径对应关系
表中的字段类型
表中字段的顺序
表的创建时间。。。
hive 表数据存储hdfs,元数据存储在关系型数据库。
四、核心驱动层(Driver)
第四节:hive的优缺点
一、缺点
(1)延时性高
基于hadoop
(2)hive对事务的支持很弱
(3)hive不支持update、delete