Hive整合Hbase
Hive整合Hbase hive 和 hbase 对比 应用场景及编译安装 hive 和 hbase 对比 Hive 数据仓库: Hive 的本质其实相当于将 HDFS 中已经存储的文件在 Mysql 中做了一个双射的关系,以方便使用 HQL 去管理查询。 用于数据分析、清洗 Hive 适用于离线的数据分析和清洗,延迟较高。 基于 HDFS、MaoRedce Hive 存储的数据依旧在 DataNode 上,编写的 HQL 语句转换为 MapReduce 代码执行。 HBase 数据库 是一种面向列存储的非关系型数据库。 用于存储结构化和非结构化的数据 适用于单表非关系型数据库的数据 基于 HDFS 适用于单表非关系型数据库的数据,不适合做关联查询,类似 JOIN 等操作。 延迟较低,接入在线业务使用 面对大量的企业数据,Hbase 可以直接单表大量数据的存储,同时提供了高效的数据访问速度。 应用场景及编译安装 Hbase 作为 Hive 的数据源 构建低延时的数据仓库 重新编译 hive 的jar包,使其兼容hbase。 Hbase 与 Hive 的集成在最新的两个版本中无法兼容。所以,我们只能重新编译:hive-hbase-handler-1.2.2.jar ,并把编译好的 jar 包放到 hive 的 lib 目录下。 下载 Hive 源码地址 单击进入http:/