大数据入门第十四天——Hbase详解(一)入门与安装配置
一、概述 1.什么是Hbase 根据官网: https://hbase.apache.org/ Apache HBase™ is the Hadoop database, a distributed, scalable, big data store. HBASE是一个高可靠性、高性能、 面向列 、可伸缩的分布式存储系统 中文简明介绍: Hbase是 分布式、面向列 的开源数据库(其实准确的说是 面向列族 )。HDFS为Hbase提供可靠的底层数据存储服务,MapReduce为Hbase提供高性能的计算能力,Zookeeper为Hbase提供稳定服务和Failover机制,因此我们说Hbase是一个通过大量廉价的机器解决海量数据的高速存储和读取的分布式数据库解决方案。 2.什么是列式存储 使用网友的图就是: 其中更加深入的内部原理讲解,参考: http://blog.csdn.net/lifuxiangcaohui/article/details/39891099 http://lib.csdn.net/article/datastructure/8951 3.为什么需要Hbase 以下介绍了一种Hbase出现的场景: