四种重要的非关系型数据库
Hbase 列式存储以流的方式在列中存储所有的数据 。对于任何记录,索引都可以快速地获取列上的数据;列式存储支持行检索,但这需要从每个列获取匹配的列值,并重新组成行。HBase(Hadoop Database)是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。HBase是Google BigTable的开源实现,模仿并提供了基于Google文件系统的BigTable数据库的所有功能。HBase可以直接使用本地文件系统或者Hadoop作为数据存储方式,不过为了提高数据可靠性和系统的健壮性,发挥HBase处理大数据量等功能,需要使用Hadoop作为文件系统。HBase仅能通过主键(row key)和主键的range来检索数据,仅支持单行事务,主要用来存储非结构化和半结构化的松散数据。 Hbase中表的特点:大,稀疏,面向列 Hadoop生态系统中的各层系统 HBase位于结构化存储层; HDFS为HBase提供了高可靠性的底层存储支持; MapReduce为HBase提供了高性能的计算能力; Zookeeper为HBase提供了稳定服务和失败恢复机制; Pig和Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变的非常简单;