&Hive产生背景 1.MapReduce编程的不方便性 2.传统RDBMS人员的需要 HDFS上的文件没有schema概念 &HIve概述 1.由Facebook开源,用于解决海量结构化日志的数据统计问题 2.构建在Hadoop之上的数据仓库 3.Hive提供的SQL查询语言:HQL 4.底层支持多种不同的执行引擎 MR/Tez/Spark 5.提供统一元数据管理,Hive数据是存放在HDFS,元数据信息(记录数据的数据)是存放在MySQL中 7.简单统一上手,为超大数据集设计的计算/扩展能力 8.HIve在Hadoop生态系统中的位置 Hive官网概述: The Apache Hive ™ data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage using SQL. Structure can be projected onto data already in storage. A command line tool and JDBC driver are provided to connect users to Hive. Apache Hive™数据仓库软件支持使用SQL读取