Sqoop
Apache Sqoop 二、 Apache Sqoop 1. sqoop介绍 Apache Sqoop是在Hadoop生态体系和 RDBMS 体系之间传送数据的一种工具 。来自于Apache软件基金会提供。 Sqoop工作机制是将导入或导出命令翻译成mapreduce程序来实现。在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。 Hadoop生态系统包括:HDFS、Hive、Hbase等 RDBMS体系包括:Mysql、Oracle、DB2等 Sqoop可以理解为:“SQL 到 Hadoop 和 Hadoop 到SQL” 站在Apache立场看待数据流转问题,可以分为数据的导入导出: Import:数据导入。RDBMS----->Hadoop Export:数据导出。Hadoop---->RDBMS 2. sqoop安装 安装sqoop的前提是已经具备java和hadoop的环境。 最新稳定版: 1.4.6 配置文件修改: cd $SQOOP_HOME /conf mv sqoop-env-template.sh sqoop-env.sh vi sqoop-env.sh export HADOOP_COMMON_HOME = /export/servers/hadoop-2.7.5 export HADOOP_MAPRED_HOME