Apache Sqoop导入&导出
RDBMS->HDFS 全表导入 sqoop import \ --driver com.mysql.jdbc.Driver \ --connect jdbc:mysql://CentOS:3306/test?characterEncoding = UTF-8 \ --username root \ --password root \ --table t_user \ --num-mappers 4 \ --fields-terminated-by '\t' \ --target-dir /mysql/test/t_user \ --delete-target-dir 参数 含义 –-connect 连接的数据库地址 -–username 连接的数据库的用户名 –-password 连接的数据库的密码 –-table 想要导出数据的表 –target-dir 要导入到hdfs中的目录(如果不指定,默认存储在“/user/用户名/导入的表名” 目录下) -–delete-target-dir 表示如果在hdfs中有该目录,则先删除,然后再导入数据到该目录下 –num-mappers 表示设置的maptask个数,默认为4个,决定最终在hdfs中生成的文件个数(将table中的数据分成几个文件分别存储) –fields-terminated-by 指定字段的分割符号 字段导入