如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
Sqoop工具是hadoop环境下连接关系数据库,和hadoop存储系统的桥梁,支持多种关系数据源和hive,hdfs,hbase的相互导入。一般情况下,关系数据表存在于线上环境的备份环境,需要每天进行数据导入,根据每天的数据量而言,sqoop可以全表导入,对于每天产生的数据量不是很大的情形可以全表导入,但是sqoop也提供了增量数据导入的机制。下面介绍几个常用的sqoop的命令,以及一些参数:序号命令/command类说明1imporImportTool从关系型数据库中导入数据(来自表或者查询语句)到HDFS中2exportExportTool将HDFS中的数据导入到关系型数据库中3codegenCodeGenTool获取数据库中某张表数据生成Java并打成jar包4create-hive-tableCreateHiveTableTool创建Hive表5evalEvalSqlTool查看SQL执行结果6import-all-tablesImportAllTablesTool导入某个数据库下所有表到HDFS中7jobJobTool8list-databasesListDatabasesTool列出所有数据库名9list-tablesListTablesTool列出某个数据库下所有表10mergeMergeTool11metastoreMetastoreTool12helpHelpTool查看帮助13versionVersionTool查看版本接着列出Sqoop的各种通用参数,然后针对以上13个命令列出他们自己的参数.Sqoop通用参数又分CommonargumentsIncrementalimportargumentsOutputlineformattingargumentsInputparsingarguments,HiveargumentsHBaseargumentsGenericHadoopcommand-linearguments1.Commonarguments通用参数,主要是针对关系型数据库链接的一些参数序号参数说明样例1connect连接关系型数据库的URLjdbc:mysql://localhost/sqoop_datas2connection-manager连接管理类,一般不用3driver连接驱动4hadoop-homehadoop目录/home/hadoop5help查看帮助信息6password连接关系型数据库的密码7username链接关系型数据库的用户名8verbose查看更多的信息,其实是将日志级别调低该参数后面不接值Importcontrolarguments:ArgumentDescription--appendAppenddatatoanexistingdatasetinHDFS--as-avrodatafileImportsdatatoAvroDataFiles--as-sequencefileImportsdatatoSequenceFiles--as-textfileImportsdataasplaintext(default)--boundary-query<statement>Boundaryquerytouseforcreatingsplits--columns<col,col,col…>Columnstoimportfromtable--directUsedirectimportfastpath--direct-split-size<n>Splittheinputstreameverynbyteswhenimportingindirectmode--inline-lob-limit<n>SetthemaximumsizeforaninlineLOB-m,--num-mappers<n>Usenmaptaskstoimportinparallel-e,--query<statement>Importtheresultsofstatement.--split-by<column-name>Columnofthetableusedtosplitworkunits--table<table-name>Tabletoread--target-dir<dir>HDFSdestinationdir--warehouse-dir<dir>HDFSparentfortabledestination--where<whereclause>WHEREclausetouseduringimport-z,--compressEnablecompression--compression-codec<c>UseHadoopcodec(defaultgzip)--null-stri