夜古诚

sqoop学习之路

前言

sqoop是一款用于结合关系型数据库和hdfs(hive/hbase)的数据库之间数据相互传递的工具，可以将mysql/oracle等数据库中存在的表通过sqoop来传递给hive或着是hbase，同样也可以将hive或者是hbase中的表格传递给sqoop中，非常好用。此博客介绍sqoop的版本为1.4.6，主要涉及安装和使用：

sqoop作用
1. hadoop大数据存储平台：hdfs、hive、hbase
2. rdbms关系型数据库 : mysql、oracle、postgresql
3. 迁入：关系型数据库到大数据平台 import
4. 迁出：大数据平台到关系型数据库 export
5. 本质：sqoop将数据迁移命令转化为MR，只需在一个节点安装（sqoop底层只需要重新定义输入inputformat 输出outputformat）
sqoop原理
把用户的指令解析编译成MR任务，发布到yarn上分布式执行
MR任务把输入和输出分别对接RDBMS和Hadoop就能完成数据的转移
sqoop版本

sqoop1：
	1. 核心组件：TaskTranslator，解析编译用户指令，生成mr任务发布到yarn
	2. cli、api ：和用户交互，从用户接受命令，把命令发送给TaskTranslator
	3. 优点：简单、灵活、易用，不需要做什么配置，指令即配置，指令可以马上执行
	4. 缺点：支持shell和java等语言，对于其他语言无法支持

sqoop2
	1. server端：
		a）核心组件：TaskTranslator，解析编译用户指令，生成mr任务发布到yarn
		b）Connector连接存储系统的中间组件
		c）Metadata：
			1）存储用户跟存储系统的连接信息：link
			2）存储数据导入导出的指令信息：Job
		d）RestServer：
			1）对外接受客户端的服务
			2）接受客户端的连接，接受客户端的指令，把指令发送给TaskTranslator
		e）UiServer：对外接受客户端的服务
	2. client端：cli、api、webui
	3. 优点：
		a）通用更强
		b）会记录元数据包括存储系统连接信息和任务配置信息等
	4. 缺点：
		a）步骤稍显麻烦
		b）对记录的连接需要使用Connector来连接

一、sqoop的安装

和sqoop一起工作的组件：
mysql（传统关系型数据库）、hdfs（集群）、hive（安装在一个节点）、hbase（集群）、zookeeper

1. 下载 sqoop-1.4.6
2. 上次Linux，解压sqoop-1.4.6
	[hadoop@hadoop01 ~]$  tar -zxvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz
3. 设置环境变量
	[hadoop@node1 ~]$  sudo vi /etc/profile
		（以下是我的配置文件，仅供参考，你也可以在家目录下修改 .bash_profile文件，此文件也可以作为用户配置文件）
		export JAVA_HOME=/home/hadoop/jdk1.7.0_67
		export HADOOP_HOME=/home/hadoop/hadoop-2.7.1
		export ZK_HOME=/home/hadoop/zookeeper-3.4.6
		export HIVE_HOME=/home/hadoop/apache-hive-1.2.1-bin
		export HBASE_HOME=/home/hadoop/hbase-1.1.2
		export SQOOP_HOME=/home/hadoop/sqoop-1.4.6.bin__hadoop-2.0.4-alpha
		export PATH=$PATH:${JAVA_HOME}/bin:${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin:${ZK_HOME}/bin:${HIVE_HOME}/bin:${HBASE_HOME}/bin:${SQOOP_HOME}/bin
4. 验证sqoop安装是否成功
	[hadoop@node1 ~]$  sqoop help
		（输出结果）
		Warning: /home/hadoop/apps/sqoop-1.4.6/../hcatalog does not exist! HCatalog jobs will fail.
		Please set $HCAT_HOME to the root of your HCatalog installation.
		Warning: /home/hadoop/apps/sqoop-1.4.6/../accumulo does not exist! Accumulo imports will fail.
		Please set $ACCUMULO_HOME to the root of your Accumulo installation.
		18/12/18 02:51:27 INFO sqoop.Sqoop: Running Sqoop version: 1.4.6
		usage: sqoop COMMAND [ARGS]

		Available commands:
  		codegen            Generate code to interact with database records
  		create-hive-table  Import a table definition into Hive
  		eval               Evaluate a SQL statement and display the results
  		export             Export an HDFS directory to a database table
  		help               List available commands
  		import             Import a table from a database to HDFS
  		import-all-tables  Import tables from a database to HDFS
  		import-mainframe   Import datasets from a mainframe server to HDFS
 		job                Work with saved jobs
 		list-databases     List available databases on a server
 		list-tables        List available tables in a database
 		merge              Merge results of incremental imports
 		metastore          Run a standalone Sqoop metastore
 		version            Display version information

		See 'sqoop help COMMAND' for information on a specific command.
5. 设置 sqoop-1.4.6/conf 目录下配置文件
	[hadoop@node1 ~]$  cp sqoop-env-template.sh sqoop-env.sh
	[hadoop@node1 ~]$  vim sqoop-env.sh
		（以下是我的配置文件，仅供参考）
		#Set path to where bin/hadoop is available
		export HADOOP_COMMON_HOME=/home/hadoop/apps/hadoop-2.7.6
		#Set path to where hadoop-*-core.jar is available
		export HADOOP_MAPRED_HOME=/home/hadoop/apps/hadoop-2.7.6
		#set the path to where bin/hbase is available
		export HBASE_HOME=/home/hadoop/apps/hbase-1.2.6
		#Set the path to where bin/hive is available
		export HIVE_HOME=/home/hadoop/apps/apache-hive-2.3.2-bin
		#Set the path for where zookeper config dir is
		export ZOOCFGDIR=/home/hadoop/apps/zookeeper-3.4.10/conf
	[hadoop@node1 ~]$  vim sqoop-site.xml
		（不进行配置）
6. 复制需要的 jar 包到目录 sqoop-1.4.6/lib 下 
	（以下命令参考）
	[hadoop@node1 ~]$  cp $HADOOP_HOME/share/hadoop/common/hadoop-common-2.7.6.jar $SQOOP_HOME/lib
	拷贝mysql的驱动包到sqoop的lib下：
	[hadoop@node1 ~]$  cp mysql-connector-java-5.1.37-bin.jar $SQOOP_HOME/lib
	注意：mysql-connector-java-5.1.37-bin.jar这个包很有用
7.  验证：
	sqoop list-databases \
	--connect jdbc:mysql://localhost:3306/ \
	--username root \
	--password root

二、sqoop的使用

sqoop help
在linux中输入sqoop help：

Available commands:
  codegen            Generate code to interact with database records
  create-hive-table  Import a table definition into Hive
  eval               Evaluate a SQL statement and display the results
  export             Export an HDFS directory to a database table
  help               List available commands
  import             Import a table from a database to HDFS
  import-all-tables  Import tables from a database to HDFS
  import-mainframe   Import datasets from a mainframe server to HDFS
  job                Work with saved jobs
  list-databases     List available databases on a server
  list-tables        List available tables in a database
  merge              Merge results of incremental imports
  metastore          Run a standalone Sqoop metastore
  version            Display version information

See 'sqoop help COMMAND' for information on a specific command.

翻译：

codegen            		生成java代码  pojo
create-hive-table  		导入数据到hive表中
eval               
export             		导出
help               
import             		导入   关系型数据库----大数据平台
import-all-tables  		将库下的所有的表导入hdfs
import-mainframe   		Import datasets from a mainframe server to HDFS
job                		Work with saved jobs
list-databases     		显示所有数据库
list-tables        		显示所有表
merge              		Merge results of incremental imports
metastore          		Run a standalone Sqoop metastore
version            		版本信息

导入：
--connect				指定数据库链接url
--username				指定数据库的用户名
--password				指定数据库的密码
--table					指定要导出数据的mysql数据库表
-m						指定MapTask的个数
--target-dir			指定导出数据在HDFS上的存储目录
--fields-terminated-by	指定每条记录中字段之间的分隔符
--where					指定查询SQL的where条件
--query					指定查询SQL
--columns				指定查询列

功能

一、sqoop数据导入:
	help_keyword
	--connect  		mysql连接url
	--driver  		驱动  （不需要指定）
	--username   	mysql的用户名
	--password    	mysql的密码
	-m  			maptask的并行度

1) mysql  导入  hdfs   
	a) --table  用于指定mysql中的表
		sqoop import \
		--connect jdbc:mysql://localhost:3306/mysql \		mysql连接url
		--username root \								mysql的用户名
		--password 123456 \								mysql的密码
		--table help_keyword \							指定mysql中的表
		-m 2											maptask的并行度
		（默认路径：/user/hive/warehouse；默认的分割符：）
	b) --fields-terminated-by：指定分割符    --target-dir：指定存储路径
		sqoop import \
		--connect jdbc:mysql://localhost:3306/mysql \
		--username root \
		--password 123456 \
		--target-dir hdfs://bd1804/sqoop/target \			指定路径
		--fields-terminated-by '\t' \					指定分隔符
		--table help_keyword \
		-m 2
	c) 导出过滤条件的：select ....from....where：指定过滤条件
		sqoop import \
		--connect jdbc:mysql://localhost:3306/mysql \
		--username root \
		--password 123456 \
		--where "name='JOIN'" \							where 指定过滤条件
		--target-dir hdfs://bd1804/sqoop/target00 \
		--fields-terminated-by '\t' \
		--table help_keyword \							table 指定表
		-m 2
	d) sql语句进行导入：-e  --query指定sql语句   --split-by指定maptask的切分字段
		sqoop import   \
		--connect jdbc:mysql://localhost:3306/mysql  \
		--username root  \
		--password 123456   \
		--target-dir hdfs://bd1804/sqoop/target01  \
		--query "select help_keyword_id,name from help_keyword where \$CONDITIONS and name = 'JOIN'" \			指定sql语句
		--split-by  help_keyword_id \					指定maptask切分字段
		--fields-terminated-by '\t'  \					指定分隔符
		-m 4
		(注意：1. where过滤条件后面必须跟$CONDITIONS
		  	  2. 单引号$CONDITIONS  不需要转义   “”  $需要转义
		  	  3. --query和--table不可以同时使用
		另，注意点：1.--split-by对非数字类型的字段支持不好。一般用于主键
		及数字类型的字段。假设有一张表test，sqoop命令中--split-by 'id'，
		-m 10，会发生怎样奇特的事情。首先呢，sqoop会去查表的元数据等等，
		重点说一下sqoop是如何根据--split-by进行分区的。首先sqoop会向关系
		型数据库比如mysql发送一个命令:select max(id),min(id) from test。
		然后会把max、min之间的区间平均分为10分，最后10个并行的map去找数据
		库，导数据就正式开始啦！

)
	e) --where 和 --columns 一起使用，指定字段导入
		sqoop import   \
		--connect jdbc:mysql://localhost:3306/mysql   \
		--username root  \
		--password 123456   \
		--columns "name" \								指定字段导入
		--where "name='JOIN'" \
		--table help_keyword  \
		--target-dir hdfs://bd1804/sqoop/target03 \
		-m 3
2) mql  导入  hive
	(注意：Sqoop 导入关系型数据到 hive 的过程是先
	导入到 hdfs，然后再 load 进入 hive)
	a) 普通导入
		示例1：
		sqoop import \
		--connect jdbc:mysql://hadoop02:3306/mysql \
		--username root \
		--password root \
		--table help_keyword \
		--hive-import \
		-m 1
		（注意：导入数据到 hive 表，默认表在 default 库下，表名一样，采用'\u0001'分隔）
		示例2：
		sqoop import \
		--connect jdbc:mysql://hadoop02:3306/mysql \
		--username root \
		--password root \
		--table help_keyword \
		--fields-terminated-by "\t" \
		--lines-terminated-by "\n" \
		--hive-import \
		--hive-overwrite \
		--create-hive-table \
		--hive-table mydb_test.new_help_keyword \
		--delete-target-dir
		（注意：表会自动创建，但是库不会。所以在执行该语句之前，
		一定要确保 hive 的数据库mydb_test 是存在的，否则程序会报错）
	b）增量导入
		(增量导入是仅导入表中新添加的行的技术。它需要添加 'incremental'，
		'check-column', 和 'last-value' 选项来执行增量导入。下面的语法
		结构用于 Sqoop 导入命令增量选项。)
		示例：
		sqoop import \
		--connect jdbc:mysql://hadoop02:3306/mysql \
		--username root \
		--password root \
		--table help_keyword \
		--target-dir /user/hadoop/myimport3 \
		--incremental append \							指定增量导入
		--check-column help_keyword_id \					指定检查字段
		--last-value 500 \								增量导入的条件
		-m 1
		（此处结果不包含 help_keyword_id = 500 数据，数据是大于 500 的）
3）mysql  导入  hbase
	示例：
	sqoop import \
	--connect jdbc:mysql://hadoop02:3306/mysql \
	--username root \
	--password root \
	--table help_keyword \
	--hbase-table new_help_keyword \
	--column-family person \
	--hbase-row-key h
	字段解释：
	--connect jdbc:mysql://hadoop04:3306/mysql 		表示远程或者本地 Mysql 服务的 URI
	--hbase-create-table 							表示在 HBase 中建立表。
	--hbase-table new_help_keyword 					表示在 HBase 中建立表 new_help_keyword。
	--hbase-row-key help_keyword_id 					表示hbase表的rowkey是mysql表的help_keyword_id 字段
	--column-family person 							表示在表 new_help_keyword 中建立列族 person。
	--username 'root' 								表示使用用户 root 连接 mysql。	
	--password 'root' 								连接 mysql 的用户密码
	--table help_keyword 							表示导出 mysql 数据库的 help_keyword 表。


二、数据导出
1) hdfs  导入  mysql
	Export 常用参数：
		--direct 快速导入
		--export-dir  			HDFS 到处数据的目录
		-m,--num-mappers  		都少个 map 线程
		--table  				导出哪个表
		--call  				存储过程
		--update-key  			通过哪个字段来判断更新
		--update-mode 			插入模式，默认是只更新，可以设置为 allowinsert.
		--input-null-string 		字符类型 null 处理
		--input-null-non-string 	非字符类型 null 处理
		--staging-table 			临时表
		--clear-staging-table 	清空临时表
		--batch 				批量模式
	步骤：
	第一步：查看要导入mysql的数据：hadoop  dfs  -tail  文件名
	第二步：在mysql表中建表
	第三步：执行导出命令
		示例：
		sqoop export \
		--connect jdbc:mysql://hadoop02:3306/sqoopdb \
		--username root \
		--password root \
		--table sqoopstudent \
		--export-dir /sqoopdata \
		--fields-terminated-by ','
		（注意：如果导出数据到 mysql 出现乱码，那么请参考这个解决方案：
		https://my.oschina.net/u/559635/blog/498990）
2) hive  导入  mysql
	sqoop export \
	--connect jdbc:mysql://hadoop02:3306/sqoopdb \
	--username root \
	--password root \
	--table uv_info \
	--export-dir /user/hive/warehouse/uv/dt=2011-08-03 \
	--input-fields-terminated-by '\t
	（注意：其实跟直接导出 HDFS 数据到 MySQL 没什么两样）
3) Hbase  导入  mysql
	很遗憾，现在还没有直接的命令将 HBase 的数据导出到 MySQL，一般采用如下 3 种方法：
		1、将 Hbase 数据，扁平化成 HDFS 文件，然后再由 sqoop 导入
		2、将 Hbase 数据导入 Hive 表中，然后再导入 mysql
		3、直接使用 Hbase 的 Java API 读取表数据，直接向 mysql 导入，不需要使用 sqoop

原理解析

1）sqoop导入原理

我们能得出一个结论，sqoop 工具是通过 MapReduce 进行导入作业的，sqoop进行数据导入流程大致可以用下面文字描述：
	1、第一步，Sqoop 会通过 JDBC 来获取所需要的数据库元数据，例如，导入表的列名，数据类型等。
	2、第二步，这些数据库的数据类型(varchar, number 等)会被映射成 Java 的数据类型(String, int等)，根据这些信息，Sqoop 会生成一个与表名同名的类用来完成序列化工作，保存表中的 Stay hungry Stay foolish -- http://blog.csdn.net/zhongqi2513每一行记录。
	3、第三步，Sqoop 启动 MapReducer 作业
	4、第四步，启动的作业在 input 的过程中，会通过 JDBC 读取数据表中的内容，这时，会使用 Sqoop 生成的类进行反序列化操作
	5、第五步，最后将这些记录写到 HDFS 中，在写入到 HDFS 的过程中，同样会使用 Sqoop 生成的类进行反序列化

2）sqoop导出原理

Sqoop 进行数据导出，总体也是基于 mapreduce 任务。也可以描述为以下5步：
	1、第一步，sqoop 依然会通过 JDBC 访问关系型数据库，得到需要导出数据的元数据信息
	2、第二步，根据获取到的元数据的信息，sqoop 生成一个 Java 类，用来进行数据的传输载体。该类必须实现序列化和反序列化
	3、第三步，启动 mapreduce 作业
	4、第四步，sqoop 利用生成的这个 java 类，并行的从 hdfs 中读取数据
	5、第五步，每个 map 作业都会根据读取到的导出表的元数据信息和读取到的数据，生成一批 insert 语句，然后多个 map 作业会并行的向数据库 mysql 中插入数据
	（注意：所以，数据是从 hdfs 中并行的进行读取，也是并行的进入写入，那并行的读取是依赖 hdfs的性能，而并行的写入到 mysql 中，那就要依赖于 mysql 的写入性能了。）

附录

1）import的主要参数
	--connect     						jdbc连接地址
	--connection-manager      		连接管理者
	--driver      					驱动类
	--hadoop-mapred-home      				$HADOOP_MAPRED_HOME
	--help    									help信息
	-P     										从命令行输入密码
	--password      					密码
	--username      					账号
	--verbose    								打印信息
	--connection-param-file   			可选参数

	Argument ：     								Description ：
	--append     								添加到hdfs中已经存在的dataset
	--as-avrodatafile     						导入数据作为avrodata
	--as-sequencefile    		 				导入数据位SequenceFiles
	--as-textfile          						默认导入数据为文本
	--boundary-query      			创建splits的边界
	--columns      				选择列
	--direct             						使用直接导入快速路径
	--direct-split-size      					在快速模式下每n字节使用一个split
	--fetch-size      						一次读入的数量
	--inline-lob-limit      					最大数值 an inline LOB
	-m,--num-mappers      					通过实行多少个map，默认是4个，某些数据库8 or 16性能不错
	-e,--query      					通过查询语句导入
	--split-by      				创建split的列，默认是主键
	--table      					要导入的表名
	--target-dir      						HDFS 目标路径
	--warehouse-dir      					HDFS parent for table destination
	--where      					where条件
	-z,--compress     							Enable compression
	--compression-codec      					压缩方式，默认是gzip
	--null-string     				字符列null值
	--null-non-string      			非字符列null值

2）export主要参数
	--direct     								快速导入
		--export-dir      					HDFS到处数据的目录
	-m,--num-mappers      					都少个map线程
	--table      					导出哪个表
	--call      				存储过程
	--update-key      					通过哪个字段来判断更新
	--update-mode      					插入模式，默认是只更新，可以设置为allowinsert.
	--input-null-string      		字符类型null处理
	--input-null-non-string      	非字符类型null处理
	--staging-table      		临时表
	--clear-staging-table                     	清空临时表
	--batch                                     	批量模式


3）转义字符相关参数。
	Argument ：     								Description ：
	--enclosed-by      					设置字段结束符号
	--escaped-by      						用哪个字符来转义
	--fields-terminated-by      			字段之间的分隔符
	--lines-terminated-by      			行分隔符
	--mysql-delimiters             				使用mysql的默认分隔符: , lines: \n escaped-by: \ optionally-enclosed-by: '
	--op

实战

1. pg库导入hive
	#！/bin/bash
	source /etc/profile
	source ./bash_profile
	
	#connection info
	#数据库ip
	ip=10.20.129.20
	#数据库port
	port=1234
	#数据库名称
	db=dbname
	#DB账号
	username=username
	#密码
	password=password
	
	#pg数据库表名
	src_table=tablename
	#hive表数据库
	tar_db=spark_graphx
	#hives表表名
	tar_table=tablename
	#pg_connect
	connect=jdbc:postgresql://$ip:$port/$db
	
	echo "*******************run sqoop********************"
	sqoop  import "-Dorg.apache.sqoop.splitter.allow_text_splitter=true" \
	--connect  $connect \
	--username  $username \
	--password  $password \
	--query  "select * from $table where \$CONDITIONS" \    #一定要加上  where  \$CONDITIONS
	--delete-target-dir \
	--hive-database  $tar_db \
	--hive-table $tar_table \
	--hive-import \
	--target -dir /input/$tar_table \      #可以省略，为默认路径
	-m  10 \
	--split-by id
2. hive导入pg数据库
	#！/bin/bash
	source /etc/profile
	source ./bash_profile
	
	#connection info
	#数据库ip
	ip=10.20.129.20
	#数据库port
	port=1234
	#数据库名称
	db=dbname
	#DB账号
	username=username
	#密码
	password=password
	
	#pg数据库表名
	tar_table=tablename
	#hive表数据库
	src_db=spark_graphx
	#hives表表名
	src_table=tablename
	#pg_connect
	connect=jdbc:postgresql://$ip:$port/$db
	hdfspath=hdfs://aicrs/user/hive/warehouse
	hive_dbname=spark_graphx
	
	echo  "**********************想  pg  导入数据*****************************"
	sqoop export \
	--connect  $connect \
	--username  $username \
	--password  $password \
	--table  $tar_table \
	--export-dir  $hdfspath/spark_graphx.db/give_credit \
	--columns  "id,name,age" \     #为数据库中的字段名称
	--input-null-string  '\\\\N'  \
	--input-null-non-string  '\\\N' \
	--input-fields-terminated-by  "#" \
	-m 30
	（注意：hive导入到pg或mysql数据库中，需要在pg或mysql数据库中先建好表）

加：使用sqoop导mysql数据到hive中报错问题参考：
http://www.cnblogs.com/harrymore/p/9057096.html#_labelTop

sqoop从mysql导数据到hdfs，出现java.lang.ClassNotFoundException: Class QueryResult not found 无级程序员大数据 sqoop mysql hdfs
运行sqoop从postgresql/mysql导入数据到hdfs,结果出现如下错误：2025-07-1816:59:13,624INFOorm.CompilationManager:HADOOP_MAPRED_HOMEis/opt/datasophon/hadoop-3.3.3Note:/opt/sqoop/bin/QueryResult.javausesoroverridesadeprecat
大数据集成方案对比：Kafka vs Flume vs Sqoop AI天才研究院计算 AI大模型应用入门实战与进阶 Agentic AI 实战大数据 kafka flume ai
大数据集成方案对比：KafkavsFlumevsSqoop关键词：大数据集成、Kafka、Flume、Sqoop、流处理、批量迁移、日志收集摘要：在大数据生态中，数据集成是连接数据源与数据处理平台的关键环节。本文深度对比Kafka、Flume、Sqoop三大主流集成工具，从核心架构、技术原理、适用场景到实战案例展开系统性分析。通过数学模型量化性能差异，结合实际项目经验总结选型策略，帮助开发者根据业
大数据 ETL 工具 Sqoop 深度解析与实战指南
一、Sqoop核心理论与应用场景1.1设计思想与技术定位Sqoop是Apache旗下的开源数据传输工具，核心设计基于MapReduce分布式计算框架，通过并行化的Map任务实现高效的数据批量迁移。其特点包括：批处理特性：基于MapReduce作业实现导入/导出，适合大规模离线数据迁移，不支持实时数据同步。异构数据源连接：支持关系型数据库（如MySQL、Oracle）与Hadoop生态（HDFS、H
大数据ETL工具比较：Sqoop vs Flume vs Kafka AI天才研究院 AI人工智能与大数据大数据 etl sqoop ai
大数据ETL工具比较：SqoopvsFlumevsKafka关键词：大数据ETL、Sqoop、Flume、Kafka、数据迁移、日志采集、消息队列摘要：在大数据生态中，ETL（抽取-转换-加载）是数据价值挖掘的关键环节。不同业务场景对数据传输的实时性、可靠性、数据类型有差异化需求，催生了Sqoop、Flume、Kafka等特色鲜明的ETL工具。本文从核心架构、工作原理、性能指标、实战案例四个维度，
手把手教你玩转 Sqoop：从数据库到大数据的「数据搬运工」 AAA建材批发王师傅数据库 sqoop 大数据 hive hdfs
一、Sqoop是什么？——数据界的「超级搬运工」兄弟们，今天咱们聊个大数据圈的「搬运小能手」——Sqoop！可能有人会问：这玩意儿跟Flume啥区别？简单来说：Flume是专门搬日志数据的「快递员」而Sqoop是搬数据库数据的「搬家公司」它的名字咋来的？SQL+Hadoop，直接告诉你核心技能：在关系型数据库（比如MySQL）和Hadoop家族（HDFS、Hive、HBase）之间疯狂倒腾数据！核
常见的Dolphin Scheduler报错线条1 数据库
1.这个报错原因是因为工作流没有设置SQL类型2.这个报错是因为没有在ds中配置环境变量解决方法：将如下代码放到dolphinscheduler/bin/env/dolphinscheduler_env.sh中exportSQOOP_HOME=/opt/installs/sqoopexportPATH=$SQOOP_HOME/bin:$HADOOP_HOME/bin:$SPARK_HOME1/bi
从0到1掌握Sqoop：开启大数据迁移之旅 £菜鸟也有梦大数据基础 sqoop 大数据 hadoop
目录一、Sqoop初相识二、Sqoop诞生记三、探秘Sqoop架构与原理3.1架构解析3.2工作原理四、Sqoop安装与配置4.1前期准备4.2下载与解压4.3配置环境变量4.4修改配置文件4.5添加数据库驱动4.6验证安装五、Sqoop常用命令实操5.1导入命令详解5.1.1基本导入5.1.2指定目标目录5.1.3设置分隔符5.1.4增量导入5.2导出命令实操5.3其他实用命令六、Sqoop应用
六、Sqoop 导出 IvanCodes Sqoop教程 sqoop hadoop 大数据
作者：IvanCodes日期：2025年6月7日专栏：Sqoop教程ApacheSqoop不仅擅长从关系型数据库(RDBMS)向Hadoop(HDFS,Hive,HBase)导入数据，同样也强大地支持反向操作——将存储在Hadoop中的数据导出(Export)回关系型数据库。这在数据分析结果回写、数据仓库ETL、业务系统数据填充等场景中非常有用。一、Sqoop导出基础核心目标：将HDFS上的文件数
Hadoop复习（十）丸卜 hadoop 大数据分布式
Sqoop数据迁移问题1判断题2/2分实现数据导出操作时，需要提前在关系数据库创建对应的数据表正确错误问题2判断题2/2分Sqoop利用MapReduce实现数据导入时可以不涉及ReduceTask的处理正确错误问题3单项选择2/2分Sqoop底层使用_____实现数据的导入与导出MapReduceSparkHivesQLSQL问题4单项选择2/2分Sqoop主要用于在_____和______之间
四、Sqoop 导入表数据子集 IvanCodes Sqoop教程 sqoop hadoop 大数据
作者：IvanCodes日期：2025年6月4日专栏：Sqoop教程当不需要将关系型数据库中的整个表一次性导入，而是只需要表中的一部分数据时，Sqoop提供了多种方式来实现数据子集的导入。这通常通过过滤条件或选择特定列来完成。一、导入子集的核心方法主要通过以下两种参数组合实现：使用--table配合--where子句：这是最直接和常用的方式，用于从单个表中根据行级别的条件筛选数据。Sqoop会将-
如何获得sqoop-1.4.6.2.3.99.0-195.jar 斑鸠同学 sqoop jar atlas 编译
在编译atlas的时候，出现缺少依赖报错。源码里给的仓库已经无法下载。可以通过https://developer.aliyun.com/mvn/search来下载然后引入本地仓库即可。mvninstall:install-file\-Dfile=sqoop-1.4.6.2.3.99.0-195.jar\-DgroupId=org.apache.sqoop\-DartifactId=sqoop\-D
sqoop mysql导入hive报错_使用sqoop从mysql导入数据到hive weixin_39866881 sqoop mysql导入hive报错
前言这篇文章主要是用sqoop从mysql导入数据到hive时遇到的坑的总结。环境：系统：Centos6.5Hadoop：Apache，2.7.3Mysql：5.1.73JDK：1.8Sqoop：1.4.7Hadoop以伪分布式模式运行。一、使用的导入命令参照里面的方法，在mysql建了表，填充了数据，然后按照自己的情况输入了命令：sqoopimport--connectjdbc:mysql://
sqoop到数据到mysql报错_hadoop sqoop 同步hive数据到mysql报错 classnotfound Sinaean Dean
今天在CDH5.4.4环境下，用sqoop导出mysql数据，然后再导入hive，成功用sqoop同步hive数据到mysql失败，求大神答疑：1.hive下有一个表testamysql下有一个表testa结构一样2.版本hadoop2.6CDH5.4.4sqoop1.4.5-CDH5.4.4JDK1.7MySQL5.53.导数命令为sqoopexport-Dmapred.job.queue.na
大数据技术之Hadoop(十)——Sqoop数据迁移雨诺风大数据技术之Hadoop学习大数据 hadoop sqoop
目录一、Sqoop概述1、Sqoop认识2、Sqoop原理（1）导入原理（2）导出原理二、Sqoop安装配置1、下载安装2、MySQL配置启动3、配置Sqoop环境4、Sqoop效果测试三、Sqoop数据导入1、MySQL表数据导入HDFS2、MySQL表数据增量导入HDFS3、MySQL表数据导入Hive4、MySQL表数据子集导入四、Sqoop数据导出参考书籍一、Sqoop概述1、Sqoop认
假期数仓项目笔记 s_yellowfish 笔记 big data 数据库数据仓库
数仓项目笔记sqoop(将数据从传统关系型数据库导出到大数据平台上)测试Sqoop是否能够成功连接数据库bin/sqooplist-databases--connectjdbc:mysql://hadoop102:3306/--usernameroot--passwordxxxxxx(mysql密码)将mysql中gmall库的user_info表中id,login_name(1=1andidcr
基于Hive + Spark离线数仓大数据实战项目（视频+课件+代码+资料+笔记） AI方案2025 大数据 hive spark
精品推荐：基于Hive+Spark离线数仓大数据实战项目，共23节课，供学习参考。项目介绍项目中docker使用项目环境搭建项目数仓分层项目业务分析sqoop数据采集python数据采集项目ODS层创建DWD层构建DWS层构建项目回顾（一）DWB层构建项目回顾（二）ST层构建AirFlow架构解析AirFlow任务调度Spark核心概念回顾Prometheus架构说明监控插件安装Grafana使用
Apache Sqoop数据采集问题 Aimyon_36 Data Development apache sqoop hadoop
Sqoop数据采集格式问题一、Sqoop工作原理二、Sqoop命令格式三、Oracle数据采集格式问题四、Sqoop增量采集方案ApacheSqoop是一款开源的工具，主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql…)间进行数据的传递，可以将一个关系型数据库（例如：MySQL,Oracle,Postgres等）中的数据导进到Hadoop的HDFS中，也可以将HD
spark和Hadoop之间的对比和联系财神爷的心尖宠55 spark hadoop 大数据
Spark和Hadoop是大数据领域两个核心的开源框架，虽然功能有重叠，但设计理念和适用场景有显著差异。以下是它们的对比和联系：1.核心组件对比特性HadoopSpark诞生时间2006年（Apache）2014年（Apache）核心组件HDFS（存储）+MapReduce（计算）SparkCore（内存计算）扩展组件Hive,HBase,Pig,Sqoop等SparkSQL,MLlib,Grap
数据中台架构与技术体系 Aurora_NeAr 架构大数据
数据中台整体架构设计数据中台分层架构数据采集层数据源类型：业务系统（ERP、CRM）、日志、IoT设备、第三方API等。采集方式：实时采集：Kafka、FlinkCDC（变更数据捕获）。离线采集：Sqoop、DataX（批量同步数据库）。日志采集：Flume、Filebeat。数据缓冲与预处理：使用消息队列（如Kafka）作为缓冲区，应对数据流量峰值。数据存储层数据湖（DataLake）：存储原始
Hadoop项目结构及其主要作用张半仙掐指一算yyds 数据类 hadoop 大数据分布式
组件功能HDFS分布式文件系统MapReduce分布式并行编程模型YARN资源管理和调度器Tez运行在YARN之上的下一代Hadoop查询处理框架HiveHadoop上的数据仓库HBaseHadoop上的非关系型的分布式数据库Pig一个基于Hadoop的大规模数据分析平台，提供类似SQL的查询语言PigLatinSqoop用于在Hadoop与传统数据库之间进行数据传递OozieHadoop上的工作
大数据面试题目_综合面试_hadoop面试题_hive面试题_sqoop面试题_spark面试题_flume面试题_kafka面试题---大数据面试题007 添柴程序猿大数据 hadoop hive 大数据面试题 flume
大数据面试:1.说一下hadoop的集群部署模式有哪几种,完全分布式如何部署以及配置?2.hadoop的守护进程有哪些?2.之前的公司,为什么要离职?3.之前公司的待遇工资多少?4.用Flink处理过什么场景的业务,是如何实现的,说一下流程?5.有没有用过NIFI?6.做的时候后端是如何做的,用的什么框架?有没有了解过springcloudTencent?7.hadoop中的代理用户功能的作用,和
探索Hadoop生态圈：核心组件介绍放。756 hadoop 大数据分布式
Hadoop生态圈包括多个组件，如HDFS提供分布式存储，MapReduce处理大数据计算，YARN管理资源调度，HBase支持非结构化数据存储，Hive实现数据仓库功能，Pig提供高级数据流处理，Sqoop实现数据迁移，Flume处理日志收集等。这些组件共同构建起强大的大数据处理框架。
Sqoop-试题 minaMoonGirl sqoop hadoop hive
一、试题部分使用Sqoop导入工具，要求只追加导入检查列中时间晚于或等于last-value的记录，则incremental模式应该设置为____？A.mergeB.lastmodifiedC.last-valueD.appendsqoop导出采用调用模式时，以下说法正确的是？A.使用--call参数调用存储过程B.存储过程需要提前在hive中创建C.存储过程需要提前在hdfs中创建D.使用--c
大数据技术实战---项目中遇到的问题及项目经验一个“不专业”的阿凡大数据
问题导读：1、项目中遇到过哪些问题？2、Kafka消息数据积压，Kafka消费能力不足怎么处理？3、Sqoop数据导出一致性问题？4、整体项目框架如何设计？项目中遇到过哪些问题7.1Hadoop宕机（1）如果MR造成系统宕机。此时要控制Yarn同时运行的任务数，和每个任务申请的最大内存。调整参数：yarn.scheduler.maximum-allocation-mb（单个任务可申请的最多物理内存
Apache大数据旭哥优选大数据选题 Apache大数据旭大数据定制选题 java hadoop spark 开发语言 idea hive 数据库架构
定制旭哥服务，一对一，无中介包安装+答疑+售后态度和技术都很重要定制按需求做要求不高就实惠一点定制需提前沟通好怎么做，这样才能避免不必要的麻烦python、flask、Django、mapreduce、mysqljava、springboot、vue、echarts、hadoop、spark、hive、hbase、flink、SparkStreaming、kafka、flume、sqoop分析+推
MySQL 到 Hadoop：Sqoop 数据迁移 ETL Ice星空 ETL
文章目录ETL：Extract-Transform-Load数据迁移过程一、Extract数据抽取1.ODS：OperationalDataStore-可操作数据存储2.DW：DataWarehouse-数据仓库3.DM：DataMart-数据集市二、Transform数据清洗和转换1.数据清洗2.数据转换三、Load数据加载四、数据迁移方法1.Sqoop1.1MySQL->Hive1.1.1im
Sqoop安装部署愿与狸花过一生大数据 sqoop hadoop hive
ApacheSqoop简介Sqoop（SQL-to-Hadoop）是Apache开源项目，主要用于：将关系型数据库中的数据导入Hadoop分布式文件系统（HDFS）或相关组件（如Hive、HBase）。将Hadoop处理后的数据导出回关系型数据库。核心特性批量数据传输支持从数据库表到HDFS/Hive的全量或增量数据迁移。并行化处理基于MapReduce实现并行导入导出，提升大数据量场景的效率。自
hive 使用oracle数据库 sardtass hadoop hive 开源项目
hive使用oracle作为数据源，导入数据使用sqoop或kettle或自己写代码（淘宝的开源项目中有一个xdata就是淘宝自己写的）。感觉sqoop比kettle快多了，淘宝的xdata没用过。hive默认使用derby作为存储表信息的数据库，默认在哪启动就在哪建一个metadata_db文件放数据，可以在conf下的hive-site.xml中配置为一个固定的位置，这样不论在哪启动都可以了。
Hadoop相关面试题努力的搬砖人. java 面试 hadoop
以下是150道Hadoop面试题及其详细回答，涵盖了Hadoop的基础知识、HDFS、MapReduce、YARN、HBase、Hive、Sqoop、Flume、ZooKeeper等多个方面，每道题目都尽量详细且简单易懂：Hadoop基础概念类1.什么是Hadoop？Hadoop是一个由Apache基金会开发的开源分布式计算框架，主要用于处理和存储大规模数据集。它提供了高容错性和高扩展性的分布式存
大数据学习（67）- Flume、Sqoop、Kafka、DataX对比 viperrrrrrr 大数据学习 flume kafka sqoop datax
大数据学习系列专栏：哲学语录:用力所能及，改变世界。如果觉得博主的文章还不错的话，请点赞+收藏⭐️+留言支持一下博主哦工具主要作用数据流向实时性数据源/目标应用场景Flume实时日志采集与传输从数据源到存储系统实时日志文件、网络流量等→HDFS、HBase、Kafka等日志收集、实时监控、实时分析Sqoop关系型数据库与Hadoop间数据同步关系型数据库→Hadoop生态系统（HDFS、Hive、
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s

sqoop学习之路

前言

一、sqoop的安装

二、sqoop的使用

附录

实战

你可能感兴趣的:(Sqoop)