weixin_30535913

Sqoop 工具速查表（中文版）--转

Sqoop用户手册（英文版）：http://archive.cloudera.com/cdh/3/sqoop/SqoopUserGuide.html

1. 概述

本文档主要对SQOOP的使用进行了说明，参考内容主要来自于Cloudera SQOOP的官方文档。为了用中文更清楚明白地描述各参数的使用含义，本文档几乎所有参数使用说明都经过了我的实际验证而得到。

2. sqoop-import

将数据库表的数据导入到hive中，如果在hive中没有对应的表，则自动生成与数据库表名相同的表。

sqoop import –connect jdbc:mysql://localhost:3306/hive –username root –password 123456 –table user –split-by id –hive-import

–split-by指定数据库表中的主键字段名，在这里为id。

参数说明

–append 将数据追加到hdfs中已经存在的dataset中。使用该参数，sqoop将把数据先导入到一个临时目录中，然后重新给文件命名到一个正式的目录中，以避免和该目录中已存在的文件重名。

–as-avrodatafile 将数据导入到一个Avro数据文件中

–as-sequencefile 将数据导入到一个sequence文件中

–as-textfile 将数据导入到一个普通文本文件中，生成该文本文件后，可以在hive中通过sql语句查询出结果。

–columns 指定要导入的字段值，格式如：–columns id,username

–direct 直接导入模式，使用的是关系数据库自带的导入导出工具。官网上是说这样导入会更快

–direct-split-size 在使用上面direct直接导入的基础上，对导入的流按字节数分块，特别是使用直连模式从PostgreSQL导入数据的时候，可以将一个到达设定大小的文件分为几个独立的文件

–inline-lob-limit 设定大对象数据类型的最大值

-m,–num-mappers 启动N个map来并行导入数据，默认是4个，最好不要将数字设置为高于集群的节点数

–query，-e
从查询结果中导入数据，该参数使用时必须指定–target-dir、–hive-table，在查询语句中一定要有where条件且在where条件中需要包含$CONDITIONS，示例：

–query ‘select * from person where $CONDITIONS ‘ –target-dir /user/hive/warehouse/person –hive-table person

–split-by 表的列名，用来切分工作单元，一般后面跟主键ID

–table 关系数据库表名，数据从该表中获取

–target-dir 指定hdfs路径

–warehouse-dir 与–target-dir不能同时使用，指定数据导入的存放目录，适用于hdfs导入，不适合导入hive目录

–where 从关系数据库导入数据时的查询条件，示例：–where ‘id = 2′

-z,–compress 压缩参数，默认情况下数据是没被压缩的，通过该参数可以使用gzip压缩算法对数据进行压缩，适用于SequenceFile, text文本文件, 和Avro文件

–compression-codec Hadoop压缩编码，默认是gzip

增量导入

参数说明

–check-column (col) 用来作为判断的列名，如id

–incremental (mode) append：追加，比如对大于last-value指定的值之后的记录进行追加导入。lastmodified：最后的修改时间，追加last-value指定的日期之后的记录

–last-value (value) 指定自从上次导入后列的最大值（大于该指定的值），也可以自己设定某一值

3. sqoop-import-all-tables

将数据库里的所有表导入到HDFS中，每个表在hdfs中都对应一个独立的目录。

sqoop import-all-tables –connect jdbc:mysql://localhost:3306/test

sqoop import-all-tables –connect jdbc:mysql://localhost:3306/test –hive-import

参数说明

–as-avrodatafile

同import参数

–as-sequencefile

同import参数

–as-textfile

同import参数

–direct

同import参数

–direct-split-size

同import参数

–inline-lob-limit

同import参数

-m,–num-mappers

同import参数

–warehouse-dir

同import参数

-z,–compress

同import参数

–compression-codec

同import参数

4.sqoop-export

从hdfs中导数据到关系数据库中

sqoop export –connect jdbc:mysql://localhost:3306/hive –username root –password 123456 –table TBLS2 –export-dir sqoop/test

参数说明

–direct

快速模式，利用了数据库的导入工具，如mysql的mysqlimport，可以比jdbc连接的方式更为高效的将数据导入到关系数据库中。

–export-dir

存放数据的HDFS的源目录

-m,–num-mappers

启动n个map来并行导入数据，默认是4个，最好不要将数字设置为高于集群的最大Map数

–table

要导入到的关系数据库表

–update-key

后面接条件列名，通过该参数，可以将关系数据库中已经存在的数据进行更新操作，类似于关系数据库中的update操作

–update-mode

更新模式，有两个值updateonly和默认的allowinsert，该参数只能是在关系数据表里不存在要导入的记录时才能使用，比如要导入的hdfs中有一条id=1的记录，如果在表里已经有一条记录id=2，那么更新会失败。

–staging-table

该参数是用来保证在数据导入关系数据库表的过程中事务安全性的，因为在导入的过程中可能会有多个事务，那么一个事务失败会影响到其它事务，比如导入的数据会出现错误或出现重复的记录等等情况，那么通过该参数可以避免这种情况。创建一个与导入目标表同样的数据结构，保留该表为空在运行数据导入前，所有事务会将结果先存放在该表中，然后最后由该表通过一次事务将结果写入到目标表中

–clear-staging-table

如果该staging-table非空，则通过该参数可以在运行导入前清除staging-table里的数据

–batch

该模式用于执行基本语句（暂时还不太清楚含义）

5.sqoop-job

用来生成一个sqoop的任务，生成后，该任务并不执行，除非使用命令执行该任务。

sqoop job

参数说明

–create

生成一个job，示例如：sqoop job –create myjob — import –connectjdbc:mysql://localhost:3306/test –table person

–delete

删除一个jobsqoop job –delete myjob

–exec

执行一个jobsqoop job –exec myjob

–help

显示帮助说明

–list

显示所有的jobsqoop job –list

–meta-connect

用来连接metastore服务，示例如：–meta-connect jdbc:hsqldb:hsql://localhost:16000/sqoop

–show

显示一个job的各种参数sqoop job –show myjob

–verbose

打印命令运行时的详细信息

6.sqoop-metastore

记录sqoop job的元数据信息，如果不启动metastore实例，则默认的元数据存储目录为：~/.sqoop，如果要更改存储目录，可以在配置文件sqoop-site.xml中进行更改。

metastore实例启动：sqoop metastore

参数说明

-shutdown 关闭一个运行的metastore实例

7.sqoop-merge

将HDFS中不同目录下面的数据合在一起，并存放在指定的目录中，示例如：

sqoop merge –new-data /test/p1/person –onto /test/p2/person –target-dir /test/merged –jar-file /opt/data/sqoop/person/Person.jar –class-name Person –merge-key id

其中，–class-name所指定的class名是对应于Person.jar中的Person类，而Person.jar是通过Codegen生成的

参数说明

–new-data Hdfs中存放数据的一个目录，该目录中的数据是希望在合并后能优先保留的，原则上一般是存放越新数据的目录就对应这个参数。

–onto

Hdfs中存放数据的一个目录，该目录中的数据是希望在合并后能被更新数据替换掉的，原则上一般是存放越旧数据的目录就对应这个参数。

–merge-key

合并键，一般是主键ID

–jar-file

合并时引入的jar包，该jar包是通过Codegen工具生成的jar包

–class-name

对应的表名或对象名，该class类是包含在jar包中的

–target-dir

合并后的数据在HDFS里的存放目录

8.sqoop-codegen

将关系数据库表映射为一个java文件、java class类、以及相关的jar包，作用主要是两方面：

1、将数据库表映射为一个Java文件，在该Java文件中对应有表的各个字段。

2、生成的Jar和class文件在metastore功能使用时会用到。

基础语句：

sqoop codegen –connect jdbc:mysql://localhost:3306/hive –username root –password 123456 –table TBLS2

参数说明

–bindir

指定生成的java文件、编译成的class文件及将生成文件打包为JAR的JAR包文件输出路径

–class-name 设定生成的Java文件指定的名称

–outdir 生成的java文件存放路径

–package-name 包名，如cn.cnnic，则会生成cn和cnnic两级目录，生成的文件（如java文件）就存放在cnnic目录里

–input-null-non-string 在生成的java文件中，可以将null字符串设为想要设定的值（比如空字符串’’）

–input-null-string 同上，设定时，最好与上面的属性一起设置，且设置同样的值（比如空字符串等等）。

–map-column-java 数据库字段在生成的java文件中会映射为各种属性，且默认的数据类型与数据库类型保持对应，比如数据库中某字段的类型为bigint，则在Java文件中的数据类型为long型，通过这个属性，可以改变数据库字段在java中映射的数据类型，格式如：–map-column-java DB_ID=String,id=Integer

–null-non-string 在生成的java文件中，比如TBL_ID==null?”null”:”"，通过这个属性设置可以将null字符串设置为其它值如ddd，TBL_ID==null?”ddd”:”"

–null-string 同上，使用的时候最好和上面的属性一起用，且设置为相同的值

–table 对应关系数据库的表名，生成的java文件中的各属性与该表的各字段一一对应。

9.sqoop-create-hive-table

生成与关系数据库表的表结构对应的HIVE表

基础语句：

sqoop create-hive-table –connect jdbc:mysql://localhost:3306/hive -username root -password 123456 –table TBLS –hive-table h_tbls2

参数说明

–hive-home

Hive的安装目录，可以通过该参数覆盖掉默认的hive目录

–hive-overwrite

覆盖掉在hive表中已经存在的数据

–create-hive-table

默认是false,如果目标表已经存在了，那么创建任务会失败

–hive-table

后面接要创建的hive表

–table

指定关系数据库表名

10.sqoop-eval

可以快速地使用SQL语句对关系数据库进行操作，这可以使得在使用import这种工具进行数据导入的时候，可以预先了解相关的SQL语句是否正确，并能将结果显示在控制台。

查询示例：

sqoop eval –connect jdbc:mysql://localhost:3306/hive -username root -password 123456 -query “SELECT * FROM tbls LIMIT 10″

数据插入示例：

sqoop eval –connect jdbc:mysql://localhost:3306/hive -username root -password 123456 -e “INSERT INTO TBLS2

VALUES(100,1375170308,1,0,’hadoop’,0,1,’guest’,'MANAGED_TABLE’,'abc’,'ddd’)”

-e、-query这两个参数经过测试，比如后面分别接查询和插入SQL语句，皆可运行无误，如上。

11.sqoop-list-databases

打印出关系数据库所有的数据库名

sqoop list-databases –connect jdbc:mysql://localhost:3306/ -username root -password 123456

12.sqoop-list-tables

打印出关系数据库某一数据库的所有表名

sqoop list-tables –connect jdbc:mysql://localhost:3306/zihou -username root -password 123456

13.sqoop-help

打印sqoop帮助信息

语句：sqoop help

14.sqoop-version

显示sqoop版本信息

语句：sqoop version

15.公共参数

Hive参数

参数说明

–hive-delims-replacement

用自定义的字符串替换掉数据中的\n, \r, and \01等字符

–hive-drop-import-delims

在导入数据到hive中时，去掉数据中\n,\r和\01这样的字符

–map-column-hive

生成hive表时，可以更改生成字段的数据类型，格式如：–map-column-hiveTBL_ID=String,LAST_ACCESS_TIME=string

–hive-partition-key

创建分区，后面直接跟分区名即可，创建完毕后，通过describe 表名可以看到分区名，默认为string型

–hive-partition-value

该值是在导入数据到hive中时，与–hive-partition-key设定的key对应的value值

–hive-home

Hive的安装目录，可以通过该参数覆盖掉默认的hive目录

–hive-import

将数据从关系数据库中导入到hive表中

–hive-overwrite

覆盖掉在hive表中已经存在的数据

–create-hive-table

默认是false,如果目标表已经存在了，那么创建任务会失败

–hive-table

后面接要创建的hive表

–table

指定关系数据库表名

数据库连接参数

参数说明

–connect

Jdcb连接url，示例如：–connect jdbc:mysql://localhost:3306/hive

–connection-manager

指定要使用的连接管理类

–driver

数据库驱动类

–hadoop-home

Hadoop根目录

–help

打印帮助信息

-P

从控制端读取密码

–password

Jdbc url中的数据库连接密码

–username

Jdbc url中的数据库连接用户名

–verbose

在控制台打印出详细信息

–connection-param-file

一个记录着数据库连接参数的文件

文件输出参数

用于import场景。

示例如：

sqoop import –connect jdbc:mysql://localhost:3306/test –username root –P –table person –split-by id –check-column id –incremental append –last-value 1 –enclosed-by ‘\”‘

–escaped-by \# –fields-terminated-by .

参数说明

–enclosed-by

给字段值前后加上指定的字符，比如双引号，示例：–enclosed-by ‘\”‘，显示例子：”3″,”jimsss”,”[email protected]”

–escaped-by

给双引号作转义处理，如字段值为”测试”，经过–escaped-by \\处理后，在hdfs中的显示值为：\”测试\”，对单引号无效

–fields-terminated-by

设定每个字段是以什么符号作为结束的，默认是逗号，也可以改为其它符号，如句号.，示例如：–fields-terminated-by.

–lines-terminated-by

设定每条记录行之间的分隔符，默认是换行，但也可以设定自己所需要的字符串，示例如：–lines-terminated-by ‘#’ 以#号分隔

–mysql-delimiters

Mysql默认的分隔符设置，字段之间以,隔开，行之间以换行\n隔开，默认转义符号是\，字段值以单引号’包含起来

–optionally-enclosed-by

enclosed-by是强制给每个字段值前后都加上指定的符号，而–optionally-enclosed-by只是给带有双引号或单引号的字段值加上指定的符号，故叫可选的。示例如：–optionally-enclosed-by ‘$’ 显示结果： $”hehe”,测试$

文件输入参数

对数据格式的解析，用于export场景，与文件输出参数相对应。

示例如：

sqoop export –connect jdbc:mysql://localhost:3306/test –username root –password 123456 –table person2 –export-dir /user/hadoop/person –staging-table person3 –clear-staging-table –input-fields-terminated-by ‘,’

在hdfs中存在某一格式的数据，在将这样的数据导入到关系数据库中时，必须要按照该格式来解析出相应的字段值，比如在hdfs中有这样格式的数据：

3,jimsss,[email protected],1,2013-08-07 16:00:48.0,”hehe”,测试

上面的各字段是以逗号分隔的，那么在解析时，必须要以逗号来解析出各字段值，如：–input-fields-terminated-by ‘,’

参数说明

–input-enclosed-by

对字段值前后有指定的字符，比如双引号的值进行解析：–input-enclosed-by ‘\”‘，数据例子：”3″,”jimsss”,”[email protected]”

–input-escaped-by

对含有转义双引号的字段值作转义处理，如字段值为\”测试\”，经过–input-escaped-by \\处理后，解析得到的值为：”测试”，对单引号无效。

–input-fields-terminated-by

以字段间的分隔符来解析得到各字段值，示例如：– input-fields-terminated-by,

–input-lines-terminated-by

以每条记录行之间的分隔符来解析得到字段值，示例如：–input-lines-terminated-by ‘#’ 以#号分隔

–input-optionally-enclosed-by

与–input-enclosed-by功能相似，与–input-enclosed-by的区别参见输出参数中对–optionally-enclosed-by的描述

转自子猴博客：http://www.zihou.me/html/2014/01/28/9114.html

转载于:https://www.cnblogs.com/conbein/p/3636077.html

Pulsar：网络足迹的扫描尖兵渗透小白鼠网络 php 开发语言
免责声明：该文章所涉及到的安全工具和技术仅做分享和技术交流学习使用，使用时应当遵守国家法律，做一位合格的白帽专家。使用本工具的用户需要自行承担任何风险和不确定因素，如有人利用工具做任何后果均由使用者承担，本人及文章作者还有泷羽sec团队不承担任何责任如本文章侵权，请联系作者删除B站红队公益课：https://space.bilibili.com/350329294学习网盘资源链接：https://
k8s 安装nfs_k8s共享存储之nfs weixin_39941732 k8s 安装nfs
特别说明：测试使用，不建议生产环境1、在master节点配置(node1)1)yum安装nfs#yum-yinstallnfs-utilsNFS的关键工具包括：主要配置文件：/etc/exports；NFS文件系统维护命令：/usr/bin/exportfs；共享资源的日志文件：/var/lib/nfs/*tab；客户端查询共享资源命令：/usr/sbin/showmount；端口配置：/etc/
Python数据分析与可视化研究阿尔法星球 python python 数据分析开发语言
Python数据分析与可视化研究摘要随着大数据和人工智能技术的飞速发展，Python数据分析与可视化技术已成为现代科学研究、企业决策等领域不可或缺的工具。本研究全面梳理了Python在数据分析与可视化领域的基本理论框架和关键技术，系统分析了Pandas、NumPy等核心数据分析库以及Matplotlib、Seaborn等可视化库的应用优势与特点。通过实际案例，本研究深入探讨了Python在数据清洗
Vue 全局自适应大小：使用 postcss-pxtorem 前端程序猿i vue.js postcss 前端
在现代前端开发中，响应式设计已经成为不可或缺的一部分。尤其是在移动设备的普及下，保证网页在各种屏幕尺寸下的显示效果变得尤为重要。Vue.js作为一个流行的前端框架，能够很方便地实现响应式设计。而在这方面，postcss-pxtorem是一个非常有用的工具，它可以将px单位自动转换为rem单位，从而实现更好的自适应布局。本文将介绍如何在Vue项目中使用postcss-pxtorem实现全局自适应大小
可以与 FastAPI 不分伯仲的 Python 著名的 Web 框架程序员小麦 fastapi python 前端服务器 excel 开发语言
正如你所理解的，任何领域都不可能停止进步，不断使用相同的工具意味着不思进取。这一点在信息技术领域，尤其是网络开发行业非常明显。关于网络框架，不论是Django和Flask等传统框架还是Python的新型高级框架，一直有着新的框架不断出现，它们正在挤掉传统和成熟的技术，它们特征更好、编码更方便、更简单、更快捷。众所周知的Pythonweb框架Django该网络框架是最流行的Python网络框架之一。
大模型管理工具：Ollama m0_37559973 大模型 Ollama 大模型管理工具
目录一、Ollama介绍二、Linux安装Ollama2.1一键安装2.2手动安装三、使用Ollama3.1配置模型下载路径3.2运行模型3.3常用命令四、模型管理4.1官方模型库4.2导入自定义模型五、RESTAPI六、WebUI一、Ollama介绍Ollama是一个基于Go语言开发的可以本地运行大模型的开源框架，同时提供RESTAPI管理和使用大模型。二、Linux安装Ollama2.1一键安
深入剖析C++中cin的原理、应用与进阶实践 stfun java microsoft 开发语言
一、引言1.1研究背景与目的在C++编程领域，cin作为标准输入流对象，扮演着举足轻重的角色，是实现程序与用户交互的关键工具。它允许程序从标准输入设备（通常是键盘）读取数据，并将其存储到程序变量中，为各类应用程序的开发提供了基础支持。从简单的控制台应用到复杂的系统软件，cin的身影无处不在，例如在学生成绩管理系统中，使用cin读取学生的各科成绩；在财务管理程序里，利用cin获取用户输入的财务数据等
探索Facebook实验项目：Robyn——跨平台应用性能监控框架周澄诗Flourishing
探索Facebook实验项目：Robyn——跨平台应用性能监控框架去发现同类优质开源项目:https://gitcode.com/在软件开发的世界里，性能监控是确保应用程序顺畅运行的关键一环。Facebook贡献了一个名为的开源项目，旨在提供一个跨平台的应用性能监控框架。本文将带你了解Robyn的核心特性、技术原理及应用场景，帮助你充分利用这个工具提升你的项目效能。项目简介Robyn是一个轻量级的
中国移动魔百盒CM311-1e(s)_S905L3SB芯片_2+16_安卓9_线刷固件包 fatiaozhang9527 机顶盒刷机固件电视盒子魔百盒刷机魔百盒固件移动魔百盒 adb android
中国移动魔百盒CM311-1e(s)_S905L3SB芯片_2+16_安卓9_线刷固件包线刷方法：（新手参考借鉴一下）1、准备好一根双公头USB线刷刷机线，长度30-50CM长度最佳，同时准备一台电脑，拆开盒子；2、电脑上安装好刷机工具AmlogicUSBBurningTool软件→打开软件→文件→导入烧录包→把【擦除flash】和【擦除bootloader】两项勾选先默认去掉（如不识别或进度条不
如何区分AI智能体、自动化工作流和PRA？霍格沃兹测试开发学社测试人社区人工智能自动化运维测试开发软件测试
在当今快速发展的技术时代，AI智能体、自动化工作流和PRA（ProcessRoboticAutomation，流程机器人自动化）正逐步成为推动企业效率提升的重要工具。这些概念看似相似，却有着本质的区别。作为软件测试领域的从业者，了解它们的特点和应用场景，不仅能帮助我们更高效地完成测试任务，还能为职业发展带来全新机会。什么是AI智能体？AI智能体（ArtificialIntelligenceAgen
配置管理工具和k8s功能重叠部分的优势比较大囚长容器技术运维人生容器云原生运维 kubernetes
通过自动化配置管理工具（如Ansible、Puppet、Chef）和应用内管理机制，也可以实现自动部署、扩缩容、负载均衡和故障恢复等功能。Kubernetes（K8s）在这些方面具有哪些独特的优势呢，尤其是在云原生环境和大规模分布式系统中。以下是对比分析：1.自动化配置管理工具的局限性自动化配置管理工具（如Ansible、Puppet、Chef）主要用于基础设施的配置管理和应用部署，但它们在某些方
深入剖析SolidWorks二维草图：三维设计的基石小白是昏头仔 python 开发语言
一、草图绘制工具基本绘图工具直线工具：这是最基础的绘图工具之一，通过简单的点击和拖动操作，用户能够绘制出各种直线段。在构建机械零件的基本框架时，直线工具十分常用。例如，绘制一个矩形的零件轮廓，只需依次点击四个顶点，即可快速勾勒出大致形状。而且，直线工具还支持连续绘制，用户可以不间断地绘制一系列首尾相连的直线，用于创建多边形等复杂形状。圆工具：用于创建圆形几何图形。在设计包含孔洞、圆形连接件或齿轮等
Ollama 完整教程：本地 LLM 管理、WebUI 对话、PythonJava 客户端 API 应用 web13765607643 java
随着大语言模型（LLM）的普及和应用场景的广泛扩展，Ollama提供了一个强大的本地LLM管理工具，支持WebUI对话功能，同时还为Python和Java提供了灵活的客户端API。本教程将详细介绍如何使用Ollama工具，涵盖从本地安装、模型管理、WebUI聊天界面到通过Python和Java进行集成的全方位应用。一、Ollama简介Ollama是一款用于本地运行大语言模型的工具，支持对LLM模型
用C在安卓手机上开发 zhumin726 c语言安卓
在安卓手机上进行C语言开发需要一些特定的工具和设置。通常，C语言用于编写安卓的底层代码，如性能关键的模块或与硬件直接交互的部分。我们可以使用AndroidNDK（NativeDevelopmentKit）来开发这些部分。以下是如何在安卓手机上使用C进行开发的详细步骤。工具和环境配置1.安装TermuxTermux是一个Android终端仿真器，可以让您在Android设备上运行Linux环境。我们
嵌入式基础篇--了解和搭建开发环境雯宝 microsoft
文章目录1.开发环境搭建2.LinuxC编程入门3.ARMV7和ARMV8架构4.ARM汇编5.BSP工程管理1.开发环境搭建1.虚拟机Vmware的安装：在PC主机下安装Linux系统，方便切换windows和Linux系统2.在虚拟机Vmware中安装Ubuntu操作系统：便于基于Linux系统的开发3.Ubuntu交叉编译工具链安装4.SourceInsight安装：用于在Windows下代
局域网IP扫描工具 IPScaner V1.23 小众独行分享快乐小程序 web app python javascript 网络协议
局域网IP扫描工具IPScaner是一个局域网内快速搜索IP是否在线的绿色小工具，并集成了多个网络调试工具，包括IP段扫描、端口扫描、windows命令、IP地址计算器、系统端口占用查看、修改本地IP、WIFI密码查看等工具。小众独行-分享快乐官网：xzdx.top链接：https://xzdx.top/#/pages/lib/lib?id=82777061
通过Ftrace实现高效、精确的内核调试与分析深度Linux 性能优化 linux LInux内核性能分析调试工具
虽然之前一直听说过ftrace，但从来没将它用在实战中，在一次客户排查问题中，遇到了比较奇怪的现象，一位精通内核的朋友建议使用ftrace来定位一下。虽然那一次并没有使用ftrace，但也让我觉得，后面我们势必要提供ftrace相关的工具帮助我们在线上定位问题，所以自己也决定重新学习使用下ftrace，当然也决定写一系列的相关出来，这里就先简单介绍下ftrace。一、Ftrace简介1.1Ftra
为AI聊天工具添加一个知识系统之65 详细设计之6 变形机器人及伺服跟随一水鉴天软件智能智能制造人工语言人工智能
本文要点要点三种“数”条件：necessaryconditionX-scale,sufficientconditionY-size,INUSconditionZ-score。带自己的下标。下标值范围：scale(水平)1~5,size（垂直）1~3，score（正交基）1~10。三个轴各自的运动规律（平移，竖划，旋转）给出由图形算法支持的具有伺服跟随能力的变形机器人。利用不同感觉器官发挥不同跟随能
Python 如何使用 Bert 进行中文情感分析程序员徐师兄 Python 入门专栏 python bert 开发语言情感分析
前言在自然语言处理（NLP）领域，情感分析是一个非常常见且重要的应用。情感分析通常用于识别文本中的情感，例如判断一条微博或评论是正面、负面还是中性。在过去的几年中，随着深度学习的发展，BERT（BidirectionalEncoderRepresentationsfromTransformers）模型迅速成为了处理自然语言的强大工具。BERT是一种基于Transformer架构的预训练模型，它能够
为AI聊天工具添加一个知识系统之49 “‘之47’和蒙板有关的术语”的腾讯云 AI 代码助手答问（部分）一水鉴天人工智能云计算
本文问题Q292、通过以上沟通，您对本项目（为AI聊天工具的使用者构建一个外挂知识系统）的蒙板（作为一般术语）是否就有了准确的认识？项目中使用Facet作为它的技术术语，您是否能清晰刻划出来呢？认识统一了我们就可以进入下一步了。Q293、Facet作文本项目的技术术语（本项目的全责技术代名词）Facet是一个知识库组件。重说：Facet作文本项目的技术术语（本项目的全面技术--全括责/权/利--代
Powershell语言的云计算萧澄华包罗万象 golang 开发语言后端
PowerShell与云计算：新时代的自动化管理工具在当今快速发展的信息技术时代，云计算已经成为企业和个人计算资源的主要选择。随着云服务的普及，如何高效地管理和自动化云环境中的资源，成为了IT管理员和开发者们面临的重要挑战。PowerShell作为一款强大的脚本语言和自动化框架，凭借其优秀的功能和灵活性，逐渐在云计算管理中扮演了不可或缺的角色。一、PowerShell简介1.1什么是PowerSh
【Python百日进阶-Web开发-Feffery】Day604 - 趣味dash_04：Excel转Pdf文件岳涛@泰山医院 Dash python excel 前端 dash
文章目录一、环境准备1.1初始化基础`Python+Dash`环境1.2本例中使用的第三方包二、本项目B站视频讲解三、页面效果四、项目源码一、环境准备1.1初始化基础Python+Dash环境CSDN文档参见：https://blog.csdn.net/yuetaope/article/details/129795264Bilibili视频参见：https://www.bilibili.com/v
selenium通过cookie实现自动登录 Zds丶小顺顺 python 开发语言
原理很简单，首先手动完成登录后，把cookies保存到本地，下次再把cookies注入到浏览器里面，就自动实现了登录最近在学习写python的自动化脚本,但是发现测试工具打开之后的网页是没有用户自己打开浏览器时记录的cookie,简单来说也就是打开的网站不会自己登录,所以想要简单的实现下如何用cookie来登录总的来说分两步目录第一步，把cookies保存到本地第二步，把保存到本地的cookies
提升个人时间管理与工作效率的实用技巧时间管理工作效率个人时间管理
时间管理和工作效率是现代职场成功的关键。无论是在繁忙的工作中，还是在个人生活的平衡中，能够有效地管理时间和提高工作效率，都能显著提升个人的生产力和成就感。提升个人时间管理和工作效率的方法包括：制定明确的目标和优先级、合理规划日常时间、利用高效工具、避免拖延、保持专注、以及定期反思与调整工作方式。本文将深入探讨这些策略，并提供具体的实施方法，帮助你提升个人工作效率，并在有限的时间内达成更多的任务。一
项目管理遇到资源不足怎么办项目管理
在项目管理中，资源不足是一个常见且严峻的挑战。无论是人力资源、物资资源，还是时间资源的短缺，都可能导致项目进度受阻、质量下降，甚至最终无法按时交付。面对资源不足的情况，项目经理需要采取合理的策略和有效的方法，如优先级排序、资源重组、合理分配和工具支持等，以确保项目能够顺利推进并完成。在此过程中，选择合适的项目管理工具能够极大地提高资源利用率，帮助团队更高效地解决资源不足问题。一、明确资源短缺的根本
认识包管理工具： npm、yarn和pnpm 前端npm工程化
包管理工具的发展2010年1月，一款名为npm的包管理器诞生。它确立了包管理器工作的核心原则。npm的发布诞生了一场革命，在此之前，项目依赖项都是手动下载和管理的。npm引入了文件和元数据字段，将依赖项列表存储在package.json文件中，并且将下载的文件保存到node_modules文件夹中。后来因为npm的缺陷或者旧版本的不足，又出现了一个个替代npm来进行包管理的轮子，例如：yarn，y
CentOS6.8 使用 parted命令手动硬盘分区 GPT分区走向运维的老男孩 CentOS6 Linux基础知识 linux 运维服务器
环境虚拟机：VMware-10.0.7build-2844087Linux系统：CentOS6.8远程工具：Xshell6(Build0197)CentOS6.8使用parted命令手动硬盘分区GPT分区一、前言实际生产环境中，大于2.1个TB的硬盘较为多见，我们熟知的MBR分区表（主引导分区表）已无法完成分区的任务，此时我们要用另外一种分区表来解决此问题，即GPT分区表。二、GPT分区表2.1什
python+Selenium自动化之免登录(cookie及token) 觅远 python selenium 自动化
目录cookie免登录通过接口获取cookie启用浏览器绕过登录添加token使用登录可以减去每次登录的重复操作，直接操作系统登录后的菜单页面，也可以减少安全验证登录，如图像验证登录的操作。注意：cookie和token都有有效期。cookie免登录直接从开发者工具中获取cookie进行添加，下图为网页中多个站点的cookie，挑选需要的进行添加即可。fromseleniumimportwebdr
React 路由导航与传参详解疯狂小料 react.js 前端前端框架
随着单页面应用（SPA）已经成为主流。React作为最流行的前端框架之一，提供了强大的路由管理工具react-router-dom，帮助开发者轻松实现页面导航和传参。本文将详细介绍如何使用react-router-dom构建路由导航、传参以及嵌套路由的实现。1.构建路由导航1.1创建路由实例在React项目中，通常会在src目录下创建一个router文件夹来管理路由。我们可以使用react-rou
低代码教你克服数字化应用挑战的策略低代码
通过正确的方法，企业可以成功地克服复杂性，并从数字化中获益。数字技术的出现彻底改变了我们的生活和工作方式。从智能手机到社交媒体，数字工具在我们的日常生活中无处不在。对于许多个人和组织而言，采用数字技术可能是一个重大挑战。造成这些挑战的因素有很多，比如缺乏数字文化、基础设施陈旧和对变革的抵制。本文将探讨数字化应用的一些最重要的挑战以及克服这些挑战的策略。一、数字化应用的挑战是什么?为了充分利用新技术
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri

Sqoop 工具速查表（中文版）--转

1. 概述

2. `sqoop-import`

4.sqoop-export

5.sqoop-job

6.sqoop-metastore

7.sqoop-merge

8.sqoop-codegen

10.sqoop-eval

11.sqoop-list-databases

12.sqoop-list-tables

你可能感兴趣的:(Sqoop 工具速查表（中文版）--转)

参数	说明
–append	将数据追加到hdfs中已经存在的dataset中。使用该参数，sqoop将把数据先导入到一个临时目录中，然后重新给文件命名到一个正式的目录中，以避免和该目录中已存在的文件重名。
–as-avrodatafile	将数据导入到一个Avro数据文件中
–as-sequencefile	将数据导入到一个sequence文件中
–as-textfile	将数据导入到一个普通文本文件中，生成该文本文件后，可以在hive中通过sql语句查询出结果。
–columns	指定要导入的字段值，格式如：–columns id,username
–direct	直接导入模式，使用的是关系数据库自带的导入导出工具。官网上是说这样导入会更快
–direct-split-size	在使用上面direct直接导入的基础上，对导入的流按字节数分块，特别是使用直连模式从PostgreSQL导入数据的时候，可以将一个到达设定大小的文件分为几个独立的文件
–inline-lob-limit	设定大对象数据类型的最大值
-m,–num-mappers	启动N个map来并行导入数据，默认是4个，最好不要将数字设置为高于集群的节点数
–query，-e	从查询结果中导入数据，该参数使用时必须指定–target-dir、–hive-table，在查询语句中一定要有where条件且在where条件中需要包含$CONDITIONS，示例： –query ‘select * from person where $CONDITIONS ‘ –target-dir /user/hive/warehouse/person –hive-table person
–split-by	表的列名，用来切分工作单元，一般后面跟主键ID
–table	关系数据库表名，数据从该表中获取
–target-dir	指定hdfs路径
–warehouse-dir	与–target-dir不能同时使用，指定数据导入的存放目录，适用于hdfs导入，不适合导入hive目录
–where	从关系数据库导入数据时的查询条件，示例：–where ‘id = 2′
-z,–compress	压缩参数，默认情况下数据是没被压缩的，通过该参数可以使用gzip压缩算法对数据进行压缩，适用于SequenceFile, text文本文件, 和Avro文件
–compression-codec	Hadoop压缩编码，默认是gzip

参数	说明
–check-column (col)	用来作为判断的列名，如id
–incremental (mode)	append：追加，比如对大于last-value指定的值之后的记录进行追加导入。lastmodified：最后的修改时间，追加last-value指定的日期之后的记录
–last-value (value)	指定自从上次导入后列的最大值（大于该指定的值），也可以自己设定某一值

参数	说明
–create	生成一个job，示例如：sqoop job –create myjob — import –connectjdbc:mysql://localhost:3306/test –table person
–delete	删除一个jobsqoop job –delete myjob
–exec	执行一个jobsqoop job –exec myjob
–help	显示帮助说明
–list	显示所有的jobsqoop job –list
–meta-connect	用来连接metastore服务，示例如：–meta-connect jdbc:hsqldb:hsql://localhost:16000/sqoop
–show	显示一个job的各种参数sqoop job –show myjob
–verbose	打印命令运行时的详细信息

参数	说明
–new-data	Hdfs中存放数据的一个目录，该目录中的数据是希望在合并后能优先保留的，原则上一般是存放越新数据的目录就对应这个参数。
–onto	Hdfs中存放数据的一个目录，该目录中的数据是希望在合并后能被更新数据替换掉的，原则上一般是存放越旧数据的目录就对应这个参数。
–merge-key
合并键，一般是主键ID
–jar-file	合并时引入的jar包，该jar包是通过Codegen工具生成的jar包
–class-name	对应的表名或对象名，该class类是包含在jar包中的
–target-dir	合并后的数据在HDFS里的存放目录

参数	说明
–bindir	指定生成的java文件、编译成的class文件及将生成文件打包为JAR的JAR包文件输出路径
–class-name	设定生成的Java文件指定的名称
–outdir	生成的java文件存放路径
–package-name	包名，如cn.cnnic，则会生成cn和cnnic两级目录，生成的文件（如java文件）就存放在cnnic目录里
–input-null-non-string	在生成的java文件中，可以将null字符串设为想要设定的值（比如空字符串’’）
–input-null-string	同上，设定时，最好与上面的属性一起设置，且设置同样的值（比如空字符串等等）。
–map-column-java	数据库字段在生成的java文件中会映射为各种属性，且默认的数据类型与数据库类型保持对应，比如数据库中某字段的类型为bigint，则在Java文件中的数据类型为long型，通过这个属性，可以改变数据库字段在java中映射的数据类型，格式如：–map-column-java DB_ID=String,id=Integer
–null-non-string	在生成的java文件中，比如TBL_ID==null?”null”:”"，通过这个属性设置可以将null字符串设置为其它值如ddd，TBL_ID==null?”ddd”:”"
–null-string	同上，使用的时候最好和上面的属性一起用，且设置为相同的值
–table	对应关系数据库的表名，生成的java文件中的各属性与该表的各字段一一对应。

参数	说明
–hive-home	Hive的安装目录，可以通过该参数覆盖掉默认的hive目录
–hive-overwrite	覆盖掉在hive表中已经存在的数据
–create-hive-table	默认是false,如果目标表已经存在了，那么创建任务会失败
–hive-table	后面接要创建的hive表
–table	指定关系数据库表名

参数	说明
–hive-delims-replacement	用自定义的字符串替换掉数据中的\n, \r, and \01等字符
–hive-drop-import-delims	在导入数据到hive中时，去掉数据中\n,\r和\01这样的字符
–map-column-hive	生成hive表时，可以更改生成字段的数据类型，格式如：–map-column-hiveTBL_ID=String,LAST_ACCESS_TIME=string
–hive-partition-key	创建分区，后面直接跟分区名即可，创建完毕后，通过describe 表名可以看到分区名，默认为string型
–hive-partition-value	该值是在导入数据到hive中时，与–hive-partition-key设定的key对应的value值
–hive-home	Hive的安装目录，可以通过该参数覆盖掉默认的hive目录
–hive-import	将数据从关系数据库中导入到hive表中
–hive-overwrite	覆盖掉在hive表中已经存在的数据
–create-hive-table	默认是false,如果目标表已经存在了，那么创建任务会失败
–hive-table	后面接要创建的hive表
–table	指定关系数据库表名

参数	说明
–connect	Jdcb连接url，示例如：–connect jdbc:mysql://localhost:3306/hive
–connection-manager	指定要使用的连接管理类
–driver	数据库驱动类
–hadoop-home	Hadoop根目录
–help	打印帮助信息
-P	从控制端读取密码
–password	Jdbc url中的数据库连接密码
–username	Jdbc url中的数据库连接用户名
–verbose	在控制台打印出详细信息
–connection-param-file	一个记录着数据库连接参数的文件

参数	说明
–enclosed-by	给字段值前后加上指定的字符，比如双引号，示例：–enclosed-by ‘\”‘，显示例子：”3″,”jimsss”,”[email protected]”
–escaped-by	给双引号作转义处理，如字段值为”测试”，经过–escaped-by \\处理后，在hdfs中的显示值为：\”测试\”，对单引号无效
–fields-terminated-by	设定每个字段是以什么符号作为结束的，默认是逗号，也可以改为其它符号，如句号.，示例如：–fields-terminated-by.
–lines-terminated-by	设定每条记录行之间的分隔符，默认是换行，但也可以设定自己所需要的字符串，示例如：–lines-terminated-by ‘#’ 以#号分隔
–mysql-delimiters	Mysql默认的分隔符设置，字段之间以,隔开，行之间以换行\n隔开，默认转义符号是\，字段值以单引号’包含起来
–optionally-enclosed-by	enclosed-by是强制给每个字段值前后都加上指定的符号，而–optionally-enclosed-by只是给带有双引号或单引号的字段值加上指定的符号，故叫可选的。示例如：–optionally-enclosed-by ‘$’ 显示结果： $”hehe”,测试$

参数	说明
–input-enclosed-by	对字段值前后有指定的字符，比如双引号的值进行解析：–input-enclosed-by ‘\”‘，数据例子：”3″,”jimsss”,”[email protected]”
–input-escaped-by	对含有转义双引号的字段值作转义处理，如字段值为\”测试\”，经过–input-escaped-by \\处理后，解析得到的值为：”测试”，对单引号无效。
–input-fields-terminated-by	以字段间的分隔符来解析得到各字段值，示例如：– input-fields-terminated-by,
–input-lines-terminated-by	以每条记录行之间的分隔符来解析得到字段值，示例如：–input-lines-terminated-by ‘#’ 以#号分隔
–input-optionally-enclosed-by	与–input-enclosed-by功能相似，与–input-enclosed-by的区别参见输出参数中对–optionally-enclosed-by的描述

Sqoop 工具速查表（中文版）--转

1. 概述

2. sqoop-import

4.sqoop-export

5.sqoop-job

6.sqoop-metastore

7.sqoop-merge

8.sqoop-codegen

10.sqoop-eval

11.sqoop-list-databases

12.sqoop-list-tables

你可能感兴趣的:(Sqoop 工具速查表（中文版）--转)

2. `sqoop-import`