E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop大数据sqoop
数据集成工具—
Sqoop
数据集成/采集/同步工具@目录数据集成/采集/同步工具
Sqoop
简介
Sqoop
安装1、上传并解压2、修改文件夹名字3、修改配置文件4、修改环境变量5、添加MySQL连接驱动6、测试准备MySQL数据登录
真好吃啊
·
2021-12-06 21:00
Ubuntu Docker安装并使用的方法
仓库进行安装安装DockerEngine-Community三、使用Shell脚本进行安装卸载docker二、创建容器五、Docker中搭建大数据环境安装MySQL安装JDK安装Hadoop安装Hive安装
Sqoop
DockerEngine-Community
·
2021-12-01 11:20
Hadoop入门一(3.2.2版本)
一.大数据广义大数据:以hadoop软件为主的生态圈(
Sqoop
、Flume、Spark、Flink、Hbase、Kafka和cdh环境)狭义大数据:hadoop软件本身,开源的(在gitlab上可以看到源代码和地址
jiangliu
·
2021-11-27 18:46
大数据面试题
大数据面试题一、Linux常用高级命令二、shell三、hadoop四、zookeeper五、flume(三件事)六、Kafka(23件事)七、hive八、
Sqoop
九、AzkabanoozieairflowDolphinScheduler
cpuCode
·
2021-11-24 19:15
面试题
hadoop
大数据
big
data
hdfs
分布式
各大技术基础教学、实战开发教学(最新更新时间2021-11-23)
一、
Hadoop大数据
Hadoop集群搭建(一)——Liunx网络、主机名配置,多台虚拟机的相互连通和远程登陆Hadoop集群搭建(二)——Linux系统SSH远程双向免密登陆Hadoop集群搭建(三)
Yuan-Programmer
·
2021-11-16 23:41
笔记
hadoop
大数据
android
python
java
各技术实战开发文章整合(持续更新~~)
一、Spring框架开发SpringBoot——第一个项目Spring项目——抵御跨站脚本(XSS)攻击Spring项目——Shiro和JWT技术二、
Hadoop大数据
开发Hadoop——集群搭建(步骤图文超详细版
HuiSoul
·
2021-11-12 00:50
开发笔记
python
大数据
微信小程序
爬虫
java
Hadoop——MapReduce相关eclipse配置及Api调用(图文超详细版)(内含遇到错误的解决方法)
一、前情提要前面两篇文章我们已经成功搭建了Hadoop以及安装了Hive,
Sqoop
和Mysql数据库,现在我们就来利用Hadoop尝试做一个小实战,实现单词统计!
HuiSoul
·
2021-11-10 00:34
Hadoop大数据实战
hadoop
mapreduce
大数据
sqoop
创建job报空指针异常解决方法
在/
sqoop
/lib目录下有一个叫hive-exec-3.1.2.jar的包把它删除替换为java-json.jar下载链接:链接:https://pan.baidu.com/s/1r6jSXKX1wCh6
@微笑男孩
·
2021-11-04 19:05
大数据Hadoop
sqoop
jar
hive
sqoop
job 定时实现增量、全量导入Hive
本人使用工具:Windows和虚拟机链接的工具为:MobaXtermWindows链接数据库工具:Navicat本人的数据库字段为:
sqoop
实现全量导入执行的语句为:
sqoop
import--connectjdbc
@微笑男孩
·
2021-11-04 19:50
大数据Hadoop
sqoop
hadoop
hive
Hadoop——安装MySQL、Hive以及
Sqoop
(步骤图文超详细版)
还没有搭建Hadoop,欢迎看看我前面的一篇文章:Hadoop集群搭建(步骤图文超详细版)目录一、前置条件二、安装Mysql三、安装Hive四、安装
Sqoop
一、前置条件需要安装下载方法Hive-1.2.1
HuiSoul
·
2021-10-27 15:39
Hadoop大数据实战
hadoop
hive
sqoop
sqoop
的简单使用
目录import传统关系型数据到导入到HDFS注意事项传统关系型数据到导入到HIVE提升关系型数据库导入到HIVE的执行效率传统关系型数据到导入到HBASEexport
sqoop
是一种数据集成工具,主要负责异构数据源的互相导入
啊帅和和。
·
2021-10-19 22:03
大数据专栏。
数据集成工具专栏。
mysql
big
data
hive
2021-10-17
Hadoop并不只是单单一个技术,而是一个生态圈,里面包括Spark、Flume、HBase、Kafka、
Sqoop
、Hive、Oozie、Azkaban、Zookeeper。
bingo fighting
·
2021-10-17 17:50
笔记
hadoop中hive与mapreduce小文件合并优化实操(超强详解!!!)
1.2-小文件的危害:2-解决方案实操2.1-解决方案12.2-解决方案22.3-解决方案33-总结扩展3.1-总结3.2-扩展(map任务数量的准确控制)1-背景公司数据治理过程中,发现apache
hadoop
KG大数据
·
2021-09-09 15:04
hive和数据仓库(离线)
hive
hadoop
big
data
数据仓库
面试
DataX、
sqoop
抽取TDSQL数据库中数据报Timeout的问题
由于此类问题虽然不常见,但是每次遇到排查都会花费大量的时间,整理整个case,供参考背景:客户报障他们只要一连接到TDSQL抽取数据,差不多10分钟左右就会出现超时中断,反复几次都不成功。连到MySQL却没有任何问题。排查过程:一、看到这个问题,确实比较懵,除了能看到客户用了我们的DCDB产品之外,不清楚发生了什么事。首先和客户确认,他们用的什么工具做的数据抽取,反馈是DataX。先了解一下Dat
·
2021-09-06 20:47
数据库
Lenovo x DorisDB:简化数据处理链路,极大提升 BI 分析效率
原始架构图:数据采集通过
Sqoop
读取RDBMS导入Hive。用Flume来同步日志文件到Hive。通过爬虫技术将网上数据爬取下来,存储到RDBMS,再由
Sqoop
读取RDBMS,导入到Hive。
·
2021-08-19 00:00
dev
教你如何使用FusionInsight
Sqoop
Shell
摘要:
Sqoop
-shell是一个Loader的shell工具,其所有功能都是通过执行脚本“
sqoop
2-shell”来实现的。
·
2021-08-10 18:04
Flume【基础知识 01】简介 + 基本架构及核心概念 + 架构模式 + Agent内部原理 + 配置格式(一篇即可入门Flume)
Flume跟
Sqoop
、Kettle有类似的地方但是又有不同,随后会详细分析。2基本架构及核心概念基本架构图【官网】:来自尚硅谷的资料,侵删,【
シ風
·
2021-08-08 20:45
:::
::
:
Flume
:
::
:::
flume
大数据
etl
big
data
Hudi自带工具DeltaStreamer的实时入湖最佳实践
背景传统大数据平台的组织架构是针对离线数据处理需求设计的,常用的数据导入方式为采用
sqoop
定时作业批量导入。随着数据分析对实时性要求不断提高,按小时、甚至分钟级的数据同步越
·
2021-08-02 15:09
大数据数据湖
硬核 |
Sqoop
入门指南
本篇文章,菌哥将介绍的一个操作最简单,同时也是在工作中使用频率极高的开源组件——
Sqoop
,希望您能在耐心看完之后,有所收获!首发链接:https://www.ebaina.com/
·
2021-07-27 19:26
大数据sqoop
hadoop集群部署之基础概念介绍(一)
Hadoop生态其实我们在做工业级的大数据框架部署的时候,所说的
hadoop大数据
部署通常指的是一整个生态,其中包括hadoop,spark,hive,hdfs,flink等,而不是单独指hadoop。
远方的旅行者
·
2021-07-25 16:10
hadoop
hadoop
大数据
分布式
数据规范
上游数据库:判断
sqoop
等同步工具返回状态,非“成功完成”状态,后续依赖任务不能启动。第三方同步:上游为非集团商业部,建议参考第上游上报规范,可与上游数据方
wgwtransfer
·
2021-06-24 20:57
Sqoop
拉取数据流程
具体执行流程如下:根据以上执行流程分别创建全量
sqoop
job,增量
sqoop
job具体语句如下:全量job
sqoop
job--createxxx_whole--import--connect"jdbc
姜和然
·
2021-06-24 15:26
oozie 5.1.0编译安装
二、oozie编译1、版本oozie:5.1.0hadoop:2.7.6hive:2.3.4
sqoop
:1.4.7hbase:1.2.92、oozie下载、环境变量设置下载:wgethttp://archive.apache.org
Bryan03
·
2021-06-24 06:16
大数据-架构分析
大数据基准测试工具HiBench开源的大数据调度系统Oozie数据采集数据库同步通常用
Sqoop
,
sqoop
import--connectjdbc:mysql://localhost/db--usernamefoo
JavaHub
·
2021-06-24 00:34
Driver源码分析
Dirver类在源代码中对于Driver的描述如下:/***
Sqoop
driverthatmanagesthejoblifecyle**All
Sqoop
internalsarehandledinthisclass
zjlearn
·
2021-06-23 00:20
大数据
sqoop
导入导出及环境变量配置
1,检查是否装了JDK,JDK版本建议(必须)在1.8或以上,如果没有装JDK,
sqoop
提交运行的时候,使用的jre会报错2,检查/etc/profile中有没有配置JDK的环境变量,如果没有配置,增加
玉面飞龙
·
2021-06-21 10:36
动态分区到ORC表OOM问题
解决动态分区textfile文件到ORC文件OOM问题1.问题描述在搭建数据仓库的过程中,在搬历史数据的过程中,先将Orace中的数据
sqoop
到textFile格式的HIVE表中,然后运行"Insert
朱佳宇
·
2021-06-20 17:34
Hadoop大数据
入门到实战(第二节) - 环境安装(centOS)
本小节,我们来安装Hadoop环境。远程连接工具为了安装环境我们需要先在Windows下安装一个远程连接的工具来连接Linux虚拟机。这款工具叫做SecureCRT,当然还有很多其他连接工具,不过我觉得这一款挺好用。官网下载地址(不免费):https://www.vandyke.com/download/securecrt/download.html你也可以用我这个:链接:https://pan.
MasterXiao
·
2021-06-14 18:49
数据采集与存储
时效性的要求比较宽松时,一个简单文件传输或者
Sqoop
任务适合作为采集数据的工具,HDFS适合作为主要存储位置。
徐梦磊
·
2021-06-12 02:35
sqoop
安装部署问题事项
postgresql...)间进行数据的传递,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中
sqoop
UpdateCw
·
2021-06-11 18:58
大数据平台HDP搭建
是一个基于Web的支持ApacheHadoop集群的供应、管理和监控的开源工具,Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、Hbase、Zookeeper、
Sqoop
kaliarch
·
2021-06-11 16:39
Sqoop
User Guide v1.4.6文档7.2.3. Free-form Query Imports翻译
Free-FormQueryImports7.2.3利用Query进行自定义Imports
Sqoop
也可以导入任意一个SQL查询结果。
gregocean
·
2021-06-11 02:37
oozie 工作流执行
sqoop
和spark
本次将
sqoop
和spark脚本相结合组成oozie工作流,通过定时计划任务,定期执行。
姜和然
·
2021-06-11 01:05
HBase BulkLoad批量写入数据
https://www.cnblogs.com/smartloli/p/9501887.html1.概述在进行数据传输中,批量加载数据到HBase集群有多种方式,比如通过HBaseAPI进行批量写入数据、使用
Sqoop
菜鸟乱撞
·
2021-06-09 19:50
51cto赵强HADOOP学习(十五)
sqoop
的导入导出
使用
sqoop
导入关系型数据库中的数据安装#cdtraining#tar-zxvf
sqoop
-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz#rm-rf
sqoop
-1.4.6.
lehuai
·
2021-06-09 18:00
面试题汇总:Hadoop
《面试了7家公司的Hadoop开发,居然都考了这8道题(
Hadoop大数据
)》8.《请查收:TOP25大常见Hadoop面试题及答案》9.《Hadoop100道面试题及
金字塔下的小蜗牛
·
2021-06-07 00:49
大数据平台CDH搭建
sDistributionIncludingApacheHadoop,简称“CDH”),基于Web的用户界面,支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、Hbase、Zookeeper、
Sqoop
kaliarch
·
2021-06-05 22:50
Apache Atlas元数据血缘关系(Lineage)功能研究_tomalun的专栏-CSDN博客
1、
sqoop
同步自动生成血缘数据
sqoop
同步MySQL数据库数据到hive,同步成功后,通过
sqoop
的AtlasHook自动生成血缘数据。
·
2021-06-01 17:00
2021年大数据基础(四):大数据业务分析基本步骤
目录大数据业务分析基本步骤明确分析目的和思路数据收集flume
sqoop
kettle数据处理-ETLMapReduceSpark数据分析HiveSQLSparkSQL数据展现报告撰写部门组织结构大数据业务分析基本步骤典型的大数据分析包含以下几个步骤
Lansonli
·
2021-05-22 21:35
大数据
大数据业务分析基本步骤
记一次
hadoop大数据
课设准备工作--hadoop集群搭建(三个结点)+Spark安装
【未完待续…】本次课设所使用的操作系统是华为的openEluer。主节点部署创建hadoop用户创建用户:sudouseradd-mhadoop-s/bin/bash设置密码,可简单设置为hadoop,按提示输入两次密码:sudopasswdhadoop密码统一设置为Aaaa1111@hadoop用户增加管理员权限,方便部署:sudoadduserhadoopsudo用hadoop用户登录su-h
wxl@
·
2021-05-19 19:28
大数据
mysql 导入数据到hdfs
CDH
Sqoop
Guide:http://archive.cloudera.com/cdh/3/
sqoop
/
Sqoop
UserGuide.html使用
Sqoop
实现HDFS与Mysql互转:https:
宝旭
·
2021-05-18 07:59
Hadoop大数据
环境搭建保姆级教程(完整版)
SSH免密登陆8、搭建虚拟机上的Hadoop环境9、配置jdk和Hadoop10、scp、xsync集群分发脚本11、修改核心配置文件12、启动集群13、Hadoop环境检测前言:找了全网关于mac配置
Hadoop
Jancydc
·
2021-05-16 22:04
Hadoop
hadoop
大数据
linux
mapreduce
jdk1.8
大数据离线业务场景中的增量技术
大数据离线业务场景中的增量技术业务需求离线实时增量全量增量采集方案Flume增量采集
Sqoop
增量采集append(按照某一列自增的int值)lastmodifield(按照数据变化的时间列的值)where
杀智勇双全杀
·
2021-05-16 20:47
云计算大数据
笔记
mysql
hive
hadoop
hdfs
shell
Hadoop大数据
入门到实战(第二节) - 环境安装(ubuntu)
本小节,我们来安装Hadoop环境。远程连接工具为了安装环境我们需要先在Windows下安装一个远程连接的工具来连接Linux虚拟机。这款工具叫做SecureCRT,当然还有很多其他连接工具,不过我觉得这一款挺好用。官网下载地址(不免费):https://www.vandyke.com/download/securecrt/download.html你也可以用我这个:链接:https://pan.
MasterXiao
·
2021-05-15 20:54
sqoop
导入数据到hbase,在phoenix创建视图和索引流程(一)
使用
sqoop
向hbase导入数据的时候,一般不要让
sqoop
自动创建表,那样不能控制表的属性信息,比如分区等。在导入数据之前,手动在hbase中创建相应的表。
cyclone_29
·
2021-05-15 15:45
知识点整理:
Sqoop
文章目录1
Sqoop
简介2
Sqoop
工作流程1
Sqoop
简介
Sqoop
是一个用于在Hadoop和关系数据库之间传输数据的工具将导入或导出命令翻译成MapReduce程序来并行操作和容错,在翻译出的MapReduce
_Charison
·
2021-05-14 19:10
面经整理
如何在 Hue 3.10 中提交
Sqoop
1 作业?
为什么使用
Sqoop
1而不是
Sqoop
2?
大数据之心
·
2021-05-14 03:54
Hadoop学习日志和资料
===========学习日志===========2017-04-28
Hadoop大数据
平台架构与实践|hadoop概述与安装Hadoop初探Hadoop安装2017-04-30
Hadoop大数据
平台架构与实践
拾壹北
·
2021-05-13 16:41
大数据与云计算整理
目录大数据大数据基础大数据概述大数据处理架构
Hadoop大数据
采集大数据存储分布式文件系统HDFS分布式数据库HBASENoSQL数据库云数据库大数据处理与分析MapReduceSpark流计算图计算数据可视化大数据应用云计算云概念云架构云组件云技术云端技术终端技术云安全信息管理与数据安全计算可用性互操作性和可移植性云应用云方案大数据大数据基础大数据概述数据产生方式经历的几个阶段运营式系统阶段用户
vircorns
·
2021-05-12 18:47
笔记
海量数据分流处理-------一致性哈希算法
大学时期做移动开发(ios),毕业后开始做大数据开发,到现在也为止也做过不少工程项目,掌握了不少我只认为是工具的东西,比如Hadoop中的HDFS、Mapreduce、Yarn、HBase、Hive、
Sqoop
狼牙战士
·
2021-05-12 16:04
上一页
14
15
16
17
18
19
20
21
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他