E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop大数据sqoop
基于
Hadoop大数据
分析应用场景与实战
一、Hadoop的应用业务分析大数据是不能用传统的计算技术处理的大型数据集的集合。它不是一个单一的技术或工具,而是涉及的业务和技术的许多领域。目前主流的三大分布式计算系统分别为:Hadoop、Spark和Strom:Hadoop当前大数据管理标准之一,运用在当前很多商业应用系统。可以轻松地集成结构化、半结构化甚至非结构化数据集。Spark采用了内存计算。从多迭代批处理出发,允许将数据载入内存作反复
Java大生
·
2023-04-20 00:47
hive学习笔记之二:复杂数据类型
:所有原创文章分类汇总及配套源码,涉及Java、Docker、Kubernetes、DevOPS等;《hive学习笔记》系列导航基本数据类型复杂数据类型内部表和外部表分区表分桶HiveQL基础内置函数
Sqoop
程序员欣宸
·
2023-04-19 09:43
大数据高级架构师-王明龙-KYLIN-DAY01-概述
ApacheKylin概述ApacheKylin是
Hadoop大数据
平台上的一个开源OLAP引擎。它采用多维立方体预计算技术,可以将大数据的SQL查询速度提升到亚秒级别。
IT灵魂摆渡者
·
2023-04-19 03:11
KYLIN
Pyspark_用户画像项目_1(数据通过
Sqoop
导入到Hive中)
Pyspark注:大家觉得博客好的话,别忘了点赞收藏呀,本人每周都会更新关于人工智能和大数据相关的内容,内容多为原创,PythonJavaScalaSQL代码,CVNLP推荐系统等,SparkFlinkKafkaHbaseHiveFlume等等~写的都是纯干货,各种顶会的论文解读,一起进步。今天继续和大家分享一下Pyspark_用户画像项目_1#博学谷IT学习技术支持文章目录Pyspark前言一、
陈万君Allen
·
2023-04-18 11:32
Pyspark系列
spark
python
大数据
数据仓库环境准备-Hadoop篇
大数据软件版本说明:hadoop-3.1.4、zookeeper-3.5.8、kafka_2.12-2.6.0、flume-1.9.0、
sqoop
-1.4.6、hive-3.1.2、mysql-5.7.31
枫叶无言_1997
·
2023-04-18 01:44
大数据项目---电商数仓(二)
一.Azkaban_工作流程安排二.Azkaban_部署_executor三.Azkaban_部署_web四.Azkaban_部署_启停脚本五.
Sqoop
_导出事项六.
Sqoop
_Mysql建表注意事项七
ASDWYang
·
2023-04-17 21:06
大数据
linux
大数据
mysql
数据库
实战大数据项目
存储日志数据集(HDFS)数据仓库构建(Hive)数据分区表构建数据预处理(Spark计算引擎)-使用Zeppelin进行写SQL订单指标分析
Sqoop
数据导出到传统数据库(Mysql)Superset
NeilNiu
·
2023-04-17 17:11
大数据
大数据
大数据知识点记录
大数据知识点记录_江湖行骗老中医的博客-CSDN博客HUE相当于Navicat的一个工具kudu(数据库)------>impalaHbase(数据库)------>HiveAzkaban调度------>job
sqoop
Jack_2085
·
2023-04-17 13:45
大数据
数据库
ACDC:开箱即用的多租户数据集成平台
技术团队最初使用Apache
Sqoop
以批的方式实现了这个能力。
万猫学社
·
2023-04-17 06:54
数据仓库
数据库
大数据
数据集成
平台
最新
hadoop大数据
零基础入门新手学习视频教程
最新在学习hadoop、storm大数据相关技术,发现网上hadoop、storm相关学习视频少之又少,我这里整理了传智播客段海涛老师的hadoop学习视频,给大家学习。视频下载地址:http://t.cn/EfRxlga-------------------课程目录-------------------第一天hadoop的基本概念伪分布式hadoop集群安装hdfsmapreduce演示01-h
山泥若丶
·
2023-04-16 16:39
大数据技术之DataX
DataX介绍2.1DataX概述第3章DataX架构原理3.1DataX的设计理念3.2DataX框架设计3.3DataX支持的数据源3.4DataX运行流程3.5DataX调度策略思路3.6DataX和
Sqoop
DK_521
·
2023-04-16 12:04
大数据
数据库
数据仓库
Sqoop
的安装和配置
概述以下内容来自百度百科:
Sqoop
(发音:skup)是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库
Dcl_Snow
·
2023-04-15 22:41
电商数仓学习-DataX的使用
DataX前言一、DataX简介1.DataX概述2.DataX支持的数据源二、DataX架构原理1.DataX设计理念2.DataX框架设计3.DataX运行流程4.DataX调度决策思路5.DataX和
Sqoop
自学大数据的菜鸡
·
2023-04-15 13:02
DataX
数仓同步工具
离线数仓
big
data
sqoop
:mysql2hive传输数据出现问题
传输代码
sqoop
import\--connectjdbc:mysql://bigdata30:3306/bigdata\--usernameroot\--password123456\--delete-target-dir
姚circle
·
2023-04-15 13:59
sqoop
hive
大数据
DataX 快速入门
Sqoop
:HDFS与RDBMS之间的数据迁移&同步DataX:上
珺王不早朝
·
2023-04-15 05:17
Hive数据导出详解
二、六大帮派1.insert2.Hadoop命令导出到本地3.Hiveshell命令导出4.export导出到HDFS上5.
Sqoop
导出6.清除表中的数据(Truncate)——删库跑路总结一、数据导出是什么
·
2023-04-14 22:13
sqoop
数据导入
创建数据库mysql全表数据导入hdfsmysql查询数据导入hdfsmysql指定列导入hdfs使用查询条件关键字将mysql数据导入hdfsmysql数据导入hive创建数据库hive中创建user表createtableusers(idbigint,namestring)rowformatdelimitedfieldsterminatedby"\t";mysql中创建user表并添加信息CR
open_test01
·
2023-04-13 20:38
Sqoop
sqoop
hive
mysql
sqoop
数据导出、脚本使用
目录准备表与数据数据导出脚本调用准备表与数据mysql表CREATETABLE`user`(`id`int(20),`name`varchar(20))ENGINE=INNODBDEFAULTCHARSET=utf8;hive表createtableusers(idbigint,namestring)rowformatdelimitedfieldsterminatedby"\t";数据导出在Sqo
open_test01
·
2023-04-13 20:38
Sqoop
hive
hadoop
大数据
sqoop
的介绍与安装
简介
Sqoop
是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如:MySQL,Oracle,Postgres
open_test01
·
2023-04-13 20:08
Sqoop
sqoop
hadoop
数据库
Hadoop家族学习路线图
原文:https://blog.csdn.net/it_man/article/details/14899905要介绍Hadoop家族产品,常用的项目包括Hadoop,Hive,Pig,HBase,
Sqoop
凯睿看世界
·
2023-04-13 14:06
8.
sqoop
-1.4.7安装部署
环境说明:主机名:cmcc01为例操作系统:centos7安装部署软件版本部署方式centos7zookeeperzookeeper-3.4.10伪分布式hadoophadoop-3.1.3伪分布式hivehive-3.1.3-bin伪分布式clickhouse21.11.10.1-2单节点多实例dolphinscheduler3.0.0单节点kettlepdi-ce-9.3.0.0单节点sqoo
Toroidals
·
2023-04-13 02:30
大数据组件安装部署教程
sqoop-1.4.7
安装部署
抽数演示
数据同步
sqoop
中导入数据和导出数据(内有每条语句的截图,一目了然)
sqoop
安装好后先测试一下[root@gree128conf]#
sqoop
version[root@gree128conf]#
sqoop
help[root@gree128conf]#
sqoop
helplist-databases
15-王井
·
2023-04-12 17:38
java
big
data
开发语言
小米技术分享:Mysql数据实时同步实践
早期业务借助
Sqoop
将Mysql中的数据同步到Hive来进
JavaShark
·
2023-04-10 21:48
mysql
数据库
hive
6、淘宝双11数据分析与预测
实验环境Java1.8HadoopHiveSpark
Sqoop
EchartsIntellijideaVMwareWorkstationUbuntu16.04实验内容对文本文件形式的原始数据集进行预处理把文本文件的数据集导入到数据仓库
温醉否忆
·
2023-04-10 00:39
spark
spark
淘宝双11实时数据分析项目报告
kafkaspark-streaming集成kafka编写并运行spark-streaming程序(实时词频统计)编写并运行spark-streaming程序(累加词频统计)在kafka上查看数据统计结果批量计算步骤往hive中导入数据
sqoop
阿坨
·
2023-04-10 00:28
数据分析
kafka
spark
hive
socketio
hadoop架构总结(三)
hadoop架构总结(三)摘自机械工业出版社出版的《
hadoop大数据
技术基础及应用》,个人学习总结。
苍鹰嘉措
·
2023-04-09 15:53
hadoop
yarn
时隔五年终于恢复了这个博客
回头看看上一篇文章还是5年前,那个时候自己还在对着
hadoop大数据
体系不断的折腾。五年过去了,自己也从大数据,迈向了云计算和AI的大潮中。最最近ChatGPT掀起来的浪潮,也最终"迫
wheel_Y
·
2023-04-09 10:47
hugo
blog
github
pages
【学习笔记】尚硅谷
Hadoop大数据
教程笔记
本文是尚硅谷Hadoop教程的学习笔记,由于个人的需要,只致力于搞清楚Hadoop是什么,它可以解决什么问题,以及它的原理是什么。至于具体怎么安装、使用和编写代码不在我考虑的范围内。一、Hadoop入门大数据的特点:Volume(大量)Velocity(高速)Variety(多样)Value(低价值密度)1.Hadoop概念是一个分布式系统基础架构2.Hadoop优势高可靠高扩展性高效性高容错性3
m0_67403013
·
2023-04-09 07:19
面试
学习路线
阿里巴巴
java
java进阶
后端
Hadoop组件
--------------------zooKeeper-------------------------------kafka-----------------------------------
sqoop
dianhe8193
·
2023-04-08 17:35
java
数据库
运维
关于数据中台的深度思考与总结
数据采集工具Canal、DataX、
Sqoop
数据开发数据开发模块主要面向开发人
ITFLY8
·
2023-04-08 12:21
数据库
大数据
hadoop
java
数据分析
大数据项目之电商数仓DataX、DataX简介、DataX支持的数据源、DataX架构原理、DataX部署
DataX简介1.1DataX概述1.2DataX支持的数据源2.DataX架构原理2.1DataX设计理念2.2DataX框架设计2.3DataX运行流程2.4DataX调度决策思路2.5DataX与
Sqoop
Redamancy_06
·
2023-04-08 09:14
#
电商数仓
大数据
架构
数据库
数据仓库
sqoop
的简易介绍
sqoop
简介Apache
Sqoop
是一个用于在ApacheHadoop和关系型数据库或主机之间传输数据的工具。
健鑫.
·
2023-04-08 07:56
大数据组件
sqoop
hadoop
数据库
【大数据开发】
sqoop
报错汇总
持续更新ing解决办法:删除该目录解决办法:cp/usr/local/hive/lib/hive-shims-*/usr/local/
sqoop
/lib/解决办法:cp/usr/local/hive/lib
这个妹妹我见过
·
2023-04-08 07:25
#
Sqoop
sqoop
数据仓库电商项目-整体架构
1.1技术选型数据采集:实时:flume-->kafka,DSG->kafka,离线:
sqoop
存储平台:底层存储HDFS,基础设施:hive(数据仓库基础设施)运算引擎:spark任务调度:azkaban
四月天03
·
2023-04-08 05:50
数仓电商项目
big
data
大数据
一文走进
hadoop大数据
技术生态!
一文走进
hadoop大数据
技术生态!
大唐有趣的小胡
·
2023-04-08 03:59
hadoop
大数据
hdfs
linux
运维
Hadoop大数据
框架研究(6)——Hadoop环境部署问题汇总
近期对hadoop生态的大数据框架进行了实际的部署测试,并结合ArcGIS平台的矢量大数据分析产品进行空间数据挖掘分析。本系列博客将进行详细的梳理、归纳和总结,以便相互交流学习。A.使用vim编辑文件时,保存提示:“Foundaswapfilebythename”原因:之前编辑此文件时出现未知异常,产生了一个*.swp文件,需要删除此隐藏文件才能继续操作目标文件。尤其是使用不同用户编辑同一文件。解
gisxy
·
2023-04-08 03:22
Hadoop
Linux
Hadoop
企业级
Hadoop大数据
平台实战(1)——认识Hadoop
文章目录一、什么是Hadoop二、Hadoop的优点三、核心架构四、HDFS交互关系五、Hadoop的常用模块六、HADOOP生态圈以及各组成部分的简介七、Hadoop的配置文件一、什么是HadoopHadoop是一个分布式系统基础架构,由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。Hadoop实现了一个分布式文件系统(Hado
CapejasmineY
·
2023-04-08 03:51
Linux企业实战
了解flume
sqoop
Flume是一个分布式的、高可靠的、高可用的将大批量的不同数据源的日志数据收集、聚合、移动到数据中心(HDFS)进行存储的系统1、可以高速采集数据,采集的数据能够以想要的文件格式及压缩方式存储在hdfs上;2、事务功能保证了数据在采集的过程中数据不丢失;3、部分Source保证了Flume挂了以后重启依旧能够继续在上一次采集点采集数据,真正做到数据零丢失。Agent是Flume中最小的独立运行单位
琳小小小
·
2023-04-07 18:13
虚拟机数据库专栏
flume
大数据
数据库
vm中
sqoop
的安装
下载、上传、解压、重命名和授权https://mirrors.tuna.tsinghua.edu.cn/apache/
sqoop
/1.4.7/
sqoop
-1.4.7.bin__hadoop-2.6.0.
琳小小小
·
2023-04-07 18:12
虚拟机数据库专栏
sqoop
hadoop
大数据
新手入门大数据,认识大数据学习路线
一、数据采集与预处理FlumeNGNDCLogstash
Sqoop
流式计算Zookeeper二、数据存储HBasePhoenixYarnMesosRedisAtlasKudu三、数据清洗OozieAzkaban
金光闪闪耶
·
2023-04-07 13:48
Sqoop
使用
Sqoop
概要
Sqoop
是Hadoop和关系数据库服务器之间传送数据的一种工具。链接各种DBMS到Hadoop的工具。
_oeo___
·
2023-04-07 02:53
sqoop
ERROR manager.CatalogQueryManager: Failed to list databases java.sql.SQLException: Access deni
在用
sqoop
连接Mysql查看Mysql数据库报错:20/04/1911:08:30ERRORmanager.CatalogQueryManager:Failedtolistdatabasesjava.sql.SQLException
SupAor
·
2023-04-06 16:04
sqoop
mysql
jdbc
java
数据库
大数据架构
阿里出品b)采用Framework+plugin架构构建,幸运的是自带了常用的插件,比如MysqlReader、HdfsWriter等c)Standalone,无中心,每个实例之间无关联d)性能强劲、相对于
sqoop
zhaoyang10
·
2023-04-06 16:47
大数据
hive hsql 漏斗模型_191_数仓项目_dwd层_Hive读取索引文件问题
Flume1.9+Kafka2.4.1+
Sqoop
1.4.7+MySQL5.7+Hadoop3.1.3+Hive3.1.2+Tez、Spark3.0.0+Ranger2.0+Presto+Kylin3.0
weixin_39746794
·
2023-04-05 14:31
hive
hsql
漏斗模型
sqoop
从安装到操作
一.
sqoop
的简单概论1.
sqoop
产生的原因:A.多数使用hadoop技术的处理大数据业务的企业,有大量的数据存储在关系型数据中。
人生之光荣在于屡仆屡起
·
2023-04-05 13:54
大数据
sqoop
hadoop
大数据
sqoop
hive启动mysql服务器_
sqoop
安装及初体验(hive配置mysql服务器)
先要安装mysql服务centos6.5可以直接用yum下载具体可参考https://mp.csdn.net/postedit/80139841这篇文章----------------------------------------------------------------------------------------------------------------------------
被击中的弹药架
·
2023-04-05 06:07
hive启动mysql服务器
flume安装配置与应用
若需要相应的其他工具的配置,详细请看《
hadoop大数据
生态圈工具配置与应用》文章目录1、flume安装配置2、初步自定义采集方案测试flume负载均衡测试案例日志采集1、flume安装配置解压出来,mv
侬本多情。
·
2023-04-05 03:24
#
flume
big
data
hadoop
企业级
Hadoop大数据
平台实战(1)——基础知识说明
1.什么是hadoop?Hadoop是一个由Apache基金会所开发的分布式系统基础架构用户可以在不了解分布式底层细节的情况下,开发分布式程序,充分利用集群的威力进行高速运算和存储Hadoop实现了一个分布式文件系统(HadoopDistributedFileSystem),简称HDFSHDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上而且它提供高吞吐量(highthro
温柔梦9527
·
2023-04-04 19:09
linux运维——企业实战
Hive:cannot be cast to org.apache.hadoop.io.XXXWritable 数据类型解决方案
使用
Sqoop
导数据经常出现数据类型异常,或在ETL过程中发现,类型不同查询不出。可通过查看Parquet的元数据,查看Parquet文件数据与Hive表是否一致。不一致时,对应字段相关处理。
CesarChoy
·
2023-04-04 18:40
数据仓库
2.东软跨境电商数仓项目技术选型
东软跨境电商数仓项目技术选型、框架版本选型、服务器选型、集群规划文章目录东软跨境电商数仓项目技术选型、框架版本选型、服务器选型、集群规划1.数据采集传输技术选型1.1DataX和
Sqoop
比较1.2Maxwell
Mmj666
·
2023-04-04 12:10
东软睿购跨境电商数仓项目
数据仓库
big
data
hive
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他