E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Sqoop列式存储
大数据面试通关手册 | ClickHouse基础&实践&调优全视角解析
它采用
列式存储
结构,可使用SQL语句实时生成数据分析报告,另外它还支持索引,分布式查询以及近似计算等特性,凭借其优异的表现,ClickHouse在各大互联网公司均有广泛地应用。
王知无(import_bigdata)
·
2023-01-07 15:38
大数据面试通关手册
数据库
大数据
sap
uefi
dbcp
Hadoop 3.2.1 +Hive+Hbase伪分布式集群搭建
根据实战安装步骤,详细描述hadoop3.2.1、hive3.1.2(包括mysql5.7)、zookeeper3.6、hbase2.2.4、flume1.9.0、
sqoop
1.4.7各组件安装步骤,记录过程中的各种坑
Ted丶
·
2023-01-06 11:09
伪分布式集群
hbase
hive
大数据
hadoop
hive
hbase
hadoop完全分布式集群+Win Eclipse+Hbase+Hive+Zookeeper+
Sqoop
+SPARK试验机平台
【申明】本文的编写是参考了数个Blog,并由本人亲身试验配置完成。为的是不忘却自己的配置过程,以便于及时恢复查看之用。最终会在配置完成之后提供虚拟机节点的百度云下载链接,供大家下载使用。注:更多资源及软件请W信关注“学娱汇聚门”之前一直用的Hadoop伪分布式的平台进行试验。今天突发奇想,想配个更为真实的模拟环境——hadoop完全分布式集群,在VMware下用三个虚拟机实现模拟3个物理节点。本人
Bentley-2012
·
2023-01-06 11:06
数据建模&数据挖掘
Hadoop
centos
hadoop1.2.1
完全分布式
hbase
eclipse
HIVE数据的压缩与存储格式
2.2压缩方式选择2.2.1Gzip压缩2.2.2Bzip2压缩2.2.3Lzo压缩2.2.4Snappy压缩2.3压缩参数配置3开启Map输出阶段压缩4开启Reduce输出阶段压缩5文件存储格式5.1
列式存储
和行式存储
巴涅波赫夫
·
2022-12-30 08:13
大数据
hive
hadoop
大数据
ClickHouse学习笔记
ClickHouse学习笔记前言基础入门版本
列式存储
vs行式存储行式存储,磁盘存储结构
列式存储
,磁盘存储结构列式储存的好处DBMS功能多样化引擎高吞吐写入能力数据分区与线程级并行主要配置文件数据类型数据库引擎
qq_道可道
·
2022-12-29 10:32
存储
数据库
big
data
clickhouse
大数据技术之ClickHouse
大数据技术之ClickHouse一、ClickHouse入门1.1、
列式存储
1.2、DBMS的功能1.3、多样化引擎1.4、高吞吐写入能力1.5、数据分区与线程级并行1.6、性能对比二、ClickHouse
用生命研发技术
·
2022-12-28 08:31
实施/运维
数据库
clickhouse
linux
监控
clickhouse 常用语法规则优化策略详解
一、前言在之前的文章中,我们了解到clickhouse作为一款
列式存储
数据库,查询性能非常高效,一方面与其自身的存储引擎设计有关,另一方面,在执行查询语句时,底层做了大量的语法规则的优化,本文将详细介绍
逆风飞翔的小叔
·
2022-12-28 08:57
clickhouse
clickhouse语法优化
clickhouse规则优化
clickhouse优化策略
做大数据开发一定要知道几个重要的框架和工具及知识点
目前大数据主要涉及Hadoop、HDFS、HBase、ClickHouse、Hive、
Sqoop
、Flume、Flink、ElasticSearch一大数据知识综合介绍大数据需要学什么?
神州永泰
·
2022-12-26 08:16
大数据
sqoop
hadoop
大数据
hadoop
hdfs
大数据实战项目 -- 离线数仓
一、数仓规划1.1集群规划技术选型位置框架数据采集传输Flume,Kafka,
Sqoop
,Logstash,DataX,数据存储MySql,HDFS,HBase,Redis,MongoDB数据计算Hive
L小Ray想有腮
·
2022-12-24 12:02
BigData
Hive+Spark离线数仓工业项目实战--环境构建(3)
项目环境配置根据需求实现项目环境配置实施-注意:所有软件Docker、Hadoop、Hive、Spark、
Sqoop
都已经装好,不需要额外安装配置,启动即可配置网络:如果你的VMNat网络不是88网段,
骨灰级收藏家
·
2022-12-24 12:56
Spark
hive
大数据
hive
spark
hadoop
比
Sqoop
功能更加强大开源数据同步工具DataX实战
文章目录概述定义与
Sqoop
对比框架设计支持插件核心架构核心优势部署基础环境安装从stream读取数据并打印到控制台读取MySQL写入HDFS读取HDFS写入MySQL执行流程概述定义DataX官网地址
IT小神
·
2022-12-24 12:24
大数据
数据库
sqoop
开源
大数据
Hive+Spark离线数仓工业项目实战--数仓设计及数据采集(1)
**==数据采集==**-核心1:实现自动化增量采集-核心2:
Sqoop
采集中的一个特殊问题以及解决方案数仓设计回顾-**目标**
骨灰级收藏家
·
2022-12-24 12:54
hive
大数据
Spark
hive
spark
hadoop
数仓设计
hive优化基础1
sethive.enforce.bucketing=true;设置reduce个数setmapreduce.job.reduces=3;hive表->orc和parquet-->ZLIB或snappyParquet是面向分析型业务的
列式存储
格式
大道独行之BIGDATA
·
2022-12-23 10:06
hive
hive
hadoop
Hive学习:数据仓库的建立
【实验名称】:数据仓库的建立【实验目的】:熟悉Linux系统、MySQL、Hadoop、HBase、Hive、
Sqoop
、R、Eclipse等系统和软件的安装和使用;了解大数据处理的基本流程;熟悉数据预处理方法
让头发掉下来
·
2022-12-20 08:36
#
Hive学习
数据仓库
hadoop
hive
大数据
【大数据存储技术】「#3」将数据从Hive导入到MySQL
文章目录准备工作安装Hive、MySQL和
Sqoop
Hive预操作启动MySQL、hadoop、hive创建临时表inner_user_log和inner_user_info使用
Sqoop
将数据从Hive
小手の冰凉
·
2022-12-20 08:34
【作业分享交流】
hive
mysql
大数据
离线数仓搭建_16_Azkaban全流程调度
文章目录17.0全流程调度17.1Azkaban部署17.2创建MySQL数据库和表17.3
Sqoop
导出脚本17.4全调度流程17.4.1数据准备17.4.2编写Azkaban工作流程配置文件17.4.3Azkaban
Fang GL
·
2022-12-19 18:00
#
离线数仓搭建
数据库
mysql
Azkaban
离线数仓
任务调度
技术总结
===============看好:1.SQL语言,如果SQL语言加到编程语言排行榜,肯定是第一.NoSQL带来的优点不足抵消SQL缺失带来的缺点.2.HPVertica数据仓库,X86硬件+MPP+
列式存储
weixin_33970449
·
2022-12-19 00:20
运维
数据库
前端
ViewUI
字节跳动数据平台技术揭秘:基于ClickHouse的复杂查询实现与优化
更多技术交流、求职机会、试用福利,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群ClickHouse作为目前业内主流的
列式存储
数据库(DBMS)之一,拥有着同类型DBMS难以企及的查询速度
字节数据平台
·
2022-12-18 08:12
大数据
升级JSONB
列式存储
,Hologres助力淘宝搜索2022双11降本增效!
在此背景下,阿里搜索推荐团队与Hologres深度合作,在技术上,通过将传统的TextArray升级为JSONB,并使用JSONB
列式存储
,相比去年双11实现查
aliyunhologres
·
2022-12-17 14:55
经典用户案例
数据仓库
大数据
数据库
好程序员分享Java转行大数据该怎么规划学习?
Java之后在学习大数据相对会轻松一些,主要是要分清你要先从那个方向入手大数据开发工程师,这个比较适合刚刚从Java转换过来的人员做,主要学习HDFS,MapReduce,Yarn,Hive,Flume,
Sqoop
好程序员IT
·
2022-12-17 10:47
Java学习资源
大数据培训
好程序员
好程序员
Java
大数据
升级JSONB
列式存储
,Hologres助力淘宝搜索2022双11降本增效!
在此背景下,阿里搜索推荐团队与Hologres深度合作,在技术上,通过将传统的TextArray升级为JSONB,并使用JSONB
列式存储
,相比去年双11实现查
·
2022-12-16 13:39
大数据搜索引擎sql
头歌
Sqoop
的安装与配置答案(共一关)
mkdir/appcd/opttar-zxvf
sqoop
-1.4.7.bin__hadoop-2.6.0.tar.gz-C/appcd/appmv
sqoop
-1.4.7.bin__hadoop-2.6.0
海浪~&
·
2022-12-15 01:05
sqoop
数据库
mysql
列存引擎 Tianmu 如何实现 Delete?| StoneDB 研发分享 #3
作者:李红建责编:宇亭在第一期研发分享中,我们解释了,为什么Tinamu作为一款
列式存储
引擎在初期不支持Delete功能的原因,然后对一些友商
列式存储
引擎的Delete方案进行了一些调研和总结,感兴趣的同学可以查看我们上一期的分享
·
2022-12-14 14:22
数据库mysql
【大数据入门核心技术-Ambari】(一)Ambari介绍
Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、Hbase、Zookeeper、
Sqoop
和Hcatalog等。
forest_long
·
2022-12-12 09:33
大数据技术入门到21天通关
大数据
ambari
hadoop
big
data
hdfs
26-ClickHouse使用、MergeTree的读写流程和六种常用表引擎
15.5.5数据存储1.
列式存储
理解数据文件以分区目录的形式被组织存放,所以在.bin文件中只会保存当前分区片段内的这一部分数据在MergeTree中,数据按列存储。
大数据下的画像人
·
2022-12-11 10:20
大数据
数据库
linux
大数据
ClickHouse 版本升级
前言作为面向OLAP领域的新一代产品,ClickHouse每个版本之间都有着显著不同,具有高效的数据读写性能(
列式存储
与压缩)、高效的数据处理性能(向量化计算、列式组织、指令优化)、灵活的计算扩展能力(
oldba.cn
·
2022-12-11 10:50
clickhouse
java
数据库
Sqoop
Sqoop
是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(Mysql、Oracle...)间进行数据的传递,可以将一个关系型数据库中的数据导入到Hadoop的HDFS中,也可以将HDFS
~O2
·
2022-12-10 14:40
大数据部署
sqoop
数据库
java
ORACLE 数据库表空间的管理以及IM
列式存储
与Non-CDB相比,CDB中的表空间主要有以下几个特点:一个永久表空间只能与一个容器相关联。在当前容器中创建表空间时,表空间将与该容器相关联。当CDB禁用本地UNDO模式时,CDB只能有一个活动的UNDO表空间,或者OracleRACCDB的每一个节点各有一个活动的UNDO表空间。当为CDB启用本地UNDO模式时,CDB中的每个容器都有子句的UNDO表空间。在ORACLERAC集群中,每个节点都
梦想家DBA
·
2022-12-06 16:22
DBA
数据库
oracle
hadoop2.6.0(单节点)下
Sqoop
-1.4.6安装与配置(数据读取涉及hadoop、hbase和hive)
下载
Sqoop
http://
sqoop
.apache.org/或http://archive-primary.cloudera.com/cdh5/cdh/5/(这个就是版本已经对应好了,不需去弄版本兼容问题了
weixin_33921089
·
2022-12-05 17:03
大数据
数据库
python
Hive/Hbase/
Sqoop
的安装教程
Hive/Hbase/
Sqoop
的安装教程HIVEINSTALL1.下载安装包:https://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-2.3.3/2
weixin_30535565
·
2022-12-05 17:32
大数据
java
数据库
大数据-玩转数据-
Sqoop
安装部署及应用
大数据-玩转数据-
Sqoop
安装部署及应用说明:
Sqoop
是apache旗下的一款”Hadoop和关系数据库之间传输数据”的工具导入数据import将MySQL,Oracle导入数据到Hadoop的HDFS
人猿宇宙
·
2022-12-05 17:58
hive
sqoop
hadoop
Sqoop
:
sqoop
简介及原理,安装配置
sqoop
,
sqoop
简单的使用案例,RDBMS导入数据到HDFS,Hive,HBase,Hive/HDFS导出到RDBMS,脚本打包,sqoo常用命令及参数
文章目录第1章
Sqoop
简介第2章
Sqoop
原理第3章
Sqoop
安装3.1下载并解压3.2修改配置文件3.3拷贝JDBC驱动3.4验证
Sqoop
3.5测试
Sqoop
是否能够成功连接数据库第4章
Sqoop
DougLeaMrConcurrency
·
2022-12-05 17:24
Hadoop生态体系
sqoop
sqoop安装部署
sqoop导入导出
sqoop命令
sqoop参数
hadoop-2.5.0,hbase,hive,pig,
sqoop
,zookeeper 集群安装
jdk-7u71-linux-x64.tar.gz3)Hive:apache-hive-0.13.1-bin.tar.gz4)Hbase:hbase-0.98.8-hadoop2-bin.tar.gz5)
Sqoop
帅气小马哥
·
2022-12-05 17:45
hadoop
hadoop集群配置
hadoop
linux
eclipse
安装
linux
mysql
安装
Hadoop2.3.0+Hbase0.96.1.1+Hive0.14.0+Zookeeper3.4.6+
Sqoop
1.99.3安装配置流程
Hadoop2.3.0+Hbase0.96.1.1+Hive0.14.0+Zookeeper3.4.6+
Sqoop
1.99.3安装配置流程linux环境:OracleLinuxServerrelease6.3
daytimemoon
·
2022-12-05 17:05
hadoop
hadoop
hbase
hive
sqoop
zookeeper
hudi详解并集成spark实现快照查询和增量读取数据
Hudi解决了我们那些痛点1.实时获取新增数据你是否遇到过这样的问题,使用
Sqoop
获取Mysql日志或则数据,然后将新增数
总写bug的程序员
·
2022-12-04 18:43
大数据
spark
hadoop
hdfs
子查询优化之 Semi-join 优化 | StoneDB 研发分享 #2
缘起StoneDB在
列式存储
引擎Tianmu的加持下,在大多数场景下相对MySQL都会有大幅性能提升。
·
2022-12-03 12:16
数据库mysql
数据仓库实践杂谈(十六)——渐变维
目录]第一章:概述第二章:整体数据分层第三章:整体实现框架第四章:元数据第五章:ETL第六章:数据校验第七章:数据标准化第八章:去重第九章:增量/全量第十章:拉链处理第十一章:分布式处理增量第十二章:
列式存储
第十三章
老程序员一叶知秋
·
2022-11-30 19:32
数据仓库实践
数据仓库
数据挖掘
大数据
数据分析
夸父追日——大数据技术原理与应用
数据采集:kafka、flume、
sqoop
数据存储:mysql、hbase、hive、hadoop数据处理与分析:hadoop、spark、flink数据可视化:superset、ApacheZeppelin
Azury0910
·
2022-11-30 05:42
笔记
spark
big
data
hadoop
面向OLAP的
列式存储
DBMS-13-[ClickHouse]的MergeTree表引擎原理解析
ClickHouse中最重要的表引擎:MergeTree的深度原理解析首先我们了解了MergeTree的基础属性和物理存储结构;接着,依次介绍了数据分区、一级索引、二级索引、数据存储和数据标记的重要特性;最后总结了MergeTree上述特性一起协同时工作过程。掌握了MergeTree即掌握了合并树系列表引擎的精髓,因为MergeTree本身也是一种表引擎。1概述表引擎是ClickHouse中的一大
皮皮冰燃
·
2022-11-30 00:55
ClickHouse
clickhouse
HDFS的文件存储格式以及HDFS异构存储和存储策略
HDFS文件存储格式丰富的存储格式行式存储优点:写入是一次性完成的,消耗的时间比
列式存储
少,并且能够保证数据的完整性缺点:数据读取过程中会产生冗余数据,如果只有少量数据,此影响可以忽略,数量较大可能会影响到数据的处理效率
不知落叶何时落
·
2022-11-29 16:42
Hadoop
大数据
hdfs
hdfs
大数据
hadoop
大数据实训项目
文章目录一、项目概况1、项目介绍2、项目要求3、爬取字段4、数据存储5、数据分析、转化、演示二、环境配置1、JDK2、Hadoop集群3、zookeeper4、hive5、
sqoop
6、flume三、爬取数据
3+2=小5?
·
2022-11-29 16:38
Vmware学习
快速了解HIVE文件存储格式
快速了解HIVE文件存储格式一
列式存储
和行式存储二TEXTFILE格式三SequenceFilea、SequenceFile优缺点b、SequenceFile格式1、未压缩格式2、基于record压缩格式
真香IT
·
2022-11-29 16:04
Linux
大数据
hive
hadoop
大数据
sqoop
学习
–
sqoop
1014––连接关系型数据库–
sqoop
list-databases--connectjdbc:mysql://localhost:3306/--usernameroot--password123456dropdatabase
sqoop
灯下夜无眠
·
2022-11-29 16:04
sqoop
sqoop
学习
hadoop
11.26学习笔记(hadoop)
SQL语句转化成MR作业执行(批量数据处理)PIG:流数据处理,轻量级数据分析Oozie:工作流管理工具Zookeeper:分布式协调一致性服务HDFS:分布式文件系统HBase:非关系型的分布式数据库
Sqoop
Rbdash
·
2022-11-27 22:21
hadoop
数据集成技术概述-常见的CDC方案比对
离线数据集成的主要开源技术:
Sqoop
、DataX。数据集成企业信息化建设中,有一个板块是企业应用集成,根据集成深度的不同,可以分为界面集成、数据集成、控制集成、业
IT转型指北
·
2022-11-27 21:40
大数据
hadoop
hive
项目需求及架构设计
采集用户行为数据使用的工具,需要提供详细的设计需求如:flume,flume采用的source、channel、sink以及flume代码的设计业务数据采集平台搭建将mysql中的业务数据导入到hive数仓中使用什么工具如:
sqoop
一马什么梅一
·
2022-11-26 13:10
学习记录
数据仓库
hive
大数据
Hive——解析Hadoop的压缩和文件存储格式
文章目录1.压缩配置1.1Hadoop的压缩编码方式1.2Map阶段压缩配置1.3Reduce阶段压缩配置2文件存储2.1行式存储和
列式存储
2.2存储格式说明2.3存储+压缩测试2.3.1存储测试2.3.2
皮皮皮皮皮皮皮卡乒
·
2022-11-26 09:02
#
Hive
hadoop
hive
大数据
Sqoop
导入数据报错:No columns to generate for ClassWriter
使用
Sqoop
导入数据报错信息如下:java.sql.SQLException:Streamingresultsetcom.mysql.jdbc18/09/0710:09:20INFOmanager.MySQLManager
zjh_746140129
·
2022-11-25 17:35
Sqoop
No
columns
to
generate
for
Cla
sqoop
工具报错:No columns to generate for ClassWriter报错真实原因
今天遇到这个错误,查了一下网上的答案五花八门,分析对比后结果发现,这个报错其实不是真正的报错。只是这段话刚好是报错代码的最后面,所以才被误以为这是一个独立的报错,这只是一类错误的统称,其实有很多不同的错误都会导致出现这个代码。java.io.IOException:NocolumnstogenerateforClassWriter比如:(1)由于mysql驱动mysql-connector-jav
lee_moonj
·
2022-11-25 17:26
hive
sqoop
hive
大数据分析-考试复习
HBase是分布式
列式存储
系统,记录按列族集中存放。HBase数据库的BlockCache缓存的数据块中,普通的数据块不一定能提高效率。视频监控数据属于非结构
SpriCoder
·
2022-11-24 11:22
大数据分析笔记
hadoop
数据分析
mapreduce
上一页
15
16
17
18
19
20
21
22
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他