E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
HDFS
Doris数据备份及恢复
如BOS、
HDFS
等。可以通过SHOWBROKER;查看当前部署的
shangjg3
·
2023-12-06 08:48
Doris
大数据
数据仓库
doris
sql
spark不同结构Dataset合并
1.先将
hdfs
(或本地)存储的csv文件加载为Dataset先在本地C盘准备两个csv文件test.csvclient_id,behives,del,normal_status,cust_type,no_trd_days7056
容若只如初见
·
2023-12-06 07:03
spark
大数据
分布式
spark 写入 hudi时数据类型报错
Causedby:org.apache.spark.sql.execution.QueryExecutionException:Parquetcolumncannotbeconvertedinfile
hdfs
南城守护
·
2023-12-06 07:31
spark
大数据
分布式
使用 Apache Kafka 进行实时流处理
其架构更多地继承了
HDFS
、HBase或Cassandra等存储系统,而不是实现
wouderw
·
2023-12-06 05:37
apache
kafka
分布式
【读书笔记】《大数据技术体系详解:原理、架构与实践》03.分布式文件系统
这些文件形式的数据具有价值高、数据大、流式产生等特点,需要一个分布式文件系统存储它们,该文件系统应具有良好的容错性、扩展性和易用的API,而
HDFS
(HadoopDistributedFileSystem
粥一样温柔
·
2023-12-06 05:40
hive外部表分区
外部表和内部表内部表:数据由hive自身管理存储在hive指定的
hdfs
目录中删除会删除数据本身外部表(external):数据存储在用户使用location关键字指定的
hdfs
目录中hive中仅存储一份元数据删除操作不会影响到
nil_ddea
·
2023-12-06 00:54
Flink快速入门
分而治之批处理流处理-微信运动、信用卡月度账单、国家季度GDP增速MPI-节点间数据通信-c和pythonMR-2004谷歌提出的编程范式-hadoop/storm/spark/flinkHadoop-MR、
HDFS
WaiSaa
·
2023-12-05 21:30
Java
大数据
flink
大数据
Hadoop 概述
文章目录Hadoop概述Hadoop是什么Hadoop主要发展历程Hadoop优势Hadoop组成Hadoop1.x、2.x、3.x区别
HDFS
概述YARN概述MapReduce架构概述
HDFS
、YARN
撕得失败的标签
·
2023-12-05 19:59
Hadoop
hadoop
大数据
分布式
Hadoop生态圈
Apache Sqoop使用
Hadoop生态系统包括:
HDFS
、Hive、Hbase等RDBMS体系包括:MySQL、Oracle、DB2等Sqoop可以理
高过蓝天的云
·
2023-12-05 10:41
apache
sqoop
hadoop
大数据Hadoop集群的启动
1启动准备工作1.1配置操作系统的环境变量1.2创建Hadoop数据目录1.3格式化文件系统1.4启动和关闭Hadoop1.5验证Hadoop是否成功启动1.6hadoop-daemon.sh的使用2
HDFS
赵广陆
·
2023-12-05 08:13
hadoop
hadoop
big
data
hdfs
Hadoop
Hadoop生态系统是Apache基金会开发的分布式系统基础架构,它包括多个组件,如
HDFS
、MapReduce、Hive、HBase、Zookeeper等,这些组件可以相互兼容,组成了一个独立的应用体系
编织幻境的妖
·
2023-12-05 08:41
hadoop
大数据
分布式
7-
HDFS
的文件管理
单选题题目1:下列哪个属性是
hdfs
-site.xml中的配置?
阿伊同学
·
2023-12-05 06:06
hdfs
hadoop
大数据
Hadoop之YARN详解
Hadoop是一个开源的分布式计算框架,它的核心是
HDFS
和MapReduce。然而,随着Hadoop的发展,它的计算框架也在不断地演进。
蓝胖子的宝贝
·
2023-12-05 06:33
大数据技术分享
hadoop
mapreduce
大数据
Hadoop
Hadoop的基本架构包括以下几个核心组件:
HDFS
(HadoopDistributedFileSystem):它是一个高度容错性的分布式文件系统,能提供高吞吐量的数据访问,非常适合大规模数据集
编织幻境的妖
·
2023-12-05 06:31
hadoop
大数据
分布式
Hadoop的介绍与安装
Hadoop是由java语言编写的,在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架,其核心部件是
HDFS
与MapReduce。
憨憨小白
·
2023-12-05 06:30
hadoop
大数据
分布式
二百一十、Hive——Flume采集的JSON数据文件写入Hive的ODS层表后字段的数据残缺
一、目的在用Flume把Kafka的数据采集写入Hive的ODS层表的
HDFS
文件路径后,发现
HDFS
文件中没问题,但是ODS层表中字段的数据却有问题,字段中的JSON数据不全二、Hive处理JSON数据方式
天地风雷水火山泽
·
2023-12-05 06:19
Hive
hive
flume
hadoop
大数据技术学习笔记(四)——
HDFS
目录1
HDFS
概述1.1
HDFS
背景与定义1.2
HDFS
优缺点1.3
HDFS
组成架构1.4
HDFS
文件块大小2
HDFS
的shell操作2.1上传2.2下载2.3
HDFS
直接操作3
HDFS
的客户端操作3.1Windows
夏木夕
·
2023-12-05 05:18
#
大数据
大数据
笔记
hdfs
java
03-05-01 lua脚本
根据这些功能,可以实现的使用场景Nginx+lua读取redis:实现分布式session,秒杀限流等Nginx+lua读取
HDFS
:实现图片读取带来的问题基本命令安装启动一个nginx容器,进入执行命令
nan得糊涂
·
2023-12-05 05:30
CDH6下线DataNode节点
CDH6下线DataNode节点1.版本说明2.找到
HDFS
的实例3.解除授权4.重启集群5.注意事项1.版本说明我这里使用的是CDH6,更高版本请参考https://www.dandelioncloud.cn
真香IT
·
2023-12-05 04:01
大数据
hadoop
hdfs
大数据
DataNode
一个大数据架构师应该掌握的技能
APP分析平台mixpanelgrowingIO神策诸葛IO2.技术选型1)CDH2)HDP+HDF3)MAPR4)Transwarp3.平台架构1)HDPCore(平台核心也是Hadoopcore)
HDFS
潘永青
·
2023-12-05 02:13
大数据开发
hadoop
big
data
hive
HDFS
和本地文件系统文件互导
初步了解一下情况,后续根据给出案例一、从本地文件系统到
HDFS
使用
hdfs
自带的命令命令:
hdfs
dfs-copyFromLocalinputPathoutputPathinputPath:本地文件目录的路径
Blank_9c4f
·
2023-12-05 01:07
HDFS
运维问题
转自吐血整理|
HDFS
运维问题大全https://zhuanlan.zhihu.com/p/1704789651这次我吐血整理了一些在维护
hdfs
工作中遇到的问题,有的是血的教训,有的是花了不少功夫定位
专职掏大粪
·
2023-12-04 23:50
sqoop导入导出工具的使用以及通过java代码连接linux,远程执行shell命令
1、sqoop是apache开源提供的一个数据导入导出的工具,从关系型数据库导入到
hdfs
,或者从
hdfs
导出到关系型数据库等等导入数据:MySQL,Oracle导入数据到Hadoop的
HDFS
、HIVE
喵喵秀拌酱
·
2023-12-04 21:20
笔记
数据库
mysql
hadoop
大数据
大数据的技术栈-逐步完善
目录1.hadoopa.
HDFS
分布式文件系统b.Yarn集群资源管理器c.MapReducesql引擎d.Impalasql引擎e.工具概观2.数据仓库知识a.Hive数据库1)HiveSql2)数据库结构
刘文钊1
·
2023-12-04 20:12
大数据
大数据基础设施搭建 - 数据装载
文章目录一、概述二、数据装载(
HDFS
->Hive)2.1创建Hive表2.1.1业务全量表建表语句2.1.2业务增量表建表语句2.1.3流量增量表建表语句2.2数据装载2.2.1初始化装载省份和地区表
m0_46218511
·
2023-12-04 17:50
大数据基础设施搭建
大数据
数据装载
头歌大数据作业二:搭建Hadoop环境及
HDFS
课外作业二:搭建Hadoop环境及
HDFS
作业详情内容阿里云-云起实验室-《搭建Hadoop环境》-Hadoop-2.10.1伪分布式:1.截图本实验ECS的公网IP地址,并添加彩色框标注,如下图所示:
别叫哥喜羊羊
·
2023-12-04 15:42
hadoop
大数据
hdfs
(图文详细)云计算与大数据实训作业答案(之篇三
HDFS
和MapReduce实训 )
HDFS
和MapReduce实训第1关:WordCount词频统计第2关:
HDFS
文件读写第3关:倒排索引第4关:网页排序——PageRank算法
HDFS
和MapReduce实训Hadoop是一个由Apache
Sunny蔬菜小柠
·
2023-12-04 15:11
云计算与大数据
云计算与大数据实训作业答案
大数据生态圈及分布式文件系统
HDFS
实践-part1
Hadoop入门第一章大数据概述1.1大数据概念“人类正在从IT时代走向DT时代”。大数据(BigData):指的是传统数据处理应用软件不足以处理(存储和计算)它们的大而复杂的数据集。主要解决,海量数据的存储和海量数据的运算问题。1.2大数据特征容量大,种类多,速度快,价值高1、容量(Volume):数据的大小决定所考虑的数据的价值和潜在的信息微博,5亿用户,每天上亿条微博朋友圈,10亿用户,每天
落叶飘雪2014
·
2023-12-04 15:40
Hadoop
大数据
Hadoop
HDFS
大数据实训笔记3:
hdfs
HDFS
(HadoopDistributedFileSystem)是一个文件系统,用于存储文件,通过目录树来定位文件。它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。
Roslin_v
·
2023-12-04 15:39
hdfs
大数据
hadoop
Java操作
Hdfs
(分布式文件系统)完成文件上传、下载和删除
Java操作
Hdfs
(分布式文件系统)文件上传实现创建Maven项目,项目命名Hadoop_
hdfs
导入pom.xml依赖4.0.0hadoophadoop0.0.1-SNAPSHOThadoop_learnorg.apache.hadoophadoop-client3.2.0
菜鸟小党
·
2023-12-04 15:39
hadoop
hdfs
java
hadoop
HDFS
分布文件系统(1)Shell操作
/article/details/127170478文章目录一、三种Shell命令方式二、FileSystemShell文档三、常用Shell命令四、实例练习1、创建目录2、查看目录3、上传本地文件到
HDFS
4
Kox2021
·
2023-12-04 15:09
大数据
hdfs
hadoop
大数据
HDFS
和MapReduce综合实训:构建大数据处理应用
摘要:本文将介绍如何使用Hadoop分布式文件系统(
HDFS
)和MapReduce框架来构建大数据处理应用。
IbtnLisp
·
2023-12-04 15:09
hdfs
mapreduce
hadoop
【头歌实训】分布式文件系统
HDFS
文章目录第1关:
HDFS
的基本操作任务描述相关知识
HDFS
的设计分布式文件系统NameNode与DataNode
HDFS
的常用命令编程要求测试说明答案代码第2关:
HDFS
-JAVA接口之读取文件任务描述相关知识
撕得失败的标签
·
2023-12-04 15:08
【头歌实训】
hdfs
npm
hadoop
分布式
大数据
HADOOP::Fsimage和Edits解析
curent目录中产生如下文件fsimage_0000000000000000000fsimage_0000000000000000000.md5seen_txidVERSION(1)Fsimage文件:
HDFS
星星失眠️
·
2023-12-04 09:15
大数据开发技术
hdfs
大数据
hadoop
Presto基础学习--学习笔记
1,Presto背景2011年,FaceBook的数据仓库存储在少量大型hadoop/
hdfs
集群,在这之前,FaceBook的科学家和分析师一直靠hive进行数据分析,但hive使用MR作为底层计算框架
祈愿lucky
·
2023-12-04 09:21
大数据
学习
笔记
大数据
【大数据】区分
hdfs
dfs -ls 与
hdfs
dfs -ls /
区分
hdfs
dfs-ls与
hdfs
dfs-ls/1.
hdfs
dfs-ls
hdfs
dfs-ls表示
HDFS
中的当前用户目录,即/user/用户名。
G皮T
·
2023-12-04 07:19
#
Hadoop
大数据
hdfs
hadoop
带你涨姿势,Hbase 概念原理扫盲 !
Hbase是一个高可靠性(存储在
hdfs
上,有副本机制),高性能,面向列,
码农小光
·
2023-12-04 07:06
阅读 Flink 源码前必会的知识 - 命令行解析库 Apache Commons Cli
一、介绍一下ApacheCommonsCli,有一个感官的认识我们在使用一些开源项目时,会敲一些命令,有简单的,比如hadoopversion;有复杂的,比如flinkrun…,
hdfs
dfs-ls,等等
KK架构
·
2023-12-04 06:22
Flink
flink
flink源码
命令行
解析
Apache
Commons
flink-connector-mysql-cdc_2.0.2
ververica.github.io/flink-cdc-connectors/master/content/connectors/mysql-cdc.html1、测试步骤:1)开启MySQLBinlog并重启MySQL2)启动
HDFS
ykqidev
·
2023-12-04 06:49
flink
flink
mysql
java
Hadoop——分布式存储
HDFS
HDFS
集群环境部署VMware虚拟机中部署一、https://hadoop.apache.org中下载安装包二、环境分配三、上传、解压确认服务器创建、固定IP、防火墙关闭、Hadoop用户创建、SSH
A尘埃
·
2023-12-04 06:13
hadoop
分布式
hdfs
大数据技术合集(持续更新)
0.大数据技术演变史(来自通信院)1.起源:Google的三驾马车1.1GFS1.2BigTable1.3MapReduce2.开源大数据文件、对象、块存储2.1分布式文件系统:
HDFS
、Ceph、GlusterFS
amuseme_lu
·
2023-12-04 05:39
BigData
大数据
九、
hdfs
中Namenode元数据处理
1、元数据的由来在
hdfs
文件系统中,用户的每一次操作,都会对文件系统产生响应的影响,那么谁来记录这些影响呢?
弦之森
·
2023-12-04 05:37
Hadoop
hdfs
hadoop
大数据
八、
hdfs
文件系统副本块数量的配置
1、配置方式2、实际操作演示(1)在Hadoop用户的根目录下创建text.txt文件(2)上传文件hadoop@node1:~$
hdfs
dfs-ls
hdfs
://node1:8020/Found4itemsdrwxr-xr-x-hadoopsupergroup02023
弦之森
·
2023-12-04 05:05
Hadoop
hdfs
hadoop
大数据
04数据平台Flume
Flume功能Flume主要作用,就是实时读取服务器本地磁盘数据,将数据写入到
HDFS
。Flume是Cloudera提供的高可用,高可靠性,分布式的海量日志采集、聚合和传输的系统工具。
kk_io
·
2023-12-04 04:20
数据仓库
数据仓库
flume
大数据
LeetCode刷题 -- DFS
深度优先搜索算法,depth-first-searc
hDFS
,是一种用于遍历或者搜索树、图的算法,这个算法会尽可能深的去搜索树的分支。
材料小菜鸟
·
2023-12-04 04:02
深度优先
leetcode
算法
大数据基础设施搭建 - 业务数据同步策略
文章目录一、全量同步1.1梳理需要全量同步的业务表1.2Sqoop:MySQLTo
HDFS
1.2.1开发脚本1.2.2授予脚本执行权限1.2.3执行脚本1.2.4定时调度二、增量同步2.1梳理需要增量同步的业务表
m0_46218511
·
2023-12-03 16:42
大数据基础设施搭建
大数据
业务数据同步
Hadoop 1 ~ Hadoop 3 的发展史
Hadoop1的核心设计就是
HDFS
(HadoopDistributedFileSystem)和Map
大数据狂人
·
2023-12-03 14:34
hadoop
大数据开发:
HDFS
Erasure Coding机制
Hadoop的分布式文件系统
HDFS
,其冗余备份机制,确保了数据存储的容错,但是同时也增加了冗余存储成本。今天的大数据开发分享,我们就来讲讲
HDFS
ErasureCoding机制。
成都加米谷大数据
·
2023-12-03 14:29
Hbase与Hive的区别与联系
Hive,通过元数据来描述
HDFS
上的结构化文本数据。因此,严格地讲,Hive并非数据库,主要是让开发人员能够通过SQL(HQL语
阿乐_822e
·
2023-12-03 12:13
Hive----基本概念
3、本质是:将HQL转化成MapReduce程序1)Hive处理的数据存储在
HDFS
2)Hive分析数据底层的实现是MapReduce3)执行程序运行在Yarn上4.Hive的优缺点优点1)操作接口采用类
Hi杯酒故人
·
2023-12-02 21:21
上一页
16
17
18
19
20
21
22
23
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他