E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs日常维护
Python大数据之linux学习总结——day06_hive02
知识点:示例:查看/修改表示例:默认分隔符示例:快速映射表[练习]知识点:示例:数据导入和导出文件数据加载导入1.直接上传文件window页面上传linux本地put上传2.load加载文件:load移动
HDFS
笨小孩124
·
2023-11-19 15:58
hive
学习任务
python
大数据
linux
sqoop
hdfs
入mysql_sqoop将
hdfs
下的数据导入到mysql如何去重?
sqoop执行的脚本我是这样写的sqoopexport–connectjdbc:mysql://localhost:3306/movie–usernameroot–passwordwelcome1–tablemovieRecommend–fields-terminated-by‘,’–export-dir/recommendoutrecommendout是我mapreduce程序处理后的输出目录,
唉唉唉哒
·
2023-11-19 14:05
sqoop
hdfs入mysql
elasticsearch 备份与恢复
本地备份一创建仓库首先需要创建一个仓库,仓库的类型支持Sharedfilesystem,AmazonS3,
HDFS
和AzureCloud,暂时只掌握了文件系统备份方式一:通过命令方式创建备份仓库a.修改
不会写诗的程序猿
·
2023-11-19 14:13
elk
备份与恢复
elasticdump
nfs远程挂载
2023-Hive调优最全指南
性能优化之数据倾斜专题五、HiveSQL优化十二板斧六、Hive面试题(一)七、Hive/Hadoop高频面试点集合(二)01-基于Hadoop的数据仓库Hive基础知识Hive是基于Hadoop的数据仓库工具,可对存储在
HDFS
000X000
·
2023-11-19 13:43
数据仓库
性能测试和优化
HIVE
hive
hadoop
大数据
Hive调优最全指南
大数据之hadoop-
hdfs
知识通俗详解
目录疑问存储模型(重要)架构设计角色功能NameNodeDataNode元数据持久化安全模式
HDFS
中的SNNSecondaryNameNode(SNN)Block的副本放置策略
HDFS
写流程
HDFS
读流程总结疑问分布式文件系统那么多
shw12357
·
2023-11-19 10:27
hadoop
05-Hadoop01之
HDFS
一、Hadoop介绍Hadoop分为三部分:Common、
HDFS
、Yarn、MapReduce(有点过时了)Hadoop生态圈:除了hadoop技术以外,还有hive、zookeeper、flume、
YuPangZa
·
2023-11-19 10:54
大数据
hdfs
hadoop
大数据
大数据基础设施搭建 - Hadoop
案例5.2.1创建wordcount输入文本信息5.2.2执行程序5.2.3查看结果六、分发压缩包到集群中其他机器6.1分发压缩包6.2解压压缩包6.3配置环境变量七、配置集群7.1核心配置文件7.2
HDFS
m0_46218511
·
2023-11-19 10:33
大数据基础设施搭建
大数据
hadoop
hdfs
多用户读写权限设置
多个用户都能对文件有操作(读写)权限.1》在
hdfs
中设置umask为002,则新目录的权限为775,新文件的权限为664,只要都是supergroup组的用户都有权限进行读写2》在namenode上创建
飞有飞言
·
2023-11-19 09:35
大数据实战平台环境搭建
大数据实战平台环境搭建一、创建Hadoop用户二、更新apt和安装Vim编辑器三、安装SSH和配置SSH无密码登录四、安装Java五、安装单机Hadoop六、Hadoop伪分布式安装七、
HDFS
常用命令八
ZShiJ
·
2023-11-19 08:13
虚拟机
hadoop
java
大数据
2023.11.17 hadoop之
HDFS
进阶
目录
HDFS
的机制元数据简介元数据存储流程:namenode生成了多个edits文件和一个fsimage文件edits和fsimage文件SecondaryNameNode辅助NameNode的方式:
HDFS
白白的wj
·
2023-11-19 08:35
hdfs
hadoop
大数据
sql
database
hive
HDFS
的文件写入和文件读取流程
这是
HDFS
在上传⽂件写数据过程时采⽤的⼀种数据传输⽅式。客户端将数据块写⼊第⼀个数据节点,第⼀个数据节点保存数据之后再将块复制到第⼆个数据节点,后者保存后将其复制到第三个数据节点。
cx330上的猫
·
2023-11-19 04:36
hdfs
hadoop
大数据
HDFS
架构
目录一,
HDFS
简介二、
HDFS
架构三、
HDFS
的工作机制一,
HDFS
简介①
HDFS
概念:HadoopDistributedFileSystem,是Hadoop项⽬的核⼼⼦项⽬,是分布式计算中数据存储管理的基础
cx330上的猫
·
2023-11-19 04:29
hdfs
hadoop
架构
大数据之数据迁移sqoop的安装
Sqoop具有命令行界面,可用于从关系型数据库中导入数据到Hadoop分布式文件系统(
HDFS
)中,或从
HDFS
导出数据到关系型数据库中。
bigdata从入门到放弃
·
2023-11-19 03:09
数据仓库
sqoop
hadoop
大数据
sqoop
hadoop
hive
数据库
数据仓库
数据分析
linux中hadoop伪分布搭建
主要有以下三个组件:Hadoop分布式文件系统(
HDFS
):这是一种可扩展的、容错的文件系统,专门设计用于在大规模集群中存储和访问数据。
bigdata从入门到放弃
·
2023-11-19 03:38
hadoop
linux
hadoop
运维
大数据
big
data
Hadoop面试题
Hadoop要点1、Hadoop运行模式2、Hadoop的组成4、block份数和大小默认配置5、
HDFS
读写数据流程(★)6、节点距离和机架感知(副本存储节点选择)(☆)7、SecondaryNameNode8
果子哥丶
·
2023-11-19 02:45
#
Hadoop
大数据
hadoop
Hive在SQL标准权限模式下创建UDF失败的问题排查
CDH5.16Hive1.1.0已开启KerberosHive授权使用SQLStandardsBasedAuthorization模式(以下简称SSBA模式)症状表现:在编译好UDF的jar包之后,上传到
HDFS
咕噜咕噜大数据
·
2023-11-19 00:48
大数据安全
Hive
CDH
大数据
hive
Flume 从0到高手一站式养成记
3.2案例:采集文件内容上传至
HDFS
3.3案例:采集网站日志上传至
HDFS
四、Flume高级组件4.1SourceInterceptors4.2ChannelSelectors4.3SinkProcessors4.4FailoverSinkProcessor
Amo Xiang
·
2023-11-19 00:19
大数据开发
flume
flume1.9学习笔记
为什么选用FlumeFlume最主要的作用就是,实时读取服务器本地磁盘的数据,将数据写入到
HDFS
。1.2Flume基础架构Flume组成架构如下图所示。
怕被各位卷死
·
2023-11-19 00:47
大数据学习笔记
学习
分布式
flume
Flume学习笔记(2)—— Flume进阶
doRollback:channel内存队列空间不足,回滚数据TakedoTake:将数据取到临时缓冲区takeList,并将数据发送到
HDFS
doCommit:如果数据全部发送成功,则清除临时缓冲区takeListdoRollback
THE WHY
·
2023-11-19 00:42
Flume
大数据
flume
大数据
【学习笔记】大数据技术之Hadoop(入门)
1.2Hadoop发展历史1.3Hadoop的三大发行版本1.4Hadoop优势(4高)1.5Hadoop组成,1.x2.x3.x区别(重点)1.5.1
HDFS
架构概述1.5.2YARN架构概述1.5.3MapReduce
在学习的王哈哈
·
2023-11-18 23:38
大数据
hadoop
big
data
学习
Spark学习——1.代表性大数据技术
代表性的大数据技术HadoopSparkFlinkBeam主要计算模式如图1-11.1HadoopHadoop的生态系统图如图1-2开源谷歌GFS,利用MapReduce分布式并行编程,MapReduce和
HDFS
楓尘林间
·
2023-11-18 23:37
Spark
Spark
大数据学习
Flume学习笔记(1)—— Flume入门
概述Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统Flume基于流式架构,灵活简单Flume最主要的作用就是,实时读取服务器本地磁盘的数据,将数据写入到
HDFS
THE WHY
·
2023-11-18 23:33
大数据
Flume
flume
学习
笔记
hadoop学习笔记1了解流程大概
海量数据的存储
hdfs
海量数据的计算:mapreduce
hdfs
概述namenode:元数据,存储在哪个节点,存储什么信息datanode:存储数据2nn:备份namenode的信息yarn概述负责集群资源的管理
小美元
·
2023-11-18 20:06
hadoop
学习
大数据
Flink原理与实现:详解Flink中的状态管理
硬刚大数据系列文章链接:2021年从零到大数据专家的学习指南(全面升级版)2021年从零到大数据专家面试篇之Hadoop/
HDFS
/Yarn篇2021年从零到大数据专家面试篇之SparkSQL篇2021
王知无(import_bigdata)
·
2023-11-18 19:59
大数据成神之路
flink
big
data
spark
经验篇:大数据常用工具集合
数据存储工具rds、mysql、postgresql、presto;starrocks/Doris;oss、es、
hdfs
、binlog、nosql、redis、neo4j;Kafkaoss:文件、图片
lazyone10
·
2023-11-17 17:32
大数据
社群运营的工作内容有哪些?
主要工作围绕四个方面,分别是:用户拉新、用户留存、用户转化、
日常维护
,这四个方面形成社群的整个闭环运营,达到社群运营的目的。下面小鹿将分享社群运营搭建、引流、促活、变现的主要工作流程。
Xyz_pl
·
2023-11-17 16:09
私域运营
产品运营
利用CURL命令调用Web
HDFS
REST API与Kerberos机制
1.CURL安装cURL是一个利用URL语法在命令行下工作的文件传输工具,1997年首次发行。它支持文件上传和下载,所以是综合传输工具,但按传统,习惯称cURL为下载工具。cURL还包含了用于程序开发的libcurl。CURL官方网站:http://curl.haxx.se/1.1Linux安装这个网上资料比较多,只要搜索“curl安装linux”就应该有不少介绍。1.2
tzw_cs
·
2023-11-17 16:41
Hadoop
curl
hdfs
kerberos
大数据开发学习笔记
Hadoophadoop集群搭建+hive安装_hadoop集群安装hive-CSDN博客Hadoop基础入门(1):框架概述及集群环境搭建_THEWHY的博客-CSDN博客Hadoop基础入门(2):
HDFS
-CSDN
THE WHY
·
2023-11-17 16:01
大数据
大数据
学习
笔记
mysql 海量数据迁移_Canal解决MySQL海量数据迁移问题
要分析海量数据,您需要将mysql中的数据同步到其他海量数据存储介质(
HDFS
,hbase)。如何出口呢?sqoop解决方案一:使用sqoop定期将mysql数据导出到hbase或
hdfs
Sqoop导
麦子9014
·
2023-11-17 12:42
mysql
海量数据迁移
二百零二、Hive——Hive解析JSON字段(单个字段与json数组)
一、目的用Flume采集Kafka写入到Hive的ODS层在
HDFS
路径下的JSON数据,需要在DWD层进行解析并清洗(一)Hive的ODS层建静态分区外部表createexternaltableifnotexistsods_queue
天地风雷水火山泽
·
2023-11-17 07:56
Hive
hive
json
hadoop
二百零三、Flume——Flume实时采集数据频率为1s的高频率Kafka数据直接写入ODS层表的
HDFS
文件路径下
一、目的在离线数仓中,需要用Flume去采集Kafka中的数据,然后写入
HDFS
中。由于每种数据类型的频率、数据大小、数据规模不同,因此每种数据的采集需要不同的Flume配置文件。
天地风雷水火山泽
·
2023-11-17 07:22
Flume
flume
大数据
大数据系列-Hadoop集群搭建(2)集群配置
目录1.初步认识Hadoop1.1模块认知1.2关联工程/项目1.3Hadoop架构1.3.1
HDFS
架构1.3.2YARN架构2.Hadoop部署规划2.1节点规划2.2端口规划3.Hadoop集群配置
zhm6422107
·
2023-11-17 03:59
大数据
hadoop
big
data
hdfs
4hadoop
HDFS
集群搭建-伪分布式模式
hadoop旧版网址:http://hadoop.apache.org/old/2.6.5版本ssh协议在免密登陆其他机器的时候,不会加载其他机器的环境变量。就是不会加载/etc/profile文件在免密登陆别的机器时,如果需要环境变量可以先加载环境变量,然后在执行命令。例如:
[email protected]
’source/etc/profile;echo$PATH’即可伪分布式模式:单
没有女朋友的程序员
·
2023-11-17 03:28
大数据开发
大数据之hadoop-
hdfs
完全分布式环境搭建(详细步骤真实可用)
1,服务器规划本次服务搭建是在原有伪分布式的基础上进行搭建,伪分布式的搭建,参照伪分布式搭建节点NNSNNDNnode01※––node02※※node03––※node04––※2,基础设施jps检查jdk1.8安装,检查网络是否正常,配置hostvim/etc/hosts10.0.0.11node0110.0.0.12node0210.0.0.13node0310.0.0.14node04[r
shw12357
·
2023-11-17 03:27
hadoop
大数据
大数据之hadoop-
hdfs
伪分布式环境搭建(详细步骤真实可用)
目录版本1,基础设施2,Hadoop的配置(应用的搭建过程)3,启动4,简单使用5,上传自定义块的大小版本centos7+jdk1.8+hadoop2.6.51,基础设施设置网络:vi/etc/sysconfig/network-scripts/ifcfg-ens33TYPE="Ethernet"PROXY_METHOD="none"BROWSER_ONLY="no"DEFROUTE="yes"I
shw12357
·
2023-11-17 03:56
hadoop
大数据-hadoop HA
hadoopHAHACAP原则Paxos算法Federation实操大数据-hadoopHAHA主从集群:结构相对简单,主与从协作主:单点,数据一致好掌握问题:单点故障,集群整体不可用压力过大,内存受限
HDFS
Ybb_studyRecord
·
2023-11-17 03:26
大数据
大数据
hadoop
hdfs
HA
大数据分布式集群搭建(5)
1.1什么是HADOOP1.HADOOP是apache旗下的一套开源软件平台2.HADOOP提供的功能:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理3.HADOOP的核心组件有A.
HDFS
KongX_B
·
2023-11-17 03:25
大数据
大数据
hadoop
分布式
集群
大数据-hadoop入门与部署
大数据-hadoop入门与部署大数据-hadoop入门与部署启蒙分治思想单机处理大数据问题集群分布式处理大数据的辩证HadoopHadoop项目/生态hadoop-
hdfs
存储模型架构设计角色功能元数据持久化安全模式
Ybb_studyRecord
·
2023-11-17 03:25
大数据
hadoop
大数据
分布式
安装
大数据hadoop
hdfs
基础环境搭建
1.需要5个软件,virtualBox,centos,hadoop(),jdk(linux),xshell(远程登录)2.virtualBox新建虚拟机LinuxRedHat64位3.安装centos,硬盘->动态分配,软件选择->基础设施服务器4.设置网络,a).设置宿主机实际联网网卡的共享b).控制面板->网络->网络连接->vitualBoxHostonlyNetwork网卡的ip设置为19
gauyeah309
·
2023-11-17 03:53
阿里云OSS对象存储服务的使用
服务器Base64加密签名)(推荐)代码由服务器进行上传由服务器直接进行上传其实我们是不推荐的,原因有以下几点:在高并发的情况下,大量的图片由客户端传输给服务端,再由服务端上传至云端或者是分布式服务器(
HDFS
互联网底层人员
·
2023-11-16 23:18
java
阿里云
java
服务器
flume与kafka应用场景解析
而flume是定位数据传输,相比下,flume是一个专用工具被设计为旨在往
HDFS
,HBASE发送数据。它对
HDFS
有特殊的优化,并且集成了hadoop的安全特性。
wuyue_fighting
·
2023-11-16 22:39
kafka
flume
flume
kafka
hadoop的java实现
2.7.6)org.apache.hadoophadoop-common2.7.6org.apache.hadoophadoop-client2.7.6org.apache.hadoophadoop-
hdfs
2.7.6
weixin_44864919
·
2023-11-16 20:42
大数据
hadoop
hadoop源码中关于元数据“分段加锁+双缓冲方案”源码demo
FSEditLog.javapackagecom.nx.hadoop.lesson02;importjava.util.LinkedList;/****
HDFS
:有个别地方源码写得不错的。
weixin_44864919
·
2023-11-16 20:12
大数据
hadoop
java
大数据
4.
hdfs
高可用集群搭建
简介前面把hadoop机器已经准备好了,zk集群搭建好了,本本就是开始搭建
hdfs
环境hadoop环境准备创建hadoop用户三台机器都创建hadoop用户useraddhadoop-d/home/hadoopecho
shura1014
·
2023-11-16 20:11
hadoop
hdfs
hadoop
大数据
3.
hdfs
概述与高可用原理
简述
HDFS
(HadoopDistributedFileSystem)是一种Hadoop分布式文件系统,具备高度容错特性,支持高吞吐量数据访问,可以在处理海量数据(TB或PB级别以上)的同时最大可能的降低成本
shura1014
·
2023-11-16 20:35
hadoop
hdfs
hadoop
hadoop概述
是什么:Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算.Hadoop框架中最核心设计就是:
HDFS
m0_67390379
·
2023-11-16 08:52
java
hadoop
大数据
hdfs
java
windows
Flink 整合 hudi
优点:不在只依赖于分布式的文件存储系统,对分布式具有解耦合,数据的存储位置可以不用固定,数据并不是只能存储在
hdfs
中了。主要的作用:计算引擎可以是
新手小农
·
2023-11-16 08:21
Flink
1.15.2
flink
大数据
大数据Hadoop之——部署hadoop+hive+Mysql环境(Linux)
Java环境变量3、加载环境变量4、进行校验二、hadoop的集群搭建1、hadoop的下载安装2、配置文件设置2.1.配置hadoop-env.sh2.2.配置core-site.xml2.3.配置
hdfs
-site.xml2.4
爱吃面的猫
·
2023-11-16 06:51
大数据
笔记
Hadoop-
HDFS
架构与设计
HDFS
架构与设计一、背景和起源二、
HDFS
概述1.设计原则1.1硬件错误1.2流水访问1.3海量数据1.4简单一致性模型1.5移动计算而不是移动数据1.6平台兼容性2.
HDFS
适用场景3.
HDFS
不适用场景三
临江蓑笠翁
·
2023-11-16 06:15
大数据
#
Hadoop
hadoop
hdfs
架构
flume异常关闭文件修复方法
flume在从kafka采集数据后,会将数据写入到
hdfs
文件中。
jiedaodezhuti
·
2023-11-16 01:19
大数据
flume
大数据
hdfs
上一页
24
25
26
27
28
29
30
31
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他