E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hdfs透明加密
Ubuntu从零创建Hadoop集群
查看虚拟机IP及检查网络3.Ubuntu相关配置镜像源配置下载vim编辑器4.设置静态IP和SSH免密(可选)设置静态IPSSH免密5.JDK环境部署6.Hadoop环境部署7.配置Hadoop配置文件
HDFS
爱编程的王小美
·
2025-03-02 12:57
大数据专业知识系列
ubuntu
hadoop
linux
Kafka系列之:记录一次源头数据库刷数据,造成数据丢失的原因
Kafka系列之:记录一次源头数据库刷数据,造成数据丢失的原因一、背景二、查看topic日志信息三、结论四、解决方法一、背景源头数据库在很短的时间内刷了大量的数据,部分数据在
hdfs
丢失了理论上debezium
快乐骑行^_^
·
2025-03-01 18:12
Kafka
Kafka系列
记录一次源头数据库刷数据
造成数据丢失的原因
Python酷库之旅-第三方库Pandas(011)
目录一、用法精讲25、pandas.
HDFS
tore.get函数25-1、语法25-2、参数25-3、功能25-4、返回值25-5、说明25-6、用法25-6-1、数据准备25-6-2、代码示例25-6
神奇夜光杯
·
2025-03-01 05:38
python
pandas
开发语言
标准库及第三方库
基础知识
学习与成长
天锐绿盾 | 公司通常如何防止文件被拷贝?
例如,天锐绿盾采用
透明加密
技术,对源代码进行实时、智能的加密保护。权限管理:通过设置不同的文件访问权限(如只读、禁止复制、禁止打印等),控制员工对文件的操作,减少文件被泄露的风险。
德信仁合
·
2025-02-28 12:05
天锐绿盾
电脑
安全
windows
linux
mac
源代码管理
软件需求
HIVE 面试题总结
Hive依赖于
HDFS
存储数据,Hive将HQL转换成MapReduce执行,所以说Hive是基于Hadoop的一个数据仓库工具,实质就是一款基于
HDFS
的MapReduce计算框架,对存储在
HDFS
中的数据进行分析和管理
小余真旺财
·
2025-02-28 11:00
Hive
hive
Hive基本操作
Hive基本操作1.Hive常用命令1.1Hive启动1.2Hive退出1.3Hive查看历史命令1.4Hive常用交互命令2.数据库基本操作2.1创建数据库2.2创建数据库并指定
hdfs
存储位置2.3
小肥柴呀
·
2025-02-28 04:01
Apache
Hive
hive
数据库
Hive SQL 使用及进阶详解
一、Hive简介Hive是建立在Hadoop之上的数据仓库基础架构,它提供了类似于SQL的查询语言HiveSQL(也称为HQL),用于对存储在Hadoop分布式文件系统(
HDFS
)中的大规模数据进行数据查询和分析
小四的快乐生活
·
2025-02-27 03:37
hive
sql
hadoop
HDFS
是如何存储和管理大数据
HDFS
(HadoopDistributedFileSystem,Hadoop分布式文件系统)是专为大数据处理而设计的分布式文件系统,具有高吞吐量、高容错性等特点,适用于大规模数据存储和管理。
python资深爱好者
·
2025-02-26 11:38
大数据
hdfs
hadoop
Hadoop 基础原理
Hadoop基础原理基本介绍Hadoop的必要性Hadoop核心组件Hadoop生态系统中的附加组件
HDFS
HDFS
集群架构
HDFS
读写流程
HDFS
写流程
HDFS
读流程NameNode持久化机制MapReduce
disgare
·
2025-02-26 11:38
数据库
hadoop
大数据
分布式
Spark Standalone集群架构
spark学习笔记SparkStandalone集群架构SparkStandalone集群集群管理器,clustermanager:Master进程,工作节点:Worker进程搭建了一套Hadoop集群(
HDFS
htfenght
·
2025-02-25 20:22
spark
spark
Hadoop--NameSpace(名称空间)
1.名称空间的定义
HDFS
的名称空间是一个逻辑上的文件系统目录树,类似于传统文件系统的目录结构。组成目录:用于组织文件的逻辑容器。文件:存储在
HDFS
中的实际数据单元。
Cynthiaaaaalxy
·
2025-02-25 18:42
hadoop
大数据
分布式
YashanDB加密方法
YashanDB官网,原文内容请见https://doc.yashandb.com/yashandb/23.3/zh/%E6%A6%82%E5%BF%B5%...存储加密YashanDB支持表空间级和列级的数据
透明加密
·
2025-02-24 18:34
数据库
Hadoop
HDFS
基准测试
一、测试写入速度确保
HDFS
集群和YARN集群成功启动hadoopjar/export/server/hadoop-3.1.4/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient
Yvonne978
·
2025-02-24 14:22
大数据
hadoop
hdfs
大数据
jmeter 与大数据生态圈中的服务进行集成
以下为你详细介绍JMeter与大数据生态圈中几种常见服务(Hadoop
HDFS
、Spark、Kafka、Elasticsearch)集成的方法:与Hadoop
HDFS
集成实现思路
HDFS
是Hadoop的分布式文件系统
小赖同学啊
·
2025-02-24 13:40
jmeter专栏
jmeter
大数据
Hadoop常用操作命令
在NameNode节点格式化集群初始化集群
hdfs
namenode-format启动
HDFS
sbin/start-dfs.sh启动yarnsbin/start-yarn.sh启动NodeManageryarn-daemon.shstartnodemanager
hzw0510
·
2025-02-24 07:02
hadoop
大数据
分布式
HDFS
分布式文件系统的架构及特点
一、
HDFS
架构
HDFS
采用的是主从(Master/Slave)架构,即一个
HDFS
通常是由一个Master和多个Slave组成。
互联网上的猪
·
2025-02-24 04:40
Hadoop
hdfs
架构
hadoop
Hadoop~
HDFS
的Block块
一、
HDFS
的block块1.介绍block块是
HDFS
的最小存储单位,每个256MB(可以修改)2.文件在
HDFS
中的存储方式文件分成多个block块,block块分三份存入对应服务器,每个block
飞Link
·
2025-02-23 11:37
Hadoop框架
hadoop
hdfs
大数据
深入HBase——核心组件
核心组件首先,需要提到的就是HBase架构中会依赖到的Zookeeper和
HDFS
。
黄雪超
·
2025-02-23 01:26
大数据基础
#
深入HBase
hbase
数据库
数据结构
大数据-257 离线数仓 - 数据质量监控 监控方法 Griffin架构
目前已经更新到了:Hadoop(已更完)
HDFS
(已更完)MapReduce(已更完)Hive(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis
m0_74823705
·
2025-02-22 21:50
面试
学习路线
阿里巴巴
大数据
架构
Python 的 WebSocket 实现详解
大数据技术:涵盖Hadoop(
HDFS
)、Hive、Spark、Fli
王子良.
·
2025-02-22 03:23
经验分享
python
websocket
网络协议
网络
【Hadoop】使用Docker容器搭建伪分布式集群
docker-compose.yaml文件配置集群version:"3"services:namenode:image:apache/hadoop:3.3.6hostname:namenodecommand:["
hdfs
慕青Voyager
·
2025-02-21 09:14
分布式
hadoop
docker
HDFS
分布文件系统(Hadoop Distributed File System)
目录一.
HDFS
的本质二.
HDFS
的架构与原理三、
HDFS
特性四.
HDFS
的常用命令1.显示
HDFS
指定路径下的所有文件2.在
HDFS
上创建文件夹3.上传本地文件到
HDFS
4.查看文件5.删除
HDFS
上的文件或者目录
柿子小头
·
2025-02-21 08:38
hdfs
hadoop
大数据
org.apache.hadoop.
hdfs
.server.datanode.DataNode: Block pool ID needed, but service not yet registere
启动hadoop集群,发现datanode没有启动,查看日志报错,如图://日志文件2020-03-2416:40:55,608WARNorg.apache.hadoop.
hdfs
.server.common.Storage
@菜鸟进阶记@
·
2025-02-21 01:19
hadoop
hadoop
Hadoop之
HDFS
的使用
HDFS
是什么:
HDFS
是一个分布式的文件系统,是个网盘,
HDFS
是一种适合大文件存储的分布式文件系统
HDFS
的Shell操作1、查看
hdfs
根目录下的内容-ls
hdfs
dfs-ls
hdfs
://hadoop01
想要变瘦的小码头
·
2025-02-20 20:43
hadoop
hdfs
大数据
Hadoop管理工具dfsadmin和fsck的使用
Hadoop提供了多个管理工具,其中dfsadmin和fsck是用于管理
HDFS
(Hadoop分布式文件系统)的重要工具。以下是它们的使用方法和常见命令。
脚本无敌
·
2025-02-19 16:46
Hadoop
hadoop
npm
大数据
Hive 分区详解
分区表的一个分区对应
hdfs
上的一个目录分区表包括静态分区表和动态分区表,根据分区会不会自动创建来区分多级分区表,即创建的时
mm_ren
·
2025-02-19 15:36
分区表
hadoop
大数据
hive
spark
hive全量迁移脚本
/bin/bash#场景:数据在同一库下,并且hive是内部表(前缀的
hdfs
地址是相同的)#1.读取一个文件,获取表名#echo"时间$dt_jian_2-----------------------
我要用代码向我喜欢的女孩表白
·
2025-02-19 15:29
数据迁移
bigdata-大数据专栏
hive
hadoop
数据仓库
使用Docker安装Spark集群(带有
HDFS
)
本实验在CentOS7中完成第一部分:安装Docker这一部分是安装Docker,如果机器中已经安装过Docker,可以直接跳过[root@VM-48-22-centos~]#systemctlstopfirewalld[root@VM-48-22-centos~]#systemctldisablefirewalld[root@VM-48-22-centos~]#systemctlstatusfi
Sicilly_琬姗
·
2025-02-18 10:52
云计算
大数据
docker
spark
hdfs
Hbase深入浅出
与传统关系数据库的区别HBase相关的模块以及HBase表格的特性HBase的使用建议Phoenix的使用总结HBase在大数据生态圈中的位置提到大数据的存储,大多数人首先联想到的是Hadoop和Hadoop中的
HDFS
天才之上
·
2025-02-18 03:13
数据存储
Hbase
大数据存储
HBase简介:高效分布式数据存储和处理
HBase的核心特点包括:分布式存储:HBase使用Hadoop分布式文件系统(
HDFS
)作为底层存储,数据被分布在集
代码指四方
·
2025-02-18 03:07
分布式
hbase
数据库
大数据
深度优先搜索DFS
目录类`Grap
hDFS
`的定义深度优先搜索方法`dfs`访问顺序的获取`order`深度优先搜索(DFS,Depth-FirstSearch)算法。
顾北辰20
·
2025-02-17 10:19
Java数据结构
算法
数据结构
java
Hadoop常用端口号
以下是Hadoop2.x常用的端口号列表:
HDFS
端口号:NameNode:50070SecondaryNameNode:50090DataNode:50010DataNode(数据传输):50020YARN
海洋 之心
·
2025-02-17 02:51
Hadoop问题解决
hadoop
hbase
大数据
大数据之-
hdfs
+hive+hbase+kudu+presto集群(6节点)
index.htmlkudurpm包地址https://github.com/MartinWeindel/kudu-rpm/releaseshivehttp://mirror.bit.edu.cn/apache/hive/
hdfs
http
管哥的运维私房菜
·
2025-02-16 22:50
大数据
hdfs
hive
kudu
presto
hbase
Hadoop 的分布式缓存机制是如何实现的?如何在大规模集群中优化缓存性能?
分布式缓存的工作原理文件上传:用户将需要缓存的文件上传到
HDFS
(HadoopDistributedFileSystem)。文件路径可以在作业配置中指定。
晚夜微雨问海棠呀
·
2025-02-16 11:53
分布式
hadoop
缓存
HBase的合并操作
compact的作用flush操作会将memstore的数据落地为一个个StoreFile(HFile),那么随着时间的增长在
HDFS
上面就会有很多的HFile文件,这样对读操作会产生比较大的影响(读操作会对
b1gx
·
2025-02-16 06:20
HBase
深入HBase——引入
引入前面我们通过深入
HDFS
到深入MapReduce,从设计和落地,去深入了解了大数据最底层的基石——存储与计算是如何实现的。这个专栏则开始来看大数据的三驾马车中最后一个。
黄雪超
·
2025-02-15 16:58
大数据基础
#
深入HBase
大数据
数据库
hbase
Ubuntu下配置安装Hadoop 2.2
参考资料:1.InstallingsinglenodeHadoop2.2.0onUbuntu:http://bigdatahandler.com/hadoop-
hdfs
/installing-single
weixin_30501857
·
2025-02-15 15:55
大数据
java
运维
蓝易云 - HBase基础知识
HBase是一个分布式、可伸缩、列式存储的NoSQL数据库,它建立在Hadoop的
HDFS
之上,提供高可靠性、高性能的数据存储和访问。
蓝易云
·
2025-02-15 02:38
hbase
数据库
大数据
php
python
人工智能
电脑文件防泄密软件
以下是对该软件的详细介绍:一、软件概述天锐绿盾(又名绿盾信息安全管理软件)是一款功能强大的企业加密软件,它通过在操作系统的核心驱动层实施文件
透明加密
,确保所有受保护的文档(如设计图纸、源代码、办公文档等
Tianrui Green Shield
·
2025-02-14 06:08
天锐绿盾
企业图档防泄密软件
公司内部文件资料加密软件
天锐绿盾
图纸加密
源代码安全
开发部门源代码防止泄露
电脑文件防泄密软件
电脑文件防泄密系统
该系统支持多种文件格式,如文档、图纸、源代码等,并能在不影响员工正常工作的前提下,实现文件的
透明加密
和自动解密。二、核心功能
Tianrui Green Shield
·
2025-02-14 04:19
天锐绿盾
电脑文件防泄密系统
办公加密软件
源代码防泄密
设计图纸图档保护
办公文件资料加密
电脑行为审计监控
文档安全管理
关于虚拟机的Unknown command
/bin/
hdfs
dfs–mkdirinput导致出现–mkdir:Unknowncommand的错误,原因在于我复制的这条命令中的-和虚拟机的编码不一样,导致出错,所以应该手敲这个符号“-”,这样就可以啦
真的不想写实验
·
2025-02-13 04:12
后端
hadoop
java
linux
hadoop 1.0 基本概念了解
Map函数负责将输入数据转化为中间值,中间值再通过Reduce函数转化成输出数据
HDFS
:
HDFS
是一个分布式文件系统。通过一次写入,多次读出来实现。Chukwa:Chukw
fenggfa
·
2025-02-12 07:48
hadoop
hadoop
大数据
mapreduce
深入理解Hadoop 1.0.0源码架构及组件实现
该版本包含核心分布式文件系统
HDFS
、MapReduce计算模型、Common工具库等关键组件。通过分析源码,可深入理解这些组件的设计和实现细节,包括数据复制、任务调度、容错机制以及系统配置管理。
隔壁王医生
·
2025-02-12 07:14
HiveQL命令(三)- Hive函数
ApacheHive作为一种流行的数据仓库工具,提供了丰富的内置函数,帮助用户高效地处理和分析存储在Hadoop分布式文件系统(
HDFS
)中的数据。这些内置函数涵盖了数值计算、字符
BigDataMagician
·
2025-02-11 12:00
HiveQL命令
hive
hadoop
数据仓库
掌握大数据--Hive全面指南
-DDL操作数据库1.Hive简介ApacheHive是建立在Hadoop之上的一个数据仓库工具,它提供了一种类似于SQL的查询语言,称为HiveQL,用于查询和分析存储在Hadoop分布式文件系统(
HDFS
纪祥_ee1
·
2025-02-10 22:40
大数据
hive
hadoop
【Flink实战】Flink -C实现类路径配置与实现UDF Jar
URL可以指向本地、HTTP服务器或
HDFS
等资源的Jar文件。注意:此处的classpath的url必须是一个能够在client,JM和TM都被访问到的位置。
roman_日积跬步-终至千里
·
2025-02-10 11:38
#
flink
实战
flink
jar
大数据
大数据笔记(二):
HDFS
原理知识
目录
HDFS
原理知识一、前言二、思考三、理论知识点四、存储模型五、架构设计六、角色功能NameNodeDataNode七、元数据持久化八、安全模式九、
HDFS
中的SNN十、Block的副本放置策略十一、
Lansonli
·
2025-02-09 10:50
大数据进阶知识
大数据
HDFS
hive出现内存溢出_hive问题处理
内存溢出Client端内存溢出Client端发生内存溢出执行下面的看是很简单的一条sql语句:hive>selectcount(1)fromtest_tb_1_1;QueryID=
hdfs
_20180802104347
话食科普
·
2025-02-08 07:29
hive出现内存溢出
Hive之数据操作DML
查询语句中创建表并加载数据(AsSelect)创建表时通过Location指定加载数据路径Import数据到指定Hive表中5.2数据导出Insert导出Hadoop命令导出到本地HiveShell命令导出Export导出到
HDFS
WHYBIGDATA
·
2025-02-08 06:55
Hive
hive
hadoop
大数据
MapReduce的代码编写
getInstance()函数设置当前main函数所在的类,设置后运行代码可以找到函数的入口;③设置MapReduce的输入输出路径用于输入数据和输出计算的数据结果;注意若要是输出的路径在集群中已经存在,需要操作
HDFS
hjy1821
·
2025-02-08 02:27
MapReduce
MapReduce代码
WordCount字数统计代码
MapReduce编写
MapReduce使用案例
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他