E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop文件系统
Docker学习笔记
文章目录Docker的基本概念容器的概念容器的特点容器与虚拟机的区别容器的三个核心概念Docker的底层隔离机制NameSpaceCgroupUnion
文件系统
Linux安装DockerCentOSUbuntuDocker
Hi,你好啊
·
2024-09-09 02:10
运维
docker
学习
笔记
Hbase、hive以及ClickHouse的介绍和区别?
一、Hbase介绍:HBase是一个分布式的、面向列的开源数据库,由ApacheSoftwareFoundation开发,是
Hadoop
生态系统中的一个重要组件。
damokelisijian866
·
2024-09-08 23:43
hbase
hive
clickhouse
Flink - CEP
Hadoop
3.2集群新版本的搭建详细讲解过程,从下面第一张官方的图来看,最新版是3.2,所以大猪将使用3.2的版本来演示,过程中遇到的坑留给自己,把路留给你们,IT之路还有大猪。
kikiki1
·
2024-09-08 21:46
【python实用性】
文件系统
基本讲解及用法: “增删改查“
文章目录一.增:创建文件二.删:删除文件三.改:修改文件四.查:查看
文件系统
一.增:创建文件创建脚本文件(例如:.txt、.js、.json、.py等)使用withopen(file=‘’,mode=‘
黄小莫
·
2024-09-08 18:15
python
分布式
文件系统
FastDFS动态扩容
当用户量越来越大,则集群中某个group总会到达其极限,这时就得扩展集群的容量了。FastDFS的扩容分为对group纵向扩容和横向扩容纵向扩容指在同一个group组中增加服务器,实现数据冗余,数据备份。同一个group中最大容量取决于最小的storage的存储容量。因此如果还想继续使用此group,则需要对此group对应的所有服务器挂载同样容量的磁盘,指定store_path1……,但这样做的
欢醉
·
2024-09-08 18:38
chapter01 Java语言概述 知识点Note
JavaSEJavaEEJavaME大数据Java基础常用技术栈mysqlJDBCSSMspring+springmvc+mybatisLinuxnacos
Hadoop
FlinkJAVAEE消息队列rabbitMQdocker
月下绯烟
·
2024-09-08 18:42
Java
java
开发语言
Hive和Hbase的区别
Hive和HBase都是
Hadoop
生态系统中的重要组件,它们都能处理大规模数据,但各自有不同的适用场景和设计理念。
傲雪凌霜,松柏长青
·
2024-09-08 17:37
大数据
后端
hive
hbase
hadoop
HBase
ApacheHBase是一个基于
Hadoop
分布式
文件系统
(HDFS)构建的分布式、面向列的NoSQL数据库,主要用于处理大规模、稀疏的表结构数据。
傲雪凌霜,松柏长青
·
2024-09-08 17:07
大数据
后端
hbase
数据库
大数据
Hive的优势与使用场景
Hive的优势Hive作为一个构建在
Hadoop
上的数据仓库工具,具有许多优势,特别是在处理大规模数据分析任务时。
傲雪凌霜,松柏长青
·
2024-09-08 17:07
后端
大数据
hive
hadoop
数据仓库
大数据技术之
Hadoop
(一)
Hadoop
概述1.1
Hadoop
是什么
Hadoop
是什么1)
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构。2)主要解决,海量数据的存储和海量数据的分析计算问题。
pauls
·
2024-09-08 16:30
大数据面试题:说下为什么要使用Hive?Hive的优缺点?Hive的作用是什么?
Hive是
Hadoop
生态系统中比不可少的一个工具,它提供了一种SQL(结构化查询语言)方言,可以查询存储在
Hadoop
分布式
文件系统
(HDFS)中的数据或其他和
Hadoop
集成的
文件系统
,如MapR-FS
蓦然_
·
2024-09-08 15:50
大数据面试题
hive
大数据开发面试题
大数据面试
Flask-Caching
Flask-Caching的主要特点多种缓存后端支持:Flask-Caching支持多种缓存后端,包括内存缓存(如SimpleCache)、
文件系统
缓存、Memcached缓存、Redis
Botiway
·
2024-09-08 13:07
FlaskWeb
python
flask
后端
linux
web3
python flink_《Flink官方文档》Python 编程指南测试版
操作执行的结果通过数据池以写入数据到(分布式)
文件系统
或标准输出(例如命令行终端)的形式返回。Flink程序可以运行在不同的环境中,既能够独立运行,也可以嵌入到其他程序中运行。
weixin_39846361
·
2024-09-08 08:04
python
flink
ERROR:master启动报错: Attempting to operate on hdfs namenode as root
[root@master
hadoop
]#sbin/start-all.shStartingnamenodeson[master]ERROR:AttemptingtooperateonhdfsnamenodeasrootERROR
CourageLee
·
2024-09-08 07:55
Docker
hadoop
linux
Docker的前世今生
4.Docker相对于LXC所做的重大提升:容器管理工具、分层
文件系统
和镜像机制一、Docker开源项目背景Docker是基于Go语言实现的开源容器项目,诞生于2013年年初,最
weixin_30267697
·
2024-09-08 04:03
运维
操作系统
数据库
Linux 磁盘分区及挂载
目录查看分区情况查看磁盘查看哪块磁盘未加载和分区对未进行挂载的磁盘进行分区内核重新读取分区表再查看磁盘分区情况创建
文件系统
及格式化分区查看已经分区的磁盘
文件系统
格式化分区永久挂载至指定目录判断挂载是否正确查看
文件系统
go_forever_happy
·
2024-09-08 02:53
linux
服务器
运维
Python大数据:深入探索
Hadoop
库的使用
在大数据的世界中,Python和
Hadoop
结合使用,为处理庞大数据集提供了强大的工具。本文将详细探讨如何在Python中使用
Hadoop
,特别是通过实例来展示这一过程。
t0_54coder
·
2024-09-07 17:22
Python基础入门教程
大数据
python
hadoop
Python 操作大数据使用
Hadoop
参考:https://blog.csdn.net/wuShiJingZuo/article/details/135620018fromhdfsimportInsecureClienthdfs_client=InsecureClient("http://localhost:9000",user="xiaokkk")#测试连接print(hdfs_client.status("/")){'access
静听山水
·
2024-09-07 17:47
Hadoop
hadoop
flink 问题记录
文章目录1.Causedby:java.lang.UnsatisfiedLinkError:org.apache.
hadoop
.util.NativeCrc32.nativeComputeChunkedSums
Jhon_yh
·
2024-09-07 15:34
flink
flink
hadoop
大数据
linux 查看进程使用哪些文件
被打开的文件可以是1.普通的文件,2.目录3.网络
文件系统
的文件,4.字符设备文件5.
nit小星星
·
2024-09-07 14:21
df 磁盘整体使用量 /du 查看目录的大小
命令格式:df[option]-h以容易理解的格式(给人看的格式)输出
文件系统
分区使用情况,例如10kB、10MB、10GB等。-k以kB为单位输出
文件系统
分区使用情况。
数据萌新
·
2024-09-07 11:28
Spark概念知识笔记
最近总结了个人的各项能力,发现在大数据这方面几乎没有涉及,因此想补充这方面的知识,丰富自己的知识体系,大数据生态主要包含:
Hadoop
和Spark两个部分,Spark作用相当于MapReduceMapReduce
kuntoria
·
2024-09-07 05:21
【
Hadoop
】- MapReduce & YARN 初体验[9]
目录提交MapReduce程序至YARN运行1、提交wordcount示例程序1.1、先准备words.txt文件上传到hdfs,文件内容如下:1.2、在hdfs中创建两个文件夹,分别为/input、/output1.3、将创建好的words.txt文件上传到hdfs中/input1.4、提交MapReduce程序至YARN1.5、可通过node1:8088查看1.6、返回我们的服务器,检查输出文
星星法术嗲人
·
2024-09-07 04:21
hadoop
hadoop
mapreduce
Apache Storm:入门了解
前言Storm是一个开源的分布式实时计算系统,它能够处理无边界的数据流,类似于
Hadoop
对于批量数据处理的作用,但是Storm更侧重于实时数据流的处理。
布说在见
·
2024-09-07 03:43
apache
storm
大数据
如何做大数据测试
2、测试工具:大数据测试需要使用专门的测试工具和框架,如
Hadoop
Unit、ApacheBigTop、JMeter、LoadRunner等,而普通测试则可以使用通用的测试工具和框架,如JUnit、TestNG
测试界潇潇
·
2024-09-06 18:47
软件测试
软件测试
功能测试
自动化测试
程序人生
职场和发展
/var/lib/docker/overlay2 占用很大,清理Docker占用的磁盘空间
上图中看到的overlay分区是Docker的虚拟
文件系统
,其真实的
文件系统
是/dev/vda1。所以我们要找到是什么原因大量占据了/dev/vda1。一般有两种情况。
@小匠
·
2024-09-06 17:36
运维
docker
容器
运维
基于
Hadoop
的学习行为数据云存储平台的设计与实现
基于
Hadoop
的学习行为数据云存储平台的设计与实现DesignandImplementationofa
Hadoop
-BasedLearningBehavioralDataCloudStoragePlatform
usp1994
·
2024-09-06 16:03
hadoop
学习
大数据
DAG (directed acyclic graph) 作为大数据执行引擎的优点
DR-ConceptuallyDAGmodelisastrictgeneralizationofMapReducemodel.DAG-basedsystemslikeSparkandTezthatareawareofthewholeDAGofoperationscandobetterglobaloptimizationsthansystemslike
Hadoop
MapReducewhicha
joeywen
·
2024-09-06 04:43
分布式计算
Storm
Spark
Storm
杂谈
Storm
spark
DAG
JuiceFS 社区版 v1.2 发布,新增企业级权限管理、平滑升级功能
JuiceFS是为云环境设计的分布式
文件系统
,支持超过10种元数据引擎和30种以上的数据存储引擎。
Juicedata
·
2024-09-06 01:24
云原生
运维
hadoop
-hdfs系统构成
2019独角兽企业重金招聘Python工程师标准>>>HDFS组成1)NameNode元数据2)DataNode存储文件内容block3)SecondaryNameNode合并NameNode与editsHDFS缺点1)不能低延迟访问2)小文件存取占用大量NameNode内存空间寻道时间超过读取时间3)并发写入,文件随机修改一个文件只能有一个写着仅支持appendHDFS存储数据单元1)文件被切分
weixin_33701564
·
2024-09-06 00:46
大数据
python
操作系统
python windows路径正则表达式,Python 正则表达式从Windows路径中获取文件夹
推荐文章一,要使用正则表达式相关的方法,首先得搞清楚正则表达式的基本用法,摘自百度百科:元字符描述将下一个字符标记为一个特殊字符推荐文章学习
Hadoop
Common模块,当然应该是从最简单,最基础的模块学习最好
弓长丶艮
·
2024-09-06 00:16
python
windows路径正则表达式
Ingest Pipeline & Painless Script
DELETEtech_blogs#Blog数据,包含3个字段,tags用逗号间隔PUTtech_blogs/_doc/1{"title":"Introducingbigdata......","tags":"
hadoop
折纸虚桐
·
2024-09-05 22:03
ES学习笔记
elasticsearch
Hadoop
组件
这张图片展示了
Hadoop
生态系统的一些主要组件。
Hadoop
是一个开源的大数据处理框架,由Apache基金会维护。
静听山水
·
2024-09-05 20:14
Hadoop
hadoop
linux基础之目录结构
目录1.简介2.linux的目录结构分类3.详细目录介绍4.总结1.简介Linux是一个基于Unix的开源操作系统,其
文件系统
具有层次化的目录结构,这种结构以根目录/作为起点,向下展开成一个倒置的树状结构
甜航一直在
·
2024-09-05 18:29
linux基础
linux
运维
服务器
笔记
Azkaban:强大的开源工作流调度系统
Azkaban是LinkedIn开发的一款开源工作流调度系统,专为管理和调度大规模的
Hadoop
作业设计。它提供了一种简单且有效的方式来定义、调度和监控复杂的工作流,确保批处理任务按预期顺序执行。
Hello.Reader
·
2024-09-05 15:15
其他
大数据
开源
大数据
k8s - Volume 简介和HostPath的使用
Secret,configMap(之前的文章covered了),hostPath,emptyDir等本文主要focusonhostPathHostPath的简介官方定义:hostPath卷能将主机节点
文件系统
上的文件或目录挂载
nvd11
·
2024-09-05 15:13
K8S
kubernetes
容器
云原生
梧桐数据库(WuTongDB):详解B树索引的原理和实现方法
B树索引的原理和实现方法**B树(BalancedTree)**是一种自平衡的树形数据结构,广泛应用于数据库和
文件系统
中,尤其用于实现索引。B树能够有效保持数据的有序性,支持高效的范围查询和等值查询。
鲁鲁517
·
2024-09-05 15:11
梧桐数据库
数据库
b树
数据结构
梧桐数据库
Hadoop
-MapReduce机制原理
、MapReduce概述2、MapReduce特点3、MapReduce局限性4、MapTask5、Map阶段步骤:6、Reduce阶段步骤:7、MapReduce阶段图1、MapReduce概述
Hadoop
MapReduce
H.S.T不想卷
·
2024-09-05 11:46
大数据
hadoop
mapreduce
大数据
C# 中一个非常实用的类FileSystemWatcher,监视
文件系统
中文件或目录的更改
FileSystemWatcher类在C#中是一个非常实用的类,用于监视
文件系统
中文件或目录的更改,并可以触发事件来响应这些更改。这些更改包括文件或目录的创建、删除、更改以及重命名等。
AitTech
·
2024-09-05 10:06
c#
开发语言
大数据生态圈里的一致性算法
大数据生态圈中,保证一致性的方式举不胜举
Hadoop
用Zookeeper(Zab,Paxos+事务顺序)ElasticSearch用Hash路由算法(非一致性Hash)Cassandra用Gossip闲话算法
宇宙湾
·
2024-09-05 07:35
71. 简化路径【 力扣(LeetCode) 】
在Unix风格的
文件系统
中,一个点(.)表示当前目录本身;此外,两个点(…)表示将目录切换到上一级(指向父目录);两者都可以是复杂相对路径的组成部分。
理论最高的吻
·
2024-09-05 06:12
leetcode
算法
职场和发展
C++
栈
如何使用 TLS 保护 Docker 的 TCP 套接字
Docker的API默认情况下完全不受保护,除了其Unix套接字上的
文件系统
权限。您应该在通过TCP公开DockerAPI时设置TLS,以便Docker引擎和您的客户端可以验证彼此的身份。
mikes zhang
·
2024-09-05 04:30
Docker最全实战教程
运维
docker
运维
容器
第十一章、深入理解Linux
文件系统
与日志分析
第十一章、深入理解Linux
文件系统
与日志分析一、inode与block1、inode与block概述1.1文件数据包括元信息与实际数据1.2文件存储在硬盘上,硬盘最小存储单位是“扇区”,每个扇区存储512
知识不往脑子里进
·
2024-09-05 03:21
linux
服务器
数据库
EMR组件部署指南
本文将详细介绍如何部署EMR的主要组件,包括:JDK1.8ElasticsearchKafkaFlinkZookeeperHBase
Hadoop
PhoenixScalaSparkHive准备工作所有操作都在
ivwdcwso
·
2024-09-05 00:05
运维
EMR
大数据
开源
运维
Mac 安装
Hadoop
教程(HomeBrew安装)
1.引言本教程旨在介绍在Mac电脑上安装
Hadoop
,便于编程开发人员对大数据技术的熟悉和掌握。2.前提条件2.1安装JDK想要在你的Mac电脑上安装
Hadoop
,你必须首先安装JDK。
追光天使
·
2024-09-04 22:21
macos
hadoop
大数据
Sublime text3+python3配置及插件安装
微信公众号:rayson_666(Rayson开发分享)个人专研技术方向:微服务方向:springboot,springCloud,Dubbo分布式/高并发:分布式锁,消息队列RabbitMQ大数据处理:
Hadoop
raysonfang
·
2024-09-04 19:23
关于Apache Hive 和 Apache Iceberg
Hive主要负责将
Hadoop
的数据组织成表
[听得时光枕水眠]
·
2024-09-04 17:55
apache
hive
hadoop
大数据学习|理解和对比 Apache Hive 和 Apache Iceberg
文章目录数据模型与存储事务支持性能优化使用场景总结数据模型与存储Hive:Hive使用的是传统的关系型数据模型,数据存储在
Hadoop
分布式
文件系统
(HDFS)中,通常是以文本格式(如CSV或TSV)或者二进制格式
进击的小白菜
·
2024-09-04 16:50
数据库
大数据
大数据
学习
apache
剔除vg中的pv--xfs
文件系统
xfs
文件系统
不支持缩小操作,如果要踢盘,那就必须把目录做备份,重做挂接点拷贝恢复了。
好记忆不如烂笔头abc
·
2024-09-04 16:50
python
numpy
开发语言
使用pgrs在wsl中为postgres写拓展
数据组合流派核心功法,近期duckdb,zombodb,datafusion等等产品都是数据组合流思路体现,把这套功法练到大成,处于2024年,综合数据规模/相应速度/和数据应用层解耦,就有了一个最佳答案.比以前
hadoop
wangmarkqi
·
2024-09-04 03:19
rust
数据库
上一页
8
9
10
11
12
13
14
15
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他