E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop分片
Redis集群故障恢复实践:主从、哨兵、
分片
与Cluster模式详解
本文将详细介绍Redis集群在不同模式(主从、哨兵、
分片
与Cluster)下的故障恢复实践,帮助开发者更好地应对Redis集群的故障场景。
格子先生Lab
·
2025-03-05 12:51
redis
数据库
缓存
spark hdfs 常用命令
lsrmgettext以下按照使用频率和使用先后顺序排序(纯个人习惯)ls列出hdfs文件系统路径下的目录和文件hdfsdfs-ls列出hdfs文件系统路径下所有的目录和文件hdfsdfs-ls-Rrm
hadoop
fs-rm
毛球饲养员
·
2025-03-05 11:19
spark
spark
hdfs
Spark详解二
masterlocal[2](local[2]是说,执行Application需要用到CPU的2个核)2、Standalone独立模式:Spark自带的一种集群模式Spark自己管理集群资源,此时只需要将
Hadoop
卢子墨
·
2025-03-05 11:13
Spark原理
实战
总结
spark
Spark基本命令
一、spark所在目录cdusr/local/spark二、启动spark/usr/local/spark/sbin/start-all.sh启动
Hadoop
以及Spark:bash.
chenworeng5605
·
2025-03-05 10:42
大数据
scala
shell
Spark是什么?可以用来做什么?
相比传统的
Hadoop
MapReduce,Spark在速度、易用性和功能多样性上具有显著优势。
Bugkillers
·
2025-03-05 10:37
大数据
spark
大数据
分布式
37.索引生命周期管理—kibana 索引配置
背景引入索引生命周期管理的一个最重要的目的就是对大量时序数据在es读写操作的性能优化如通过sparkstreaming读取Kafka中的日志实时写入es,这些日志高峰期每天10亿+,每分钟接近100w,希望es能够对单
分片
超过
大勇任卷舒
·
2025-03-04 23:42
ELK
elasticsearch
大数据
big
data
Elasticsearch Data streams数据流实操
现有以下文档,请编写一个名为test_data_stream数据流满足以下请求:{"@timestamp":"2099-03-08T11:04:05.000Z","message":"test"}数据流索引的主
分片
数为
OliverCaro
·
2025-03-04 23:40
Elasticsearch
elasticsearch
大数据面试临阵磨枪不知看什么?看这份心理就有底了-大数据常用技术栈常见面试100道题
目录1描述
Hadoop
的架构和它的主要组件。2MapReduce的工作原理是什么?3什么是YARN,它在
Hadoop
中扮演什么角色?4Spark和
Hadoop
MapReduce的区别是什么?
大模型大数据攻城狮
·
2025-03-04 21:59
大数据
面试
职场和发展
面试题
数据仓库
算法
Spark使用Parqute存储方式有什么好处
列式存储:压缩效率和查询效率谓词下推存储层:查询数据块生态兼容性高:Spark,
hadoop
等都兼容
冰火同学
·
2025-03-04 21:27
Spark
spark
【Elasticsearch】索引生命周期管理相关的操作(Index Lifecycle Actions)
以下是详细解释Elasticsearch中的索引生命周期操作(IndexLifecycleActions):1.Allocate(分配)•功能:将索引
分片
移动到具有不同性能特征的节点上,并可以调整副本的数量
risc123456
·
2025-03-04 17:27
Elasticsearch
elasticsearch
Java软件架构中的服务拆分与数据库
分片
实践
Java软件架构中的服务拆分与数据库
分片
实践大家好,我是微赚淘客系统3.0的小编,是个冬天不穿秋裤,天冷也要风度的程序猿!今天我们来聊聊在大型Java系统中的服务拆分与数据库
分片
。
省赚客app开发者
·
2025-03-04 16:50
java
数据库
开发语言
初学者如何用 Python 写第一个爬虫?
大数据技术:涵盖
Hadoop
(HDFS)、Hive、Spark
ADFVBM
·
2025-03-04 16:19
面试
学习路线
阿里巴巴
python
爬虫
开发语言
【Elasticsearch】索引生命周期管理操作之Allocate(分配)
在Elasticsearch中,Allocate(分配)是一个与索引生命周期管理(IndexLifecycleManagement,ILM)相关的重要操作,用于控制索引
分片
在集群中的分配策略。
risc123456
·
2025-03-04 16:14
Elasticsearch
elasticsearch
hadoop
集群启动问题总结
首先,我们来尝试启动
hadoop
集群:start-all.sh然后,我遇到了下面的问题:Warning:Permanentlyadded'
hadoop
'(RSA)tothelistofknownhosts
@飞往你的山
·
2025-03-04 01:29
hadoop
hdfs
大数据
Linux 下Hive 安装(Remote Metastore Database 单节点)
1、Linux下安装好mysql:Linux下Mysql安装2、启动
hadoop
集群:1、zk启动[root@node02~]#zkServer.shstartZooKeeperJMXenabledbydefaultUsingconfig
A6-母婴小店-第6分店
·
2025-03-03 22:33
HIVE
hadoop
ORM Bee V2.5.2.x 发布,支持 CQRS; sql 性能分析;更新 MongoDB ORM
分片
Bee,一个具有
分片
功能的ORM框架.Bee=Hibernate/MyBatis+plus+ShardingJDBC+Jpa+Springdata+GraphQL+AppORM(Android,鸿蒙)小巧玲珑
abckingaa
·
2025-03-03 17:21
MongoDB
分库分表
Bee
sql
mongodb
数据库
大数据经典技术解析:
Hadoop
+Spark大数据分析原理与实践
Apache
Hadoop
和ApacheSpark是目前主流开源大数据框架。由于其易于部署、高容错性、并行计算能力强、适应数据量大、可编程、社区支持广泛等特点,大大提升了大数据应用的效率和效果。
AI天才研究院
·
2025-03-03 10:27
Python实战
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
tidb和mysql性能优化有哪些区别
-数据自动
分片
大0马浓
·
2025-03-03 10:56
tidb
mysql
【Elasticsearch】Elasticsearch集群在分布式环境下的管理
文章目录前言一、集群规划与设计1.1集群拓扑结构设计1.2节点角色分配1.3
分片
与副本配置二、集群管理与运维2.1集群监控2.2故障处理2.3性能优化三、扩展与升级3.1集群扩展3.2集群升级3.3灾备与容灾
屿小夏
·
2025-03-03 06:30
Elasticsearch
elasticsearch
分布式
大数据
Hadoop
基础知识及部署模式
一、
Hadoop
是什么
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。
2301_82242502
·
2025-03-03 06:28
hadoop
大数据
分布式
探讨
Hadoop
的基础架构及其核心特点
Hadoop
是一个开源软件框架,用于存储和处理大规模数据集。
xx155802862xx
·
2025-03-03 06:58
hadoop
大数据
分布式
Hadoop
毕业设计:计算机毕业设计选题汇总(建议收藏)
文章目录前言基于
Hadoop
的毕业设计选题毕设作品展示前言2025全新毕业设计项目博主介绍:✌全网粉丝10W+,CSDN全栈领域优质创作者,博客之星、掘金/华为云/阿里云等平台优质作者。
会写代码的羊
·
2025-03-03 05:16
毕设选题
hadoop
课程设计
大数据
毕设选题
毕设题目
数据分析
大数据技术学习框架(更新中......)
Hadoop
相关HDFS分布式文件系统MR(MapReduce)离线数据处理MR-图解YARN集群资源管理ZooKeeperZooKeeper分布式协调框架Hive相关Hive-01之数仓、架构、数据类型
小技工丨
·
2025-03-03 04:05
大数据技术学习
大数据
学习
Ubuntu从零创建
Hadoop
集群
目录前言前提准备1.设置网关和网段2.查看虚拟机IP及检查网络3.Ubuntu相关配置镜像源配置下载vim编辑器4.设置静态IP和SSH免密(可选)设置静态IPSSH免密5.JDK环境部署6.
Hadoop
爱编程的王小美
·
2025-03-02 12:57
大数据专业知识系列
ubuntu
hadoop
linux
Linux15 数据链路层
数据链路层什么是以太网以太网帧格式MAC地址MTU-以太网最大传输单元网络层IP数据包分包(
分片
)MTU对UDP协议的影响MTU对于TCP协议的影响ARP协议ARP协议的作用ARP协议的工作流程ARP数据报格式什么是以太网
辣椒味番茄
·
2025-03-02 10:35
Linux
linux
ES from size聚合查询10000聚合查询,是每个
分片
先聚合,再统计。还是所有节点查询1万条后,再聚合
在Elasticsearch中,聚合查询的执行过程是分布式的,Elasticsearch会先在每个
分片
(shard)上执行本地聚合,然后再在协调节点(coordinatingnode)上对所有
分片
的聚合结果进行全局汇总
C18298182575
·
2025-03-02 10:35
elasticsearch
elasticsearch
大数据
搜索引擎
windows10 ELK保姆级教程以及踩坑记录 适用于新版8.1.3
1.ES是个开源的分布式搜索引擎,它的特点是:分布式、零配置、自动发现,索引自动
分片
,索引副本机制,restful风格接口,多数据源,自动搜索负载等。
bug柯南
·
2025-03-02 08:16
ELK
java
用大白话解释数据库分库分表sharding是什么 有什么用 怎么用
Sharding(
分片
)就像把一整个图书馆的书拆开放到多个小房间,每个房间只存一部分书。这样找书的人不用挤在一个大厅里翻找,效率更高。
心心祥蓉
·
2025-03-02 07:15
数据库
GaussDB 学习进阶路线-进阶篇:分布式架构、性能调优与高可用实战
本文将以生产环境为背景,深入剖析GaussDB的数据
分片
、并行计算、主备容灾、云原生集成等核心技术,结合实战配置与调优案例,助你解锁GaussDB的高阶技能,构建稳定高效的分布式数据库系统!
Jan123.
·
2025-03-02 00:55
gaussdb
学习
分布式
GaussDB 学习实战指南:从部署到高并发优化的全流程解析
本文将以实战操作为核心,覆盖集群部署、数据
分片
、性能调优、容灾备份、云上迁移五大场景,通过真实案例与代码示例,助你快速掌握GaussDB的实战技能,解决企业级应用中的复杂问题!
Jan123.
·
2025-03-02 00:55
gaussdb
学习
Sharding-Sphere vs Mycat vs TiDB
数据库那般高效利用中间件模式SQL解析、执行计划优化等在中间件与数据库中重复工作,效率相比较低分布式事务相比于XA进行了优化,性能更高基于paxos(或Raft)协议的多副本,实现了真正的高可用、高可靠天生支持数据
分片
木一番
·
2025-03-01 18:12
分库分表
TiDB
每个索引大概有多少个
分片
?
Elasticsearch生产集群部署架构及面试解析在后端面试中,Elasticsearch(ES)是一个经常被问到的技术点,尤其是涉及到生产环境的部署架构。面试官往往希望通过这个问题来验证你是否有真正的生产经验,而不仅仅是玩过一些Demo。如果你对ES的生产环境一无所知,可能会在这个问题上暴露短板。因此,提前了解并掌握一些基本的生产环境参数,对于面试至关重要。一、为什么面试官会问这个问题?面试官
忍者算法
·
2025-03-01 18:40
elasticsearch
架构
大数据
使用宝塔大家Java项目遇到的问题
记录一下使用宝塔大家Java项目遇到的问题:1.没有那个文件或目录/var/tmp/springboot/vhost/scripts/system-service.sh:没有那个文件或目录Feb2811:13:01
hadoop
05spring_system-service
LOVE_DDZ
·
2025-03-01 10:45
JAVA
Spring-Boot
java
spring
boot
开发语言
如何使用Spark Streaming将数据写入HBase
Spark:确保Spark已经安装,并且Spark版本与HBase的
Hadoop
版本兼容。HBaseConnectorforSpark:你需要使用HBase的SparkConnecto
Java资深爱好者
·
2025-03-01 05:02
spark
hbase
大数据
项目经验之LZO压缩?思维导图 代码示例(java 架构)
在
Hadoop
生态系统中,使用LZO压缩可以显著减少存储空间,并且由于其快速的解压速度,对于大规模数据处理任务来说是非常有利的。以下是关于LZO压缩的项目经验总结、思维导图描述以及Java代码示例。
用心去追梦
·
2025-03-01 05:31
java
架构
开发语言
数据库必知必会系列:数据库
分片
与分布式事务
文章目录1.背景介绍分库分表
分片
集群分布式事务数据迁移2.核心概念与联系主从复制活动复制CAP原则BASE理论3.核心算法原理和具体操作步骤以及数学模型公式详细讲解分库分表水平分表垂直分库
分片
集群垂直拆分水平切分垂直切分水平拆分根据主键范围根据业务字段划分分布式事务两阶段提交协议三阶段提交协议可靠消息最终一致性
AI天才研究院
·
2025-03-01 03:51
AI大模型企业级应用开发实战
大数据
人工智能
语言模型
Java
Python
架构设计
HIVE 面试题总结
Hive依赖于HDFS存储数据,Hive将HQL转换成MapReduce执行,所以说Hive是基于
Hadoop
的一个数据仓库工具,实质就是一款基于HDFS的MapReduce计算框架,对存储在HDFS中的数据进行分析和管理
小余真旺财
·
2025-02-28 11:00
Hive
hive
Hive 面试题
Hive是基于
Hadoop
的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在
Hadoop
中的大规模数据的机制。
昨夜为你摘星
·
2025-02-28 11:59
Redis Cluster集群详解
数据
分片
(Sharding)哈希槽(HashSlot)机制:集群将数据划分为16384个哈希槽,每个键通过CRC16(key)%16384计算归属的槽。
高冷小伙
·
2025-02-28 10:21
redis
数据库
缓存
python调用kafka
先启动
hadoop
,zookeeper,kafka启动命令
hadoop
启动命令sbin/start-all.shzookeeper启动命令.
smile__su
·
2025-02-28 06:47
python
python
kafka
ZeRO分布式训练策略
ZeRO通过三级
分片
策略消除内存冗余,实现超大规模模型训练。其核心演进路线分为三个阶段:1.1ZeRO-1:优化器状态
分片
分片
对象:优化器参数(如Ad
AIGC_ZY
·
2025-02-28 02:13
大模型
分布式
mycat 分布式mysql_MySQL 部署分布式架构 MyCAT (五)
分片
(水平拆分)4.全局表业务使用场景:如果你的业务中有些数据类似于数据字典,比如配置文件的配置,常用业务的配置或者数据量不大很少变动的表,这些表往往不是特别大,而且大部分的业务场景都会用到,那么这种表适合于
weixin_39782573
·
2025-02-27 12:19
mycat
分布式mysql
Python大数据可视化:基于Python的王者荣耀战队的数据分析系统设计与实现_flask+
hadoop
+spider
开发语言:Python框架:flaskPython版本:python3.7.7数据库:mysql5.7数据库工具:Navicat11开发软件:PyCharm系统展示管理员登录管理员功能界面比赛信息管理看板展示系统管理摘要本文使用Python与MYSQL技术搭建了一个王者荣耀战队的数据分析系统。对用户提出的功能进行合理分析,然后搭建开发平台以及配置计算机软硬件;通过对数据流图以及系统结构的设计,创建
m0_74823490
·
2025-02-27 12:47
面试
学习路线
阿里巴巴
python
flask
hadoop
Redis面试题----为什么要做Redis分区?
Redis分区,也称为
分片
(Sharding),是将数据分散存储到多个Redis实例上的一种策略。
指尖下的技术
·
2025-02-27 08:54
Java面试题
redis
java
数据库
华为MRS产品组件
MRS:MRS是一个在华为云上部署和管理
Hadoop
系统的服务,一键即可部署
Hadoop
集群。
QianJin_zixuan
·
2025-02-27 06:59
hadoop
hive
大数据
数据库架构
gaussdb
Hive SQL 使用及进阶详解
一、Hive简介Hive是建立在
Hadoop
之上的数据仓库基础架构,它提供了类似于SQL的查询语言HiveSQL(也称为HQL),用于对存储在
Hadoop
分布式文件系统(HDFS)中的大规模数据进行数据查询和分析
小四的快乐生活
·
2025-02-27 03:37
hive
sql
hadoop
docker-compose -volumes 两种不同定义方式
学习docker-compose部署
hadoop
集群、看到docker-compose一种不同volumes定义方式version:"3"services:namenode:image:bde2020/
胖胖胖胖胖虎
·
2025-02-26 14:34
Docker
docker
hadoop
big
data
初识
hadoop
关于
hadoop
的写入(存入)nn里面维护了一份元数据。
西门吹水之城
·
2025-02-26 12:45
hadoop
hadoop
HDFS是如何存储和管理大数据
HDFS(
Hadoop
DistributedFileSystem,
Hadoop
分布式文件系统)是专为大数据处理而设计的分布式文件系统,具有高吞吐量、高容错性等特点,适用于大规模数据存储和管理。
python资深爱好者
·
2025-02-26 11:38
大数据
hdfs
hadoop
Hadoop
基础原理
Hadoop
基础原理基本介绍
Hadoop
的必要性
Hadoop
核心组件
Hadoop
生态系统中的附加组件HDFSHDFS集群架构HDFS读写流程HDFS写流程HDFS读流程NameNode持久化机制MapReduce
disgare
·
2025-02-26 11:38
数据库
hadoop
大数据
分布式
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他