E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop分布式系统
大数据 - Spark系列《四》- Spark分布式运行原理
Spark系列文章:大数据-Spark系列《一》-从
Hadoop
到Spark:大数据计算引擎的演进-CSDN博客大数据-Spark系列《二》-关于Spark在Idea中的一些常用配置-CSDN博客大数据
王哪跑nn
·
2024-02-05 08:54
spark
大数据
分布式
spark
RocketMQ之事务消息原理
分布式系统
调用的特点为一个核心业务逻辑的执行,同时需要调用多个下游业务进行处理。因此,如何保证核心业务和多个下游业务的执行结果完全一致,是分布式事务需要解决的主要
倜傥村的少年
·
2024-02-05 08:19
rocketmq
事务消息
【下一代分布式追踪】将Trace扩展到网络设备
为了有效监控、诊断和优化这些
分布式系统
,分布式追踪技术应运而生。传统的分布式追踪,如Zipkin、Jaeger和OpenTelemetry,已经能够很好地追踪应用程序
沐风—云端行者
·
2024-02-05 08:15
云计算架构
分布式
分布式追踪
trace
Hadoop
执行WorldCount出现的问题和解决
failedonconnectionexception:java.net.ConnectException:Connectionrefused;Formoredetailssee:http://wiki.apache.org/
hadoop
SZHjy
·
2024-02-05 08:38
大数据
hadoop
大数据
2.0
Hadoop
运行环境
由于
Hadoop
是为集群设计的软件,所以我们在学习它的使用时难免会遇到在多台计算机上配置
Hadoop
的情况,这对于学习者来说会制造诸多障碍,主要有两个:昂贵的计算机集群。
二当家的素材网
·
2024-02-05 07:01
Hadoop
教程
hadoop
大数据
分布式
impala与kudu进行集成
文章目录概要Kudu与Impala整合配置Impala内部表Impala外部表Impalasql操作kuduImpalajdbc操作表如果使用了
Hadoop
使用了Kerberos认证,可使用如下方式进行连接
shandongwill
·
2024-02-05 07:44
大数据
impala
kudu
impala与kudu集成
1.0
Hadoop
教程
Hadoop
是一个开源的分布式计算和存储框架,由Apache基金会开发和维护。
二当家的素材网
·
2024-02-05 06:38
Hadoop
教程
hadoop
大数据
分布式
3.0
Hadoop
概念
本章着重介绍
Hadoop
中的概念和组成部分,属于理论章节。如果你比较着急可以跳过。但作者不建议跳过,因为它与后面的章节息息相关。
二当家的素材网
·
2024-02-05 06:38
Hadoop
教程
hadoop
大数据
分布式
基于
hadoop
+spark的大规模日志的一种处理方案
而且CDN上的访问日志一般都非常大,需要用大数据处理架构来进行处理,本文描述了一种利用
hadoop
+spark来处理大量CDN日志的方法,当然本方
码农心语
·
2024-02-05 06:36
日志处理
大规模
大数据
hadoop
spark
cdn
日志追踪-Tracing
trace是请求在
分布式系统
中的整个链路视图,span则代表整个链路中不同服务内部的视图,span组合在一起就是整个trace的视图在整个请求的调用链中,请求会一直携带traceid往下游服务传递,每个服务内部也会生成自己的
孤雨蝉鸣
·
2024-02-05 04:34
spring框架
java
spring
cloud
spring
CAP & BASE理论
Consistency):所有节点访问同一份最新的数据副本可用性(Availability):非故障的节点在合理的时间内返回合理的响应(不是错误或者超时的响应)分区容错性(PartitionTolerance):
分布式系统
出现网络分区的时候
孤雨蝉鸣
·
2024-02-05 04:32
spring框架
java
spring
cloud
spring
linux中如何输入控制字符
看以下实例:以下文本中的字段用^A分隔,[leo@
hadoop
orgplan]$sed"s/^A//g"orgplan一定要注意^并不是数字键6上的
发狂的蜗牛
·
2024-02-05 01:47
linux
运维
服务器
Flink1.18.0集成Yarn-session模式部署
上次部署了
Hadoop
集群
Hadoop
3.3.6(HDFS、YARN、MapReduce)完全分布式集群安装搭建这次集成下flinkYARN上部署的过程是:客户端把Flink应用提交给Yarn的ResourceManager
china-zhz
·
2024-02-04 21:34
flink
yarn
hadoop
大数据
Hadoop
3.3.6(HDFS、YARN、MapReduce)完全分布式集群安装搭建
目录一、节点部署角色目录二、下载软件三、基础设施1、安装必要插件2、设置IP及主机名3、时间同步4、jdk安装5、ssh免密登录四、
Hadoop
部署1、目录及环境变量准备2、安装3、修改配置文件4、分发文件
china-zhz
·
2024-02-04 21:33
hdfs
mapreduce
hadoop
yarn
企业级大数据安全架构(九)FreeIPA管理员密码忘记后如何修改
作者:楼高1重置DirectoryServer管理员密码1.1停止directoryserver服务[root@ipaschema]#start-dirsrvHDP-
HADOOP
如果你不知道你的实例名,
云掣YUNCHE
·
2024-02-04 20:36
企业级大数据安全架构
大数据
安全架构
安全
Hadoop
集群搭建
搭建
Hadoop
集群涉及多个步骤,包括准备硬件环境、安装和配置
Hadoop
以及验证集群的安装。
终将老去的穷苦程序员
·
2024-02-04 19:53
hadoop
软件系统架构黄金法则16:海量结构化数据的扩展架构法则
本文将介绍一种基于
分布式系统
和数据分片技术的海量结构化数据扩展架构法则,该法则可以帮助企业和组织高效地存储、处理和分析海量结构化数据,提高
禅与计算机程序设计艺术
·
2024-02-04 19:21
计算
大数据
人工智能
语言模型
AI
LLM
Java
Python
架构设计
Agent
RPA
HDFS常用命令
hdfsdfs-putwc.input/user/anna/input查看上传的文件是否正确bin/hdfsdfs-cat/user/anna/input/wc.input运行mapreduce程序bin/
hadoop
jarshar
须臾之北
·
2024-02-04 18:41
Redis核心技术与实战【学习笔记】 - 21.Redis实现分布式锁
但是,Redis属于
分布式系统
,当有多个客户端需要争抢锁时,我们必须保证,这把锁不能是某个客户端的本地锁。否则其他客户端是无法访问这把锁的。
陈建111
·
2024-02-04 16:11
Redis核心技术学习
redis
redis分布式锁
alibabacloud学习笔记05(小滴课堂)
高并发下的微服务存在的问题高并发下的微服务容错方案介绍什么是
分布式系统
的流量防卫兵Sentinel微服务引入Sentinel和控制台搭建每个服务都加上这个依赖。
抹茶味的西瓜汁
·
2024-02-04 16:07
alibabaCloud
学习
笔记
Fink CDC数据同步(六)数据入湖Hudi
数据入湖HudiApacheHudi(简称:Hudi)使得您能在
hadoop
兼容的存储之上存储大量数据,同时它还提供两种原语,使得除了经典的批处理之外,还可以在数据湖上进行流处理。
大数据_苡~
·
2024-02-04 16:21
flink
hadoop
如何解决“
hadoop
:未找到命令”?
原因是未将
hadoop
命令添加至执行路径。
听风347
·
2024-02-04 15:17
eclipse
hadoop
大数据
做大数据需要学习哪些东西啊
Linux:因为大数据相关软件都是在Linux上运行的,所以Linux要学习的扎实一些,学好Linux对你快速掌握大数据相关技术会有很大的帮助,能让你更好的理解
hadoop
、hi
kuntoria
·
2024-02-04 14:02
redis分布式锁实现方法介绍
一、使用分布式锁要满足的几个条件:1、系统是一个
分布式系统
(关键是分布式,单机的可以使用ReentrantLock或者synchronized代码块来实现)2、共享资源(各个系统访问同一个资源,资源的载体可能是传统关系型数据库或者
爱喝马黛茶的安东尼
·
2024-02-04 14:00
大数据技术未来发展前景及趋势分析
Storm加速了流数据处理的过程,为
Hadoop
批处理提供实时数据处理。Spark:Spark是一个兼容
Hadoop
数据源的内存数据处理平台,运行速度相比于
Hadoop
MapReduce更快。
丨程序之道丨
·
2024-02-04 12:54
django基于
Hadoop
的小额信贷平台系统(程序+开题)
本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取系统程序文件列表开题报告内容研究背景:随着互联网技术的快速发展,小额信贷平台系统在金融领域得到了广泛应用。传统的小额信贷模式存在信息不对称、审批流程繁琐等问题,而小额信贷平台系统通过整合用户、银行和信贷公示等多方资源,实现了借款申请、撤销借款以及用户信用分等功能,为用户提供了更加便捷和高效的金融服务。意义:小额信贷平台系
liu10662
·
2024-02-04 12:36
django
python
后端
Hbase2.1 集群搭建
>Hbase在大数据的体系中扮演着DB角色,不得不说是重要的一员,在上一篇,大猪已经给大家演示了[
Hadoop
3.2集群搭建](https://www.jianshu.com/p/3182aaff918d
kikiki4
·
2024-02-04 11:08
Ranger-Yarn插件安装
登陆hdfs安装的用户,garrison/zdh1234(用户组
hadoop
),获取安装包解压安装scp/home/backup/ranger/ranger-0.6.0-yarn-plugin.tar.gz.tar–zxvfr
木木与呆呆
·
2024-02-04 10:22
消息队列-RabbitMQ
比如在
分布式系统
中,将整个系统按业务进行拆分。分成不同的子系统,系统A负责往redis存数据,系统B从redis中取数据。两个系统借助redis进行协作。
小飞侠要上天
·
2024-02-04 09:39
中间件学习
rabbitmq
分布式
Hadoop
详解
架构设计NameNodeNameNode:文件系统的命名空间(面试题)1.文件名称2.文件目录结构3.文件的属性(权限创建时间副本数)4.文件对应哪些数据块-->数据块对应哪些分布在哪些DN节点上列表不会持久化存储这个映射关系,是通过集群的启动和运行时,DataNode定期发送blockReport给NameNode,以此NameNode在【内存】中动态维护这种映射关系。作用:管理文件系统的命名空
ly稻草
·
2024-02-04 09:34
Hadoop
3.x基础(3)- Yarn
来源:B站尚硅谷目录Yarn资源调度器Yarn基础架构Yarn工作机制作业提交全过程Yarn调度器和调度算法先进先出调度器(FIFO)容量调度器(CapacityScheduler)公平调度器(FairScheduler)Yarn常用命令yarnapplication查看任务yarnlogs查看日志yarnapplicationattempt查看尝试运行的任务yarncontainer查看容器ya
魅美
·
2024-02-04 09:36
大数据基础
大数据
hadoop
转载-58同城离线计算平台设计与实践
58同城离线计算平台设计与实践编者荐语:58离线计算平台基于
Hadoop
生态体系打造,单集群4000+台服务器,数百PB存储,日40万计算任务,面临挑战极大。
无色的叶
·
2024-02-04 09:14
完结,从零开始学python(十八)想成为一名APP逆向工程师,需要掌握那些技术点?
我们来简单的回顾一下内容1.编程语法语法编程并发编程网络编程多线程/多进程/协程数据库编程MySQLRedisMongoDB2.机器学习3.全栈开发4.数据分析Numpy+pandas+Matplotlib
Hadoop
Spark5
爬完虫变成龙
·
2024-02-04 07:52
python
python开发
APP逆向
python
开发语言
python爬虫
python开发
java
APP逆向
NDK
Hive 主要内容一览
Hadoop
使用HDFS进行存储,使
大数据左右手
·
2024-02-04 07:13
Hive
大数据
面试
大数据
大数据本地环境搭建03-Spark搭建
需要提前部署好Zookeeper/
Hadoop
/Hive环境1Local模式1.1上传压缩包下载链接链接:https://pan.baidu.com/s/1rLq39ddxh7np7JKiuRAhDA?
OnePandas
·
2024-02-04 06:31
Spark
大数据集群环境搭建
大数据
spark
分布式
Hadoop
大数据实战系列文章之Hive
hive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,Hive定义了简单的类SQL查询语言,称为HQL,它允许熟悉SQL的用户查询数据可以将
测试帮日记
·
2024-02-04 05:45
spark运维问题记录
环境:spark-2.1.0-bin-
hadoop
2.71.Spark启动警告:neitherspark.yarn.jarsnotspark.yarn.archiveisset,fallingbacktouploadinglibrariesunderSPARK_HOME
lishengping_max
·
2024-02-04 05:11
Spark
spark
解决“Spark context stopped while waiting for backend“ issue
在配置为4C16G的虚拟机上安装
hadoop
生态全家桶,在安装Spark2,使用了社区版2.3的版本。
江畔独步
·
2024-02-04 05:10
Spark
bigdata
大数据组件部署下载链接
Hadoop
2.7下载连接:https://archive.apache.org/dist/
hadoop
/core/
hadoop
-2.7.6/Hive2.3.2下载连接:http://archive.apache.org
运维道上奔跑者
·
2024-02-04 05:13
大数据
zookeeper
hbase
kafka
hadoop
hive
【大数据开发运维解决方案】
Hadoop
+Hive+HBase+Kylin 伪分布式安装指南
Hadoop
2.7.6+Mysql5.7+Hive2.3.2+Hbase1.4.9+Kylin2.4单机伪分布式安装文档注意:######################################
运维道上奔跑者
·
2024-02-04 05:43
大数据
hadoop
分布式
Hadoop
2.7.6+Mysql5.7+Hive2.3.2+zookeeper3.4.6+kafka2.11+Hbase1.4.9+Sqoop1.4.7+Kylin2.4单机伪分布式安装及官方案例测
#################################################################最新消息:关于spark和Hudi的安装部署文档,本人已经写完,连接:
Hadoop
2.7.6
运维道上奔跑者
·
2024-02-04 05:43
分布式
hbase
zookeeper
hadoop
分布式架构设计之CAP定理
「CAP定理」又被称为布鲁尔定理,它提出对于一个
分布式系统
而言,不能同时满足以下三点:Consisteny(一致性)Availability(可用性)Partitiontolerance(分区容错性)也就是说
JerryAi
·
2024-02-04 02:20
2021-07-02
Hadoop
集群构建配主机名vi/etc/sysconfig/networkNETWORKING=yesHOSTNAME=
hadoop
012.配置IP映射vi/etc/hosts127.0.0.1localhostlocalhost.localdomainlocalhost4localhost4
谢尔比比
·
2024-02-04 02:40
笔记
Fabric1.4.4 raft测试
如果一个
分布式系统
可以处理拜占庭故障,那么它就可以容忍任
蒋堪
·
2024-02-04 01:04
完整的 HTTP 请求所经历的步骤及分布式事务解决方案
1.对分布式事务的了解分布式事务是企业集成中的一个技术难点,也是每一个
分布式系统
架构中都会涉及到的一个东西,特别是在微服务架构中,几乎可以说是无法避免。首先要搞清楚:ACID、CAP、BASE理论。
YmovomY
·
2024-02-04 00:32
http
分布式
网络协议
Kafka消息流转的挑战与对策:消息丢失与重复消费问题
消息丢失和重复消费时
分布式系统
重的常见问题,如果处理不好会对业务造成很大的影响。
超越不平凡
·
2024-02-04 00:26
kafka
分布式
消息丢失和重复消费
Zabbix 介绍及部署:
zabbix是一个基于web界面的提供
分布式系统
监控以及网络监视功能的企业级的开源解决方案。zabbix由两部分构成,zabbixserver与可选组件zabbixagent。
努力转型的IT小王
·
2024-02-03 22:33
Zabbix
监控
zabbix
linux
运维
hadoop
、spark、flink集群修改默认ssh端口号
大数据集群在实际搭建过程中,其默认ssh端口不一定都是22,这时需要根据各自的配置文件进行适配。ssh端口号默认为22,以centos7.x为例,可以在/etc/ssh/sshd_config中进行修改,如下示例将22改为22222:#IfyouwanttochangetheportonaSELinuxsystem,youhavetotell#SELinuxaboutthischange.#sem
0X码上链
·
2024-02-03 21:12
大数据
分布式技术
ssh
hadoop
spark
flink
Zookeeper集群安装
简介ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是
Hadoop
和Hbase的重要组件。
万总有点菜
·
2024-02-03 21:14
2019-10-08 大数据开发进阶之路
市场需要的水平熟练掌握Linux、SQL与HiveSQL掌握
Hadoop
生态主流技术,如HDFS/MapRedunce/Yarn/HBase/Flume等掌握Spark生态核心技术,如Spark架构/RDD
红瓦李
·
2024-02-03 20:39
上一页
10
11
12
13
14
15
16
17
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他