E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
分布式系统_spark
初识
spark
本文通过介绍的是大数据领域优秀框架
spark
,打开分布式实时计算的大门1.spar
wlyang666
·
2025-02-06 08:20
大数据之spark
spark
大数据
分布式
一次
spark
streaming 性能抖动问题解决和分析
问题现象业务通过
spark
stream处理10000+上数据大致需要30s时间,但偶发出现超过30s的情况问题分析
spark
stream是内存密集型的应用,一般出现延迟通常是因为以下两个原因:内存分配过程出现延迟
spring208208
·
2025-02-06 04:18
spark
大数据组件线上问题分析
spark
大数据
分布式
Spring Cloud微服务
一、SpringCloud简介定位:基于SpringBoot的
分布式系统
开发工具集,提供微服务架构的完整解决方案。核心功能:服务发现、配置管理、负载均衡、熔断限流、API网关等。
程序老猫
·
2025-02-06 04:47
spring
cloud
微服务
spring
一次线程数超限导致的hive写入hbase作业失败分析
每次报错的任务不是同一个,hivesql任务分为2个阶段:第1个阶段是hive自处理阶段,底层是
spark
计算引擎。出现oom,无法开启新的
spring208208
·
2025-02-06 04:46
大数据组件线上问题分析
大数据
hive
hbase
分布式系统
架构5:限流设计模式
分布式系统
架构5:限流设计模式这是小卷对
分布式系统
架构学习的第5篇文章,今天来学习限流器和限流设计模式1.为什么要限流?
·
2025-02-05 17:35
盘点大数据生态圈,那些繁花似锦的开源项目
盘点大数据生态圈,那些繁花似锦的开源项目发表于12小时前|2466次阅读|来源CSDN|6条评论|作者仲浩大数据开源Hadoop
Spark
width="22"height="16"src="http
AI周红伟
·
2025-02-05 17:30
大数据
深度学习
Java 提供了哪些 IO 方式? NIO 如何实现多路复用?
I/O一直是软件开发中的核心部分之一.伴随着海量的数据增长和
分布式系统
的发展.IO扩展显得尤为重要.幸运的是.Java经过多年的发展,IO机制也不断地完善,虽然仍有某些不足,但已经在实践中证明了其构建高扩展性应用的能力
爪哇小白2021
·
2025-02-05 17:58
Java面试题
java
nio
开发语言
开源项目推荐:基于Lambda架构的大数据管道
开源项目推荐:基于Lambda架构的大数据管道big-data-pipeline-lambda-archAfullbigdatapipeline(LambdaArchitecture)with
Spark
柳旖岭
·
2025-02-05 16:53
《AI赋能行业实战:揭秘企业数字化转型最佳实践,落地案例深度解析!》 ---- 总目录
文章大纲金融行业落地实践浅析基于Py
Spark
进行信用卡评分--实战案例迁移学习小样本金融风控生物信息识别大健康行业落地实践浅析传统行业深度融合升级如何深度参与创业?
shiter
·
2025-02-04 20:58
人工智能系统解决方案与技术架构
人工智能
大数据
AI
对比JSON和Hessian2的序列化格式
在
分布式系统
中,数据的序列化和反序列化是关键环节。不同的序列化格式在性能、可读性和跨语言兼容性上存在显著差异。
yyytucj
·
2025-02-04 16:30
json
Dubbo与Spring Cloud的区别?
Dubbo与SpringCloud的区别分析在
分布式系统
中,微服务架构的实现是现代企业架构的核心,而Dubbo和SpringCloud作为两大常用框架,各自有其独特的特点和优势。
·
2025-02-04 14:28
Spark
3.1.2单机安装部署
spark
3.1.2单机安装部署概述
Spark
是一个性能优异的集群计算框架,广泛应用于大数据领域。
花菜回锅肉
·
2025-02-04 07:43
大数据
spark
大数据
hadoop
Spark
基本概念
Spark
核心组件Driver将用户程序转化为作业(job)在Executor之间调度任务(task)跟踪Executor的执行情况通过UI展示查询运行情况Executor
Spark
Executor是集群中工作节点
javafanwk
·
2025-02-04 00:18
Spark
大数据
spark
架构
大数据
Spark
基本概念
#官网部分解释ClusterModeOverview-
Spark
3.3.0DocumentationApplication:指的是用户编写的
Spark
应用程序/代码,一个完整的main方法程序,包含了Driver
Buutoorr
·
2025-02-04 00:17
spark
大数据
分布式
scala
算法基础——一致性
引入最早研究一致性的场景既不是大数据领域,也不是
分布式系统
,而是多路处理器。
黄雪超
·
2025-02-03 23:10
大数据基础
#
算法基础
大数据
算法
一致性
Spark
基础【RDD依赖关系--源码解析】
文章目录一RDD依赖关系1RDD血缘关系2RDD依赖关系3RDD阶段划分4RDD任务划分一RDD依赖关系1RDD血缘关系相邻两个RDD之间的关系,称之为依赖关系,多个连续的依赖关系称之为血缘关系RDD只支持粗粒度转换,即在大量记录上执行的单个操作。将创建RDD的一系列Lineage(血统)记录下来,以便恢复丢失的分区。RDD的Lineage会记录RDD的元数据信息和转换行为,当该RDD的部分分区数
OneTenTwo76
·
2025-02-03 21:52
Spark
spark
scala
大数据
Hive重点面试题
数据倾斜原因与解决方法6.HiveMapReduce的底层实现与优化方式7.Hive窗口函数的使用场景8.Hive分区与分桶的区别9.Hive的存储格式10.Hive计算引擎(MapReduce,Tez,
Spark
Major Tom _
·
2025-02-03 20:43
hive
hadoop
数据仓库
三十四、领域驱动设计DDD(DDD 与微服务架构结合)
在现代企业应用中,领域驱动设计(DDD)与微服务架构的结合被认为是应对复杂业务系统和大规模
分布式系统
的有效方法。
伯牙碎琴
·
2025-02-03 17:20
架构
架构
微服务
运维
分布式架构中的事务管理:需要了解的常见解决方案
但在
分布式系统
中,事务跨多个服务或数据库,这就带
四七伵
·
2025-02-03 16:12
Java
面试宝典
分布式
架构
后端
分布式事务
分布式之消息中间件
4.消息中间件传递模式 *4.1点对点模式(PTP) *4.2发布-订阅模型(Pub/Sub)1.消息中间件概述 消息中间件利用高效可靠的消息传递机制进行平台无关的数据交流,并基于数据通信来进行
分布式系统
的集成
CatalpaFlat
·
2025-02-03 15:30
分布式
消息队列
Java RabbitMQ 的作用是什么? 使用场景有哪些?有哪些优缺点?
RabbitMQ是一个开源的消息队列系统,用于在
分布式系统
中传递消息。它实现了AMQP(AdvancedMessageQueuingProtocol)协议,为应用提供了可靠的消息传递机制。
学习资源网
·
2025-02-03 12:08
java-rabbitmq
java
rabbitmq
Windows下Go语言环境搭建和使用
可以用于系统监控、容器技术(Docker)、大数据、存储技术、
分布式系统
(HyperledgerFabric)、消息系统(Kafka客户端)、服务器管理、安全工具、Web工具等。
go语言学习基地
·
2025-02-03 11:36
GO语言学习
golang
windows
开发语言
linux的apache安装,Apache Kylin | 安装指南
软件要求Hadoop:2.7+,3.1+(sincev2.5)Hive:0.13-1.2.1+HBase:1.1+,2.0(sincev2.5)
Spark
(可选)2.3.0+Kafka(可选)1.0.0
姜白的树洞
·
2025-02-03 07:26
linux的apache安装
kylin linux 安装教程,Apache Kylin | 安装指南
软件要求Hadoop:2.7+Hive:0.13-1.2.1+HBase:1.1+
Spark
2.1.1+JDK:1.7+OS:Linuxonly,CentOS6.5+orUbuntu16.0.4+用HortonworksHDP2.2
社本
·
2025-02-03 07:26
kylin
linux
安装教程
分布式系统
架构设计原理与实战:分布式缓存的设计与实现
1.背景介绍
分布式系统
架构设计原理与实战:分布式缓存的设计与实现作者:禅与计算机程序设计艺术背景介绍1.1
分布式系统
的基本概念
分布式系统
是指由多个autonomouscomputer组成,这些computer
AI天才研究院
·
2025-02-03 07:26
计算
计算
大数据
人工智能
语言模型
AI
大模型
LLM
Java
Python
架构设计
Agent
RPA
Kafka 监控及使用 JMX 进行远程监控的安全注意事项
此外,由于Kafka是一个
分布式系统
,因此Topic在多个节点之间进行分区和复制。此外,Kafka可以成为数据集成的极具吸引力的选择,具有有意义的性能监控和对问题的及时警报。
流华追梦
·
2025-02-02 09:18
Kafka
kafka
Kafka监控
kafkamonitoring
kafka使用jmx
jmx远程监控
messageinrate
requestrate
Java 大视界 -- Java 与
Spark
SQL:结构化数据处理与查询优化(五)
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。本博客的精华专栏:大数
青云交
·
2025-02-02 05:39
大数据新视界
Java
大视界
Spark
SQL
结构化数据
查询优化
数据分区
缓存策略
日志分析
电商数据分析
java
集群部署时的分布式 Session 如何实现?
面试官心理分析面试官问了你一堆Dubbo是怎么玩儿的,你会玩儿Dubbo就可以把单块系统弄成
分布式系统
,然后分布式之后接踵而来的就是一堆问题,最大的问题就是分布式事务、接口幂等性、分布式锁,还有最后一个就是分布式
码农小旋风
·
2025-02-02 02:29
后端
Hive 整合
Spark
全教程 (Hive on
Spark
)
hadoop.proxyuser.luanhao.groups*hadoop.proxyuser.luanhao.groups*2)HDFS配置文件配置hdfs-site.xmldfs.namenode.http-addressBigdata00:9870dfs.namenode.secondary.http-addressBigdata00:9868dfs.replication13)YARN配
字节全栈_rJF
·
2025-02-02 02:56
hive
spark
hadoop
什么是SpringCloud框架?Spring Boot框架和传统Spring框架相比有哪些优势?
SpringCloud是一系列框架的有序集合,它利用SpringBoot的开发便利性简化了
分布式系统
的开发,比如服务发现.服务网关.服务路由.链路追踪等。
是一只萨摩耶
·
2025-02-02 01:49
Java
spring
cloud
spring
spring
boot
java
后端
微服务02:如何解决或者说降低架构复杂度?
CAP定理强调了
分布式系统
中三个关键属性之间的固有权衡,这三个属性分别是:一致性(Consistency)可用性(Availability)分区容忍性(PartitionTolerance)以
爆炸糖_Alex
·
2025-02-02 00:18
微服务
架构
微服务
云原生
如何使用
Spark
Streaming
一、什么叫
Spark
Streaming基于
Spark
Core,大规模、高吞吐量、容错的实时数据流的处理二、
Spark
Streaming依赖org.apache.
spark
spark
-streaming_
会探索的小学生
·
2025-02-02 00:46
spark
大数据
分布式
Spark
任务与
Spark
Streaming 任务的差异详解
Spark
任务与
Spark
Streaming任务的主要差异源自于两者的应用场景不同:
Spark
主要处理静态的大数据集,而
Spark
Streaming处理的是实时流数据。
goTsHgo
·
2025-02-02 00:14
spark-streaming
分布式
大数据
spark
streaming
大数据
分布式
4
Spark
Streaming
4
Spark
Streaming一级目录1.整体流程2.数据抽象3.DStream相关操作4.
Spark
Streaming完成实时需求1)WordCount2)updateStateByKey3)reduceByKeyAndWindow
TTXS123456789ABC
·
2025-02-01 23:43
#
Spark
spark
ajax
大数据
spark
和python的区别_
Spark
入门(Python)
Spark
是第一个脱胎于该转变的快速、通用分布式计算范式,并且很快流行起来。
weixin_39934257
·
2025-02-01 23:42
spark和python的区别
spark
python入门_python py
spark
入门篇
一.环境介绍:1.安装jdk7以上2.python2.7.113.IDEpycharm4.package:
spark
-1.6.0-bin-hadoop2.6.tar.gz二.Setup1.解压
spark
weixin_39686634
·
2025-02-01 23:12
spark
python入门
spark
streaming python_
Spark
入门:
Spark
Streaming简介(Python版)
Spark
Streaming是构建在
Spark
上的实时计算框架,它扩展了
Spark
处理大规模流式数据的能力。
weixin_39531582
·
2025-02-01 23:12
spark
streaming
python
Spark
学习-1 (python)
Spark
官方文档快速入门指南
Spark
架构-
Spark
教程1.基本概念RDD(resilientdistributeddataset)弹性分布式数据集,对分布式数据和计算的基本抽象。
一二三四0123
·
2025-02-01 23:40
spark
学习
python
Python大数据之Py
Spark
(三)使用Python语言开发
Spark
程序代码_windows
spark
python
算子:rdd的api的操作,就是算子,flatMap扁平化算子,map转换算子Transformation算子Action算子步骤:1-首先创建
Spark
Context上下文环境2-从外部文件数据源读取数据
2401_84181704
·
2025-02-01 23:09
程序员
大数据
python
spark
Spark
入门(Python)
目录一、安装
Spark
二、
Spark
基本操作一、安装
Spark
pip3installpy
spark
二、
Spark
基本操作#导入
spark
的
Spark
Context,
Spark
Conf模块frompy
spark
import
Spark
Context
nfenghklibra
·
2025-02-01 23:39
python
spark
集群部署时的分布式 session 如何实现?
面试官心理分析面试官问了你一堆dubbo是怎么玩儿的,你会玩儿dubbo就可以把单块系统弄成
分布式系统
,然后分布式之后接踵而来的就是一堆问题,最大的问题就是分布式事务、接口幂等性、分布式锁,还有最后一个就是分布式
打不死的喜羊羊
·
2025-02-01 20:20
JAVA
分布式会话
vdist-1.3.1:Python项目自动化构建与分发工具
它集成了
分布式系统
支持,如Zookeeper,以及云原生技术标准,确保了高效的软件生命周期管理。该工具具备依赖管理、自动化构建流程、环境隔离和多平台支持等功能,并提供了解压后目录结构的详细说明。
46497976464
·
2025-02-01 18:57
分布式服务接口的幂等性如何设计(比如不能重复扣款)?
一个
分布式系统
中的某个接口,该如何保证幂等性?这个事儿其实是你做
分布式系统
的时候必须要考虑的一个生产环境的技术问题。啥意思呢?
码农小旋风
·
2025-02-01 14:26
后端
Redisson详解
Redisson的设计目标是简化在
分布式系统
中使用Redis的复杂度,并为开发者提供更高层次的抽象,以便更容易
好运仔dzl
·
2025-02-01 11:32
Java笔记
redis
分布式
spring
boot
分布式系统
架构7:本地缓存
1.引入缓存的影响我们在开发时,用到缓存的情况,无非就是为了减少客户端对相同资源的重复请求,降低服务器的负载压力。引入缓存后,既有好处也有坏处引入缓存负面影响:开发角度,增加了系统复杂度,需考虑缓存失效、更新、一致性问题运维角度,缓存会掩盖一些缺陷问题安全角度,缓存可能泄密某些保密数据引入缓存的理由:为了缓解CPU压力,将实时计算运行结果存储起来,节省CPU压力为了缓解I/O压力,将原本对网络、磁
快乐非自愿
·
2025-02-01 08:35
架构
缓存
云原生:构建现代化应用的基石
云原生是一种构建和运行应用程序的方法,旨在充分利用云计算的
分布式系统
优势,例如弹性伸缩、微服务架构、容器化技术等。
moton2017
·
2025-02-01 05:42
后端
架构
云原生
微服务
容器
kubernetes
docker
hive表指定分区字段搜索_Hive学习-Hive基本操作(建库、建表、分区表、写数据)...
Hive是类SQL语法的数据查询、计算、分析工具,执行引擎默认的是MapReduce,可以设置为
Spark
、Tez。Hive分内部表和外部表,外部表在建表的同时指定一个
weixin_39710660
·
2025-02-01 04:00
hive表指定分区字段搜索
PyDeequ库在AWS EMR启动集群中数据质量检查功能的配置方法和实现代码
PyDeequ是一个基于Apache
Spark
的PythonAPI,专门用于定义和执行“数据单元测试”,从而在大规模数据集中测量数据质量。
weixin_30777913
·
2025-02-01 04:59
python
spark
大数据
云计算
aws
wifi模块 服务器通讯协议,模块之间通信协议
分布式系统
结构又进一步增加了实现确定性的难来自:博客网络编程一、网络编程基础python的网络编程模块主要支持两种Internet
高杉峻
·
2025-02-01 03:21
wifi模块
服务器通讯协议
快速学习安装使用etcd
etcd是一个分布式键值存储系统,主要用于
分布式系统
的配置管理和服务发现。
蓝胖子不是胖子
·
2025-02-01 00:04
学习
etcd
数据库
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他