E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark调优
Hadoop——分布式计算
分布式计算常见的2种工作模式分散->汇总(MapReduce就是这种模式)将数据分片,多台服务器各自负责一部分数据处理然后将各自的结果,进行汇总处理最终得到想要的计算结果中心调度->步骤执行(大数据体系的
Spark
weixin_50458070
·
2023-12-26 06:38
大数据
hadoop
大数据
分布式
大数据从业者必知必会的Hive SQL
调优
技巧 | 京东云技术团队
本文针对HiveSQL的性能优化进行深入研究,提出了一系列可行的
调优
方案,并给出了相应的优化案例和优化前后的SQL代码。通过合理的优化策略和技巧,能够显著提升HiveSQL的执行效率和响应速度。
京东云技术团队
·
2023-12-26 06:33
大数据
hive
sql
最新ChatGPT商业运营网站程序源码,支持Midjourney绘画,GPT语音对话+DALL-E3文生图+文档对话总结
一、前言
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-12-26 06:23
人工智能
AIGC
ChatGPT
人工智能
chatgpt
语音识别
midjourney
AI作画
08-JVM
调优
实战及常量池详解
文章目录阿里巴巴Arthas详解Arthas使用场景Arthas使用GC日志详解打印GC日志方法如何分析GC日志CMSG1JVM参数汇总查看命令Class常量池与运行时常量池字面量符号引用字符串常量池字符串常量池的设计思想三种字符串操作(Jdk1.7及以上版本)字符串常量池位置字符串常量池设计原理String常量池问题的几个例子示例1:示例2:示例3:示例4:示例5:示例6:关于String是不可
月球程序猿
·
2023-12-26 04:15
性能调优
JVM
jvm
Jenkins的特殊操作定时自动执行任务以及测试报告
调优
java-Dhudson.model.DirectoryBrowserSupport.CSP=-jarJenkins.war测试报告不美丽执行上面的代码重启jenkins就好了
MaoLingHao
·
2023-12-26 03:29
jenkins
运维
Pulsar 详解 - 索引目录
Pulsar详解3—工作原理&客户端API(示例:Go语言)Pulsar详解4—Pulsar的高级特性(示例:Go语言)Pulsar详解5—Pulsar的管理和监控Pulsar详解6—Pulsar的性能
调优
风不归Alkaid
·
2023-12-26 02:29
Pulsar
后端
golang
开发语言
jdk官网及说明
/8-MR3OracleJDK官方地址:https://www.oracle.com/technetwork/java/javase/downloads/index.htmlJVM-XXOptions
调优
参数
三侠剑
·
2023-12-26 00:33
JDK基础
Java 后端开发学习路线
图片版思维导图在底部编程基础Java语言语言基础基础语法面向对象接口容器异常泛型反射注解I/O图形化(如Swing)JVM类加载机制字节码执行机制JVM内存模型GC垃圾回收JVM性能监控与故障定位JVM
调优
并发
三尺青锋丶
·
2023-12-26 00:39
spark
运行时异常:org.apache.
spark
.
Spark
Exception: Could not find CoarseGrainedScheduler.
org.apache.
spark
.
Spark
Exception:CouldnotfindCoarseGrainedScheduler.atorg.apache.
spark
.rpc.netty.Dispatcher.postMessage
安安DE爸爸
·
2023-12-25 23:00
大数据
yarn
spark
spark
大数据
spark
启动程序命令
/
spark
-submit--master
spark
://hive01:7077--deploy-modeclient--classorg.apache.
spark
.examples.
Spark
Pi..
安安DE爸爸
·
2023-12-25 23:00
spark
hadoop
yarn
spark
yarn
client
cluster
黑猴子的家:
Spark
RDD 之 Hadoop 输入输出(数据读取与保存的主要方式之一)
1、hadoopRDD和newHadoopRDD
Spark
的整个生态系统与Hadoop是完全兼容的,所以对于Hadoop所支持的文件类型或者数据库类型,
Spark
也同样支持.另外,由于Hadoop的API
黑猴子的家
·
2023-12-25 23:05
Rocksdb参数
调优
指南
本指南的目的是提供你足够的信息用于根据自己的工作负载和系统配置
调优
RocksDB。RocksDB非常灵活,这有好也有坏。你可以真多很多工作场景和存储技术进行
调优
。
xiannvlei
·
2023-12-25 23:57
数据库
京东一面:20多种异步方式,你知道几个?含协程
圈内一大波顶级高手、架构师、发烧友已经实现技术自由;另外一大波卷王,正在狠狠卷,奔向技术自由29篇原创内容公众号异步,作为性能
调优
核心方式之一,经常被用于各种高并发场景。
竹林幽深
·
2023-12-25 22:28
java
面试
elasticsearch
计算机毕业设计之
Spark
+SpringBoot+Vue.js数字迎新系统小程序App 新生报到系统小程序App 新生缴费系统小程序App 大数据毕业设计
开发技术前端:vue.jsecharts后端:springboot+mybatis数据分析:
Spark
数据库:mysql配套资料配置教程、说明书、操作手册、源代码手册配套资料完整源码资料完整资料创新点Excel
计算机毕业设计大神
·
2023-12-25 21:35
Spark
数据倾斜解决方案四:使用随机Key进行双重聚合
在使用reduceByKey,groupByKey算子时,都是针对PairRDD进行操作,那么,我们就可以PairRDD的每个元素的Key加上一个随机数前缀,这样的话,之前存在的大量相同而导致数据倾斜问题的Key就会被重新打散,从而避免数据倾斜。在进行第一轮聚合之前,先把原先的Key加上一个随机数前缀(10以内的就可以),然后对随机的Key进行聚合操作,这是可以看到,之前相同的Key都会被分到一个
hipeer
·
2023-12-25 20:55
Java性能
调优
一个用Java写的GUI程序,作用是分析日志,它会将一定数量的格式相同的文本日志文件读入内存分析处理,然后将结果合并输出。文件数量几十个,文件大小几KB,日志记录几千条左右,此工具可以流畅处理,轻松满足需求。然而,因为记录日志的方案调整,记录日志类型范围从warn、error级别扩大到了连info、debug级别的日志也要记录,从而导致了日志量激增,固定时间范围内产生的日志文件增加到了几百个,单个
Java高级架构狮
·
2023-12-25 20:25
【早安心语】
【2021-4-6】早安春夏秋冬Everyonehastimeswhentheyfeelthattheyarenotgoodenoughandwhentheyadmirethe
spark
lesofothers
壹典心理咨询
·
2023-12-25 19:26
2023年12月份openGauss训练营培训课程课件
与其他开源数据库相比,openGauss具有以下特点:高性能——两路鲲鹏性能150万tpmC高可靠——故障切换时间RTO<10s高安全——端到端全方位安全防护易运维——基于AI的智能参数
调优
课时1:openGauss
福娃筱欢
·
2023-12-25 17:49
opengauss
Spark
- 动态注册UDF
昨天有位大哥问小弟一个
Spark
问题,他们想在不停
Spark
程序的情况下动态更新UDF的逻辑,他一问我这个问题的时候,本猪心里一惊,
Spark
**还能这么玩?
kikiki2
·
2023-12-25 16:04
2023_
Spark
_实验三十三:配置Standalone模式
Spark
3.4.2集群
实验目的:掌握
Spark
Standalone部署模式实验方法:基于centos7部署
Spark
standalone模式集群实验步骤:一、下载
spark
软件下载的时候下载与自己idea里对应版本的
spark
News
pblh123
·
2023-12-25 15:42
Spark实验
Linux
Spark
spark
大数据
分布式
云计算与大数据之间的羁绊(期末不挂科版):云计算 | 大数据 | Hadoop | HDFS | MapReduce | Hive |
Spark
文章目录前言:一、云计算1.1云计算的基本思想1.2云计算概述——什么是云计算?1.3云计算的基本特征1.4云计算的部署模式1.5云服务1.6云计算的关键技术——虚拟化技术1.6.1虚拟化的好处1.6.2虚拟化技术的应用——12306使用阿里云避免了高峰期的崩溃1.6.3虚拟化的关键特征1.6.4虚拟化的HA指的是什么?1.6.5服务器虚拟化1.6.6虚拟机迁移1.6.6.1虚拟机实时迁移对云计算
春人.
·
2023-12-25 14:59
春人闲谈
大数据
hadoop
云计算
HDFS
MapReduce
Nive
Hive
spark
连接 hive 报错 Identifier principalName is unresolved (not a static field)
spark
连接hive的mysql元数据库metastore,不能直接访问,需要通过metastoreserver间接访问因此需要开启元数据服务修改hive-site.xml配置 hive.metastore.uris
赤土 炙焱
·
2023-12-25 12:20
spark
hive
[AIGC] Apache
Spark
简介
Apache
Spark
是一个开源的大数据处理框架,它提供了高效的分布式数据处理和分析能力。
Spark
通过将数据加载到内存中进行计算,可以大幅提高数据处理速度。
程序员三木
·
2023-12-25 12:36
AI
AIGC
spark
大数据
spark
log4j日志配置
1.
spark
启动参数先把log4j配置文件放到hdfs:hdfs://R2/projects/log4j-debug.properties--conf
spark
.yarn.dist.files=hdfs
Mint6
·
2023-12-25 12:33
spark
spark
log4j
大数据
日志
debug
【美团大数据面试】大数据面试题附答案
目录1.hdfs读写流程解析2.hdfs副本机制,三副本原因,副本存放策略3.hdfs容错机制原理4.MapReduce执行流程详解5.
spark
和mr的区别6.TopN求法,大数据量无法完全写入内存解决方案
话数Science
·
2023-12-25 11:19
大数据
面试
大数据
面试
Spark
学习笔记——001【
spark
-mysql+
spark
-hive】
在本地提交
spark
-submit
spark
-sql窗口的进入.
冰冷热带鱼
·
2023-12-25 11:01
spark
spark
hive
mysql
JBoss安装并部署war包
一、简介JBOSS是一个免费的开放源代码的Web应用服务器,技术先进、性能稳定,而且免费,将Tomcat内核作为其Servlet容器引擎,并加以审核和
调优
。
飞奔的屎壳郎
·
2023-12-25 11:47
达梦数据库
服务器
tomcat
java
Jboss
DM8
Spark
编程语言选择:Scala、Java和Python
在大数据处理和分析领域,Apache
Spark
已经成为一种非常流行的工具。它提供了丰富的API和强大的性能,同时支持多种编程语言,包括Scala、Java和Python。
晓之以理的喵~~
·
2023-12-25 08:18
Spark
spark
scala
java
Spark
集群部署与架构
Apache
Spark
作为一种强大的大数据处理工具,可以在集群中高效运行,处理数十TB甚至PB级别的数据。本文将介绍如何构建和管理
Spark
集群,以满足大规模数据处理的需求。
晓之以理的喵~~
·
2023-12-25 08:36
Spark
spark
架构
大数据
安装Hadoop 3.3.5
常识科普:Kafka的存储与安装不依赖于hdfs/
spark
,从下边安装过程你可以得知这个信息。备注:
IT WorryFree
·
2023-12-25 06:03
hadoop
大数据
分布式
了解
spark
计算模型
Spark
提供了“partitionBy”运算符,能够通过集群中多台机器之间对原始RDD进行数据再分配来创建一个
necessary653
·
2023-12-25 06:59
spark
大数据
分布式
Flink1.17实战教程(第一篇:概念、部署、架构)
系列文章目录Flink1.17实战教程(第一篇:概念、部署、架构)文章目录系列文章目录1.Flink概述1.1Flink是什么1.2Flink特点1.3Flinkvs
Spark
Streaming1.4Flink
阿moments
·
2023-12-25 04:02
Flink
flink
java
大数据
阻断血缘关系以及checkpoint文件清理
spark
-sql读写同一张表,报错Cannotoverwriteapaththatisalsobeingreadfrom1.增加checkpoint,设置检查点阻断血缘关系
spark
Session.
spark
Context.setCheckpointDir
Keep hunger
·
2023-12-25 04:21
Spark
spark
Java实现异步的原因、场景、实现异步的方式
文章目录实现异步的原因:异步和同步的区别异步使用的场景实现异步的方式:实现异步的20种实现方式异步,作为性能
调优
核心方式之一,经常被用于各种高并发场景。
思静语
·
2023-12-25 02:13
Java性能优化
并发
java
Broadcast Variable
Spark
提供的BroadcastVariable,是只读的。并且在每个节点上只会有一份副本,而不会为每个task都拷贝一份副本。
一个人一匹马
·
2023-12-25 02:04
spark
-submit的执行原理
CreatedbyWang,JerryonAug08,20150和PWD%/*shell变量的一些特殊用法在命令行状态下单纯执行$cddirname0echopwd然后返回到/home/admin/执行shtest/test.sh运行结果:/home/admin/test这样就可以知道一些和脚本一起部署的文件的位置了,只要知道相对位置就可以根据这个目录来定位,而可以不用关心绝对位置。这样脚本的可移
JerryWang_汪子熙
·
2023-12-25 02:44
mysql的性能
调优
,explain的用法,explain各字段的解释
EXPLAIN一条语句的各字段解析如下id首先我们要知道explain的每一条记录都对应着访问单表的方式,即使说一条查询语句可能用了两个表,那也要拆成两条记录,只不过二者id相同,因为一个SELECT对应一个id。并且出现在前面的s1代表mysql选择它作为驱动表,而后面的s2代表mysql选择其作为被驱动表:假设是一个SELECT的查询结果作为临时表给另一个SELECT,那就是两个id了:但我们
結城
·
2023-12-25 00:33
mysql
mysql
数据库
YARN Hadoop2.0 区别
Hadoop1.0更多是在于离线的数据处理,Hadoop2.0可以支持MapReduce计算框架之外,可以支持
Spark
、Strom等的实时数据处理框架。在h
omygodvv
·
2023-12-24 23:01
java
Java技术专题-Lombok插件开发实践必知必会操作!
前言在目前众多编程语言中,Java语言的表现还是抢眼,不论是企业级服务端开发,还是Andorid客户端开发,都是作为开发语言的首选,甚至在大数据开发领域,Java语言也能占有一席之地,如Hadoop,
Spark
洛神灬殇
·
2023-12-24 23:17
系统故障诊断
在极客时间上,学习过《linux性能
调优
》算是对Linux下的系统诊断,做了一个全面的描述,可是
明翼
·
2023-12-24 22:39
Flink知识点
Flink1.简单介绍一下Flink2.Flink的运行必须依赖Hadoop组件吗3.Flink集群运行时角色4.Flink相比
Spark
Streaming的区别4.1、什么是两阶段提交协议?
芝麻仗剑走天涯
·
2023-12-24 22:26
大数据
flink
Spark
的核心概念:RDD、DataFrame和Dataset
Apache
Spark
,其核心概念包括RDD(ResilientDistributedDataset)、DataFrame和Dataset。
晓之以理的喵~~
·
2023-12-24 22:25
Spark
spark
大数据
分布式
Apache
Spark
简介与历史发展
Apache
Spark
作为一个开源的大数据处理框架,已经在大数据领域占据了重要地位。Apache
Spark
简介Apache
Spark
是一个用于大规模数据处理的快速、通用的计算引擎。
晓之以理的喵~~
·
2023-12-24 22:55
Spark
apache
spark
大数据
Flink优化——资源优化(一)
)并行度设置最优并行度计算Source端并行度的配置Transform端并行度的配置Keyby之前的算子Keyby之后的算子(KeyGroup最小值为128)Sink端并行度的配置RocksDB大状态
调优
设置本地
Stray_Lambs
·
2023-12-24 22:54
Flink
flink
大数据
阿里巴巴内部:全技术栈PPT分享(架构篇+算法篇+大数据)
大数据:
Spark
、Hadoop添加图片注释,不
写代码的珏秒秒
·
2023-12-24 22:48
架构
大数据
【性能优化】MySql数据库查询优化方案
阅读本文你的收获了解系统运行效率提升的整体解决思路和方向学会MySQl中进行数据库查询优化的步骤学会看慢查询、执行计划、进行性能分析、
调优
一、问题:如果你的系统运行很慢,你有什么解决方案?
采石之人
·
2023-12-24 21:22
.NET后端
mysql
后端
性能优化
Android App选择最优的服务器地址
简介对于很多app来说,如果有文件上传、多媒体播放之类的功能,性能
调优
的重点之一一定是上传或者播放的速度。其中,可以尝试的一个做法是Server端分布式部署,在app启动时选择当前最为合适的服务器。
zyguo
·
2023-12-24 19:30
Spark
- 直接操作数据源 MySQL
答案就是使用
spark
的计算能力的,我们可以将mysql数据源接入到
spark
中。
大猪大猪
·
2023-12-24 18:56
Java项目开发:基于
spark
的新闻推荐系统的设计与实现
欢迎大家点赞、收藏、关注、评论啦,由于篇幅有限,只展示了部分核心代码。文章目录前言一、项目介绍二、开发环境三、功能介绍数据库设计概述数据库表的设计四、核心代码五、效果图六、文章目录前言 随着我国媒体和网络技术的快速发展,新闻发布也不断优化我国媒体界,随着个外交商务所占比重越来越大,有助于我国社会经济的可持续性发展,文章主要讲述了新闻行业的发展分析,因为媒体的宣传能够带给我们重要的信息资源,新闻发
QQ1694456187
·
2023-12-24 17:21
java
计算机毕业设计
java
spark
开发语言
hive tez出现java堆内存溢出进行
调优
运行hive任务的时候出现了错误,日志如下:ERROR:FAILED:ExecutionError,returncode2fromorg.apache.hadoop.hive.ql.exec.tez.TezTask.Vertexfailed,vertexName=Map1,vertexId=vertex_1608805116045_1296_1_04,diagnostics=[Taskfailed
旺旺_865f
·
2023-12-24 17:36
上一页
42
43
44
45
46
47
48
49
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他