E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark调优
大数据学习之 Flink
目录一:简介二:为什么选择Flink三:哪些行业需要四:Flink的特点五:与
spark
Streaming的区别六:初步开发七:Flink配置说明八:环境九:运行组件一:简介Flink是一个框架和分布式得计算引擎
会编程的海贼王
·
2024-01-22 19:58
Flink
大数据
Flink
大数据之Flink的看了就可入门
2Flink对比
Spark
Spark
是一种基于内存的
大数据的江湖
·
2024-01-22 19:56
大数据
#
Flink
flink
大数据学习之Flink,10分钟带你初步了解Flink
流式数据处理的发展和演变1.流处理和批处理2.传统事务处理2.1传统事务处理架构编辑3.有状态的流处理4.Lambda架构5.新一代流处理器七、Flink的特性总结1.Flink的核心特性2.分层API八、FlinkVS
Spark
1
十二点的泡面
·
2024-01-22 19:23
大数据
Flink
大数据
学习
flink
Spark
消费Kafka的两种方式
原理如何保证数据不丢失但是会导致数据重复问题优点缺点Direct(NoReceiver)方式code特点优点缺点介绍kafka版本,kafka0.8支持Receiver和DirectKafka版本大于等于0.10.0,且
Spark
这个程序猿可太秀了
·
2024-01-22 17:57
#
spark
#
kafka
spark内核
kafka
spark
AQE优化和源码
介绍AQE全称是AdaptiveQueryExecution,官网介绍如下PerformanceTuning-
Spark
3.5.0DocumentationAQE做了什么AQE是
Spark
SQL的一种动态优化机制
这个程序猿可太秀了
·
2024-01-22 17:56
spark内核
spark
AQE
Spark源码
Spark优化
大数据平台的硬件规划、网络
调优
、架构设计、节点规划
1.大数据平台硬件选型要对Hadoop大数据平台进行硬件选型,首先需要了解Hadoop的运行架构以及每个角色的功能。在一个典型的Hadoop架构中,通常有5个角色,分别是NameNode、StandbyNameNode、ResourceManager、NodeManager、DataNode以及外围机。其中NameNode负责协调集群上的数据存储,StandbyNameNode属于NameNode
小枫@码
·
2024-01-22 17:18
大数据架构师
大数据
Spark
简介
1、什么是
Spark
Spark
是大数据的调度,监控和分配引擎。
shinelord明
·
2024-01-22 17:17
大数据
引擎
spark
大数据
hadoop
Nginx 实战指南
本实战指南将带你深入了解Nginx的安装、基础配置、高级配置、最佳实践以及性能
调优
。
ivwdcwso
·
2024-01-22 15:04
nginx
spark
web框架--play framework 安装与运行
目前网上关于playframework框架的安装配置都是低版本的,现就高版本问题进行编写:1、下载https://www.playframework.com/(1)play2.3之前的版本都是压缩包zip,解压后,命令行运行play旧版本,即早于2.2的Play版本打包在zip文件中。提供了play创建新应用程序、运行测试和运行应用程序的命令。(2)playframework高版本配置高版本的Pl
huazi99
·
2024-01-22 13:37
大数据
java
spark
scala
30、
Spark
内核源码深度剖析之
Spark
内核架构深度剖析
Spark
内核架构深度剖析.png就上面这幅图,详细解释一下自己编写的Application,就是我们自己写的程序,拷贝到用来提交
spark
应用的机器,使用
spark
-submit提交这个Application
ZFH__ZJ
·
2024-01-22 12:43
48、
Spark
性能优化之性能优化概览
Spark
性能优化概览由于
Spark
的计算本质是基于内存的,所以
Spark
性能程序的性能可能因为集群中的任何因素出现瓶颈:CPU、网络带宽、或者是内存。
ZFH__ZJ
·
2024-01-22 11:31
Spark
- 升级版数据源JDBC2
>在
spark
的数据源中,只支持Append,Overwrite,ErrorIfExists,Ignore,这几种模式,但是我们在线上的业务几乎全是需要upsert功能的,就是已存在的数据肯定不能覆盖,
kikiki5
·
2024-01-22 10:41
再见23你好24
2.今年把GDB和火焰图的东西写了博客,对
调优
调试有一点理解。3.汇编级
调优
没有什么实质上进展,。4.PMP证书考下了。2、期望的事情有的做了一些,但是还不到位。今年知道做什么,就是没有动力。
csdn_dyq111
·
2024-01-22 10:06
年度总结
其他
Spark
groupByKey和reduceByKey
我们通过简单的WC看看两者的区别groupByKey实现WCscala>valrdd=sc.parallelize(List(1,1,2,2,3,3)).map((_,1))rdd:org.apache.
spark
.rdd.RDD
喵星人ZC
·
2024-01-22 09:23
《机器学习》客户流失判断-python实现
实现读取数据并初步了解导入宏包读取数据查看数据类型检查缺失值描述性统计分析可视化分析用户流失分析特征分析任期年数与客户流失的关系:服务类属性分析特征相关性分析数据预处理类别编码转换划分训练数据与测试数据归一化处理模型建立逻辑回归支持向量机(SVM)K近邻(KNN)XGBoost-贝叶斯搜索超参数
调优
随机森林
汐ya~
·
2024-01-22 09:44
机器学习
python
人工智能
分类
从严治党,真抓实干,夯实细节,着眼长效
一是立足区位优势、坚持问题导向、创新工作方式、凝聚内生动力,
调优
产业结构,培育富民产业,坚持把多样化种植产业作为产业结构调整的主攻方向,以专业合作社为龙头,种植马铃薯6.9万亩,种植玉米3900亩,西红柿
Cooo1
·
2024-01-22 08:42
架构师才需要知道的知识:如何做容量预估和
调优
为了构建高并发、高可用的系统架构,压测、容量预估必不可少,在发现系统瓶颈后,需要有针对性地扩容、优化。结合楼主的经验和知识,本文做一个简单的总结,欢迎探讨。1、QPS保障目标一开始就要明确定义QPS保障目标,以此来推算所需的服务、存储资源。可根据历史同期QPS,或者平时峰值的2到3倍估算。压测目标示例:qps达到多少时,服务的负载正常,如平均响应时间、95分位响应时间、cpu使用率、内存使用率、消
Java爱好者
·
2024-01-22 08:09
【SpringBoot技术专题】「开发实战系列」Undertow web容器的入门实战及
调优
方案精讲
Undertowweb容器的入门实战及
调优
方案精讲Undertowweb容器Undertow介绍官网API给出一句话概述Undertow:官网API总结特点:Lightweight(轻量级)HTTPUpgradeSupport
洛神灬殇
·
2024-01-22 08:50
#
#
spring
boot
前端
后端
史上最全深度解析Flink内存管理--大数据技术
目前,大数据计算引擎主要使用Java或基于JVM的编程语言实现的,例如ApacheHadoop,Apache
Spark
,ApacheDrill,ApacheFlink等。
大数据学习僧
·
2024-01-22 08:50
Flink
大数据
flink
03-Flink内存模型
.1.1JVM内存管理的不足1.1.1有效数据密度低存储:对象头、实例数据、对齐填充部分导致JVM中有效信息的存储密度很低1.1.2垃圾回收FullGC会严重影响性能以及和集群中的心跳信息超时,使得无法进行
调优
情深@骚明
·
2024-01-22 08:48
流式计算
flink
Flink是如何管理内存的
在讲Flink管理内存之前要了解下Flink为什么要自己实现内存管理一、Flink为什么要自己实现内存管理在大数据领域,大多数数据相关的开源框架(Hadoop、
Spark
、Storm)都是基于JVM运行的
Relian哈哈
·
2024-01-22 08:13
Flink
Flink TaskManager 内存管理机制介绍与
调优
总结
作者:董伟柯,腾讯CSIG高级工程师概要Flink的新版内存管理机制,要追溯到2020年初发布的Flink1.10版本。当时Flink社区为了实现三大目标:流和批模式下内存管理的统一,即同一套内存配置既可用于流作业也可用于批作业管控好RocksDB等外部组件的内存,避免在容器环境下用量不受控导致被KILL消除不同部署模式下配置参数的歧义,消除cut-off等参数语义模糊的问题提出了两个设计提案FL
腾讯云大数据
·
2024-01-22 08:09
flink
jvm
java
Spark
写入kafka(批数据和流式)
Spark
写入(批数据和流式处理)
Spark
写入kafka批处理写入kafka基础#
spark
写入数据到kafkafrompy
spark
.sqlimport
Spark
Session,functionsasFss
中长跑路上crush
·
2024-01-22 07:02
Spark阶段
spark
kafka
linq
spark
入门教程
一、安装scala环境官网下载地址Download|TheScalaProgrammingLanguage,本次使用版本为sacla2.11.12,将压缩包解压至指定目录,配置好环境变量,控制台验证是否安环境是否可用:二、添加pom依赖创建一个maven项目1、添加scala的sdk依赖2.11.12org.scala-langscala-library${scala.version}org.sc
fengchengwu2012
·
2024-01-22 07:02
BigData
spark
大数据
分布式
innodb status解读
showengineinnodbstatus输出中,显示除了大量的内部信息,它输出就是一个单独的字符串,没有行和列,内容分为很多小段,每一段对应innodb存储引擎不同部分的信息,其中有一些信息对于innodb
调优
的时候
mysia
·
2024-01-22 03:47
mysql
调优
show profile工具
1.showProfile是什么showProfile:是mysql提供用来分析当前回话中语句执行消耗资源的情况,可以用来SQL
调优
。
喜羊羊love红太狼
·
2024-01-22 01:06
mysql
django基于
spark
的电影推荐系统(程序+开题)
因此,基于
Spark
的电影推荐系统的研究具有重
liu10665
·
2024-01-21 21:35
django
python
后端
Spark
读取Hbase内容
不啰嗦直接看代码//初始化Hbase的基本配置valhbaseConf=HBaseConfiguration.create()hbaseConf.set("hbase.zookeeper.quorum","地址")valscan=newScan();scan.addFamily(Bytes.toBytes("c"))//要读取的列簇scan.setTimeStamp(timeStamp)//指定一
小湘西
·
2024-01-21 20:11
Spark
Hbase
spark
hbase
大数据
Spark
读取ElasticSearch
不啰嗦先上代码/***初始化
spark
*/val
spark
Name="Read_ES"val
spark
Conf=new
Spark
Conf().setAppName(
spark
Name).set("
spark
.serializer
小湘西
·
2024-01-21 20:11
Spark
Elasticsearch
spark
elasticsearch
大数据
个性化风控!消费贷客群分群模型应用实践
这三个方面在任何场景的模型中都是至关重要的,无论是针对ABC卡、策略
调优
、拒绝回捞、动支模型、营销响应模型还是流失模型等等,只要涉及到建模,都需要依赖于这三个模块。
风控小兵突击
·
2024-01-21 18:02
智能风控
大数据
人工智能
金融
自动化
机器学习
python
spark
on yarn安装部署
spark
onyarn安装部署使用的三台主机名称分别为bigdata1,bigdata2,bigdata3。
佛系爱学习
·
2024-01-21 17:11
spark
大数据
分布式
玩转Mysql 八 (MySQ优化入门篇)
前言:一个高性能,稳定的数据库集群并不是指的某一特性优化,就能保证系统的的稳定,需要从网络、硬件资源、操作系统、操作系统参数设置、数据库选型,执行SQL效率几个方面进行整体
调优
。
董乐,快乐的乐!
·
2024-01-21 16:49
mysql
数据库
H2O
Spark
ling Water
什么是H2O
Spark
lingWater
Spark
lingWater允许用户将快速,可扩展的H2O机器学习算法与
Spark
的功能相结合。
Liam_ml
·
2024-01-21 16:03
XGBoost在时间序列分析中的高级应用
在时间序列问题中的应用场景2.1金融数据预测2.2销售预测2.3能源消耗预测2.4网络流量分析2.5医疗时间序列分析3.实际应用场景3.1一个简单的例子3.2广告领域的demo4.时间序列预测中的XGBoost参数
调优
theskylife
·
2024-01-21 15:51
数据分析
数据挖掘
人工智能
机器学习
数据挖掘
python
回归
XGBoost系列3——XGBoost在多分类问题中的应用
1.4多分类问题的应用场景2.XGBoost中的多分类支持2.1分类原理2.2Softmax损失函数2.3One-vs-All与One-vs-One2.4多分类性能优势2.5超参数
调优
2.6特征重要性分析
theskylife
·
2024-01-21 15:50
数据分析
数据挖掘
分类
数据挖掘
人工智能
python
机器学习
常用监控指标及
调优
步骤
诊断性能问题,需要清楚监控的关键指标,以此辅助试验诊断,最后验证推测。常用监控的关键指标通常情况下,性能测试监控指标主要分为:资源指标和系统指标。资源指标:CPU使用率:指单位时间内进程使用cpu时间的百分比,这是对一个时间段内CPU使用状况的统计,通过这个指标可以看出在某一个时间段内CPU被占用的情况,如果被占用时间很高,那么就需要考虑CPU是否已经处于超负荷运作,长期超负荷运作对于机器本身来说
HuiTest
·
2024-01-21 14:30
性能
性能
测试
指标
调优
【
Spark
】
Spark
运行架构--YARN-Cluster
YARN-Cluster模式启动类图YARN-Cluster实现原理YARN-Cluster作业运行调用图一、YARN-Cluster工作流程图image二、YARN-Cluster工作流程客户端通过
spark
-submit
w1992wishes
·
2024-01-21 14:34
java进阶-jvm精讲及实战
深入了解jvm及实战1.引言2.jvm概念理解1.引言jvm是深入了解java底层逻辑的必备知识储备,在中大型开发团队里,中高级工程师必须要了解和掌握,也是中高级工程师面试必考题,在实战中用于程序性能
调优
蒋增奎
·
2024-01-21 12:16
j2se高级特性
java
jvm
开发语言
100 springboot项目优化和jvm
调优
https://blog.csdn.net/huangjinjin520/article/details/103231775项目
调优
作为一名工程师,项目
调优
这事,是必须得熟练掌握的事情。
滔滔逐浪
·
2024-01-21 12:54
py
spark
中实现scala的contains函数
scala:lines.filter(line=>line.contains("Python"))py
spark
:lines.filter(lambdax:x.find("Python")!
tianchen627
·
2024-01-21 12:25
94.144.145 二叉树的前序遍历、中序遍历、后序遍历
spark
打酱油输入:root=[1,null,2,3]输出:[1,2,3]示例2:输入:root=[]输出:[]示例3:输入:root=[1]输出:[1]提示:树中节点数目在范围[0,100]内-100
spark打酱油
·
2024-01-21 11:58
【转载】《软件性能测试、分析与
调优
实践之路》学习
这是一本理论和实践相结合的同时面向研发和测试岗的关于性能分析诊断
调优
实践的图书,比起其他的很多性能测试的图书,本书中内容更侧重于介绍如何去发现性能问题、分析诊断性能问题以及对发现的性能问题进行
调优
。
来自火星的我哈哈
·
2024-01-21 09:51
02-黑马程序员大数据开发:分布式计算和分布式资源调度
分布式计算模式:分散->汇总模式(MapReduce)和中心调度->步骤执行模式(Apache
Spark
,Flink;比较复杂,中间会有数据交换的过程);2.MapReduce概述MapReduce是Hadoop
S1406793
·
2024-01-21 08:52
大数据开发
大数据
分布式
Clickhouse VS Doris 导入-并发-查询对比
clickhouse导入数据直接导入的是本地磁盘,对于分布式表,clickhouse和doris相比,clickhouse就没有本地表导入的优势,借助clickhouse进行数据排序,而doris中有
spark
Load
IT贫道
·
2024-01-21 08:21
随笔
clickhouse
doris
大数据之
spark
运行模式
Apache
Spark
提供了多种运行模式,主要包括以下几种:本地模式(Local):
Spark
在本地单机上运行,主要用于开发测试阶段。
转身成为了码农
·
2024-01-21 07:11
大数据
spark
分布式
大数据之
Spark
常用的端口号
Spark
常用的端口号包括:DriverWebUI端口:4040,这是
Spark
应用程序(Driver)运行时绑定的端口,用于展示任务运行状态、执行进度、任务细节等监控信息。
转身成为了码农
·
2024-01-21 07:11
大数据
spark
分布式
大数据之
Spark
架构设计与工作流程
Apache
Spark
架构设计是其高效、分布式处理能力的基础。
转身成为了码农
·
2024-01-21 07:41
大数据
spark
分布式
Spark
学习(8)-
Spark
SQL的运行流程,
Spark
On Hive
1.
Spark
SQL的运行流程1.1
Spark
RDD的执行流程回顾1.2
Spark
SQL的自动优化RDD的运行会完全按照开发者的代码执行,如果开发者水平有限,RDD的执行效率也会受到影响。
技术闲聊DD
·
2024-01-21 06:50
大数据
hive
spark
学习
Hive on
Spark
和
Spark
sql on Hive,你能分的清楚么
Hiveon
Spark
和
Spark
sqlonHive,你能分的清楚么结构上HiveOn
Spark
和
Spark
SQL都是一个翻译层,把一个SQL翻译成分布式可执行的
Spark
程序。
捞起月亮的渔民丁
·
2024-01-21 06:18
hive
spark
大数据
Spark
:
Spark
SQL与Hive on
Spark
(Shark)的比较
简要介绍了
Spark
SQL与Hiveon
Spark
的区别与联系一、关于
Spark
简介在Hadoop的整个生态系统中,
Spark
和MapReduce在同一个层级,即主要解决分布式计算框架的问题。
花和尚也有春天
·
2024-01-21 06:17
sparkSQL
SparkSQL
Hive
on
Spark
上一页
21
22
23
24
25
26
27
28
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他