E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark性能优化
Mysql-
性能优化
-常见优化手段
索引优化表记录很少不需创建索引:索引是要有存储的开销一个表的索引个数不能过多:(1)空间:浪费空间。每个索引都是一个索引树,占据大量的磁盘空间。(2)时间:更新(插入/Delete/Update)变慢。需要更新所有的索引树。太多的索引也会增加优化器的选择时间。所以索引虽然能够提高查询效率,索引并不是越多越好,应该只为需要的列创建索引。频繁更新的字段不建议作为索引:频繁更新的字段引发频繁的页分裂和页
njnu@liyong
·
2024-02-08 22:39
数据库
mysql
性能优化
数据库
Flink状态编程
Spark
Streaming在状态管理这块做的不好,很多时候需要借助于外部存储(例如Redis)来手动管理状态,增加了编程的难度.访问redis需要通过网络访问,增大处理时间状态一致性问题,可能会造成数据的不一致
万事万物
·
2024-02-08 22:41
7.0 MapReduce编程实例教程
MapReduce主要是依靠开发者通过
Spark
来实现功能的,开发者可以通过实现Map和Reduce相关的方法来进行数据处理。为了简单的展示这个过程,我们将手工编写一个字数统计程序。
二当家的素材网
·
2024-02-08 18:11
Hadoop
教程
mapreduce
eclipse
大数据
手机的发展史
这是比较普通的智能手机1973年4月3日马丁•库帕老先生发明了第一台手机而他就长这个样子这个老头就是手机之父啦手机的发展是以G来衡量的,现实只可以通话的一G,在是
性能优化
的2G再然后就是我们熟悉的流量了鸭
小丸子是香吹
·
2024-02-08 17:22
《Git 简易速速上手小册》第7章:处理大型项目(2024 最新版)
LFS)7.1.1基础知识讲解7.1.2重点案例:在Python项目中使用GitLFS管理数据集7.1.3拓展案例1:使用GitLFS管理大型静态资源7.1.4拓展案例2:优化现有项目中的大文件管理7.2
性能优化
技巧
江帅帅
·
2024-02-08 16:53
《Git
简易速速上手小册》
git
数据分析
python
数据挖掘
人工智能
github
gitlab
Spark
经典案例之非结构数据处理
需求:根据tomcat日志计算url访问了情况,具体的url如下,要求:区别统计GET和POSTURL访问量结果为:访问方式、URL、访问量测试数据集:在CODE上查看代码片派生到我的代码片196.168.2.1--[03/Jul/2014:23:36:38+0800]“GET/course/detail/3.htmHTTP/1.0”200384350.038182.131.89.195--[03
张明洋_4b13
·
2024-02-08 15:57
深入理解
Spark
的前世今生
文章来源:https://blog.csdn.net/qq_42107047/article/details/80239094感谢大神分享~~~~~一:大数据的概述1.1
Spark
是什么?
闲云野鹤~~~
·
2024-02-08 14:01
Spark
【
Spark
重点难点】你以为的Shuffle和真正的Shuffle
我们的【
Spark
重点难点】系列继续更新。以往的系列:我们在学习
Spark
的时候,到底在学习什么?
王知无(import_bigdata)
·
2024-02-08 14:00
大数据
spark
java
python
数据库
深入理解
Spark
BlockManager:定义、原理与实践
深入理解
Spark
BlockManager:定义、原理与实践1.定义
Spark
是一个开源的大数据处理框架,其主要特点是高性能、易用性以及可扩展性。
涤生大数据
·
2024-02-08 14:57
spark
大数据
分布式
海量数据展示(二)-
性能优化
背景 之前做的海量数据数据展示,在预处理速度和在线渲染上还有有所欠缺,本文中进行一些优化工作,使得九分钟处理完一千多万面数据的3-12级矢量切片,在线浏览数据请求时间控制在10s左右。准备 软件环境:PostGIS(3.0.0rc2r17909)和PostgreSQL(12.0,compiledbyVisualC++build1914,64-bit),数据是微软开源的部分房屋数据pub
polong
·
2024-02-08 14:44
看完这篇文章,Nginx 拿下!
0什么是NginxNginx(“enginex”)是一个高性能的HTTP和反向代理服务器,特点是占有内存少,并发能力强,在同类型的网页服务器中表现较好,Nginx专为
性能优化
而开发,性能是其最重要的考量
JavaJasper
·
2024-02-08 14:42
nginx
github
运维
java
后端
spark
spark
.shuffle.service.enabled
操作场景
Spark
系统在运行含shuffle过程的应用时,Executor进程除了运行task,还要负责写shuffle数据,给其他Executor提供shuffle数据。
不搬砖的程序员不是好程序员
·
2024-02-08 13:59
spark
spark
spark
好的文章链接
https://blog.51cto.com/u_16099325/6763760`java
spark
官方文档
spark
javaapi手册http://www.17bigdata.com/book/
spark
Trank-Lw
·
2024-02-08 13:18
spark
大数据
分布式
史上最全OLAP对比
目录1.什么是OLAP2.OLAP引擎的常见操作3.OLAP分类MOLAP的优点和缺点ROLAP的优点和缺点4.并发能力与查询延迟对比5.执行模型对比5.OLAP引擎的主要特点5.2
Spark
SQL、FlinkSQL5.3Clickhouse5.4Elasticsearch5.5Presto5.6Impala5.7Doris5.8Druid5.9Kylin
只会写demo的程序猿
·
2024-02-08 11:04
数仓
spark
hadoop
数据仓库
Spark
:基于莱文斯坦(Levenshtein)距离计算字符串相似度
以下程序代码基于
spark
,使用scala语言,测试时间:2018-08-03str1和str2相似度=1-Levenshtein距离/max(length(str1),length(str2))valdf
xuejianbest
·
2024-02-08 11:25
大数据
算法
编程语言/Scala
大数据/spark
Levenshtein
字符串相似
莱文斯坦距离
spark
scala
性能优化
技巧:外键序号化
一、问题背景与适用场景在《
性能优化
技巧:部分预关联》一文中,我们介绍了将维表内存化并预关联的技术,但事实表与维表关联时,仍需进行hash计算和比对,怎么提高这一步的性能呢?
小黄鸭呀
·
2024-02-08 11:17
MML
Spark
+
Spark
:py
spark
+lightGBM应用实践
MML
Spark
,即MicrosoftMachineLearningforApache
Spark
,是微软开源的一个针对Apache
Spark
的深度学习和数据可视化的库。
bensonrachel
·
2024-02-08 10:38
spark
sql 数据类型转换_
spark
sql时间类型转换以及其他
1.
spark
sql的日期转换一般使用两种形式第一种使用to_timestamp(REACHTIME1,"yyyy-MM-ddHH24:mi:ss")//它将字符串时间转换为日期类型例如2018-10-
weixin_39535527
·
2024-02-08 10:02
spark
sql
数据类型转换
Spark
streaming写入delta数据湖问题
但项目上线到生产环境,检查
spark
streaming的job,发现数据在merge写入到数据湖时,往往超过1小时。
kk_io
·
2024-02-08 10:01
疑难杂症
spark
大数据
分布式
Spark
streaming batch运行时间过长问题02
排查
Spark
streaming数据写入时间过长问题,一方面是因为程序写数据湖小文件问题。在解决了小文件问题后,还是不能达到预期的1分钟一个batch。
kk_io
·
2024-02-08 10:01
疑难杂症
spark
batch
大数据
企业
Spark
案例--酒店数据分析实战提交
第1关:数据清洗--过滤字段长度不足的且将出生日期转:packagecom.yyimportorg.apache.
spark
.rdd.RDDimportorg.apache.
spark
.sql.
cz学java
·
2024-02-08 10:30
spark
数据分析
大数据
Spark
的timestamp 数据时间问题
使用
Spark
来处理国际业务数据,涉及到数据时区转换,在实际项目中出现时区转换问题。
kk_io
·
2024-02-08 10:29
疑难杂症
spark
大数据
分布式
大数据毕业设计Py
Spark
+PyFlink航班预测系统 飞机票航班数据分析可视化大屏 机票预测 机票爬虫 飞机票推荐系统 大数据毕业设计 计算机毕业设计
博主介绍:✌全网粉丝100W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业毕业设计项目实战6年之久,选择我们就是选择放心、选择安心毕业✌由于篇幅限制,想要获取完整文章或者源码,或者代做,可以给我留言或者找我聊天。感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助更多的人。1.DrissionPage自动化Python爬虫工具采
B站计算机毕业设计超人
·
2024-02-08 09:17
大数据毕业设计
大数据
数据分析
hadoop
数据挖掘
爬虫
spark
flink
分别从前端、后端、数据库阐述web项目的
性能优化
前端优化:1、减少http请求、例如制作精灵图2、html和CSS放在页面上部,javascript放在页面下面,因为js加载比HTML和Css加载慢,所以要优先加载html和css,以防页面显示不全,性能差,也影响用户体验差后端优化:1、缓存存储读写次数高,变化少的数据,比如网站首页的信息、商品的信息等。应用程序读取数据时,一般是先从缓存中读取,如果读取不到或数据已失效,再访问磁盘数据库,并将数
jinjin1009
·
2024-02-08 09:27
深度测评:ONLYOFFICE 桌面编辑器 v8.0新功能
目录前言一、PDF表单处理:提升办公效率二、RTL(从右到左)支持:满足不同语言习惯三、Moodle集成:教育行业的新助力四、本地界面主题:个性化办公体验五、
性能优化
与稳定性提升六、性能与稳定性七、总结与展望前言随着技术的不断进步和用户需求的日益多样化
懒大王敲代码
·
2024-02-08 08:35
懒大王闲谈
编辑器
数字化办公
office
【项目实战】Flink+InfluxDB+Grafana实现对YARN集群队列资源进行画像
一、Flink实时计算第一章:Flink快速入门1.Flink架构2.Flink应用场景3.FlinkVS
Spark
4.实时计算技术选型第二章:Flink项目构建与测试1.快速构建Flink项目2.第一个
大数据研习社
·
2024-02-08 08:56
Flink
flink
Flink实时计算
可视化监控
InfluxDB
spark
运行失败The directory item limit of /
spark
_dir/
spark
_eventLogs is exceeded: limit=1048576 items=104
org.apache.hadoop.hdfs.protocol.FSLimitException$MaxDirectoryItemsExceededException):Thedirectoryitemlimitof/
spark
_dir
不会吐丝的蜘蛛侠。
·
2024-02-08 08:58
Hadoop
spark
hadoop
hdfs
架构进阶:代理模式实战指南,打造灵活高效的应用系统
这种模式广泛应用在多种场景下,比如远程方法调用、安全性控制、日志记录、
性能优化
(如缓存)等。
码进未来
·
2024-02-08 07:34
设计模式
架构
代理模式
设计模式
java
next项目页面性能调优
next项目页面性能调优一般来说
性能优化
可以分为加载时、运行时两部分的优化。
sasaraku.
·
2024-02-08 07:22
前端
js
Flink on Yarn的两种模式
首先,在集群运行时,可能会有很多的集群实例包括MapReduce、
Spark
、Flink等等,那么如果它们全基于onYarn就可以完成资源分配,减少单个实例集群的维护,提高集群的利用率。
GOD_WAR
·
2024-02-08 07:22
Flink
flink
yarn
flink
on
yarn
利用Intersection Observer实现图片懒加载
性能优化
ntersectionObserver是浏览器所提供的一个JavascriptAPI,用于异步的检测目标元素以及祖先或者是顶级的文档视窗的交叉状态这句话的意思就是:我们可以看的图片当中,绿色的targetelement(目标元素),并且存在一个顶层的或者祖先的文档视窗也就是当前图片中的,灰色的browserviewport(浏览器的视窗)当targetelement(目标元素)进行移动的时候,将会
开心点啦.
·
2024-02-08 07:13
javascript
前端
开发语言
前端
性能优化
一、速度为什么很重要?1.效果关乎留存用户BBC发现其网站的加载速度每增加一秒,就会额外损失10%的用户。2.效果关乎转化次数的增加速度较快的网站可以提高转化率并改善业务成果。3.性能关乎用户体验对网页加载速度延迟的压力反应类似于观看恐怖电影或解决数学问题,并且比在零售店排队等候的压力更大。二、HTML性能的一般注意事项该HTML的初始请求需要经历多个步骤,每一步都需要一些时间。减少在每个步骤上花
润清
·
2024-02-08 07:08
前端
性能优化
利用路由懒加载和CDN分发策略对极客园项目进行
性能优化
文章目录前言1.配置路由懒加载2.项目资源打包3.包体积可视化分析4.cdn配置总结前言极客园项目的完成之后,我们需要对项目进行打包以及
性能优化
,优化用户体验以及加快响应时间,本文只列举了路由懒加载和cdn
-_-你好-_-
·
2024-02-08 07:34
性能优化
前端
typescript
react.js
webpack
Flink流式数据倾斜
1.流式数据倾斜流式处理的数据倾斜和
Spark
的离线或者微批处理都是某一个SubTask数据过多这种数据不均匀导致的,但是因为流式处理的特性其中又有些许不同2.如何解决2.1窗口有界流倾斜窗口操作类似
Spark
orange大数据技术探索者
·
2024-02-08 07:58
#
flink迁移
flink
大数据
数据倾斜
Logback - 日志框架
它不仅帮助我们进行错误跟踪,还能有效监控应用程序的运行状态,为
性能优化
提供数据支撑。SpringBoot作为一个简化Spring应用开发的框架,自带了强大的日志管理功能。
奇遇少年
·
2024-02-08 06:41
SpringBoot
logback
java
大数据系列—数据迁移(Sqoop,Flume,DataX)对比学习(stage3)
个人大数据技术栈:DataX,Sqoop,Hadoop,Hive,
Spark
,Flink,Hbase,Kafka,Kettle,Azkaban,Airflow,Tableau…个人在学习领域:Python
道-闇影
·
2024-02-08 06:07
big
data
大数据
sqoop
flume
Spark
安装(Yarn模式)
一、解压链接:https://pan.baidu.com/s/1O8u1SEuLOQv2Yietea_Uxg提取码:mb4htar-zxvf/opt/software/
spark
-3.0.3-bin-hadoop3.2
莫噶
·
2024-02-08 04:44
搭建
spark
大数据
分布式
使用 NtQuerySystemInformation 遍历进程信息
在Windows操作系统中,了解正在运行的进程的信息对于系统管理和
性能优化
至关重要。
涟幽516
·
2024-02-08 03:08
Windows
基础编程
windows
微软
c语言
c++
visual
studio
图解大数据 | 大数据分析挖掘-
Spark
初步
图解大数据|大数据分析挖掘-
Spark
初步作者:韩信子@ShowMeAI教程地址:www.showmeai.tech/tutorials/8…本文地址:www.showmeai.tech/article-det
Dashesand
·
2024-02-08 03:22
大数据
数据分析
spark
性能优化
汇总
Babelpolyfill的按需加载Babel7主要是通过其提供的@babel/preset-env实现按需加载的。npminstall@babel/polyfill--save同时,需要在.browserslistrc文件或者.babelrc的targets字段中指定需要兼容的浏览器范围。之后在.babelrc文件中对@babel/preset-env进行配置。@babel/preset-env
lmmy123
·
2024-02-08 02:11
docker数据科学与
spark
镜像源与使用常见问题疑难解答
以下是一些与数据挖掘和数据科学相关的Docker镜像源:jupyter/all-
spark
-notebook:此镜像包含JupyterNotebook和
Spark
的完整环境,用于
Spark
开发和学习。
DreamNotOver
·
2024-02-08 01:16
eureka
java
spring
cloud
用docker 配置scala
spark
环境
要使用Docker配置Scala和
Spark
环境,您可以按照以下步骤进行操作。以下是一个基本的示例,您可能需要根据您的具体需求进行调整。安装Docker:在您的系统上安装Docker。
DreamNotOver
·
2024-02-08 01:14
python
数据挖掘
docker
docker
scala
spark
容器
网易和腾讯面试题精选---性能和优化面试问题
从理解CPU缓存层次结构的复杂性到利用高级缓存机制,从优化数据库交互到微调分布式系统,这本综合指南提供了对
性能优化
的多方面的见解。面试问答1
前网易架构师-高司机
·
2024-02-08 00:15
服务器面试题
面试
性能优化
Spark
Standalone 集群配置
集群管理类型
Spark
支持三种集群管理类型:Standalone-
Spark
附带的一个简单的集群管理器,可以轻松地设置集群。
董可伦
·
2024-02-07 23:01
Spark
spark
大数据
分布式
Cesium
性能优化
- 学习笔记
1.Cesium
性能优化
-学习笔记开启FPS显示当前帧率viewer.scene.debugShowFramesPerSecound=true;关闭太阳,月亮,天空盒,雾等相关特效viewer.scene.moon.show
你大爷的,这都没注册了
·
2024-02-07 23:12
Cesium
学习
笔记
《MySQL 简易速速上手小册》第3章:
性能优化
策略(2024 最新版)
文章目录3.1查询优化技巧3.1.1基础知识3.1.2重点案例3.1.3拓展案例3.2索引和查询性能3.2.1基础知识3.2.2重点案例3.2.3拓展案例3.3优化数据库结构和存储引擎3.3.1基础知识3.3.2重点案例3.3.3拓展案例3.1查询优化技巧让我们来聊聊如何让你的MySQL查询跑得像被闪电击中一样快。查询优化是艺术与科学的完美结合,它涉及到理解如何有效利用MySQL的特性来减少执行时
江帅帅
·
2024-02-07 23:10
《MySQL
简易速速上手小册》
mysql
性能优化
数据库
大数据
人工智能
web3
区块链
基于Vue3搭建的低代码数据可视化开发平台
结尾有链接整体介绍框架:基于Vue3框架编写,使用hooks写法抽离部分逻辑,使代码结构更加清晰;类型:使用TypeScript进行类型约束,减少未知错误发生概率,可以大胆修改逻辑内容;性能:多处
性能优化
神码观察
·
2024-02-07 23:26
开源推荐
信息可视化
RDD vs DataFrame vs Dataset
RDD是
Spark
最基础的数据结构。RDD允许开发者使用容错的形式在集群中使用内存计算,这样可以提高计算速度。1.2DataFrameDataFrame是使用数据组成命名
一生逍遥一生
·
2024-02-07 22:20
2021-02-05
[深入浅出Cocoa]iOS程序
性能优化
罗朝辉(http://blog.csdn.net/kesalin)CC许可,转载请注明出处iOS应用是非常注重用户体验的,不光是要求界面设计合理美观,也要求各种UI
easy_luo
·
2024-02-07 20:30
【面试进阶之路】MySQL 查询优化最佳实践
MySQL查询优化最佳实践MySQL无论是在面试还是工作使用中,最重要的就是对SQL语句进行
性能优化
优化的关键就是索引,MySQL通过提供索引功能来加快对数据的查询速度,而有时因为我
11来了
·
2024-02-07 18:06
面试进阶之路
面试
mysql
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他