E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark数据倾斜调优
Flink 细粒度滑动窗口性能优化
大数据技术AIFlink/
Spark
/Hadoop/数仓,数据分析、面试,源码解读等干货学习资料118篇原创内容公众号1、概述1.1细粒度滑动的影响当使用细粒度的滑动窗口(窗口长度远远大于滑动步长)时,
hyunbar
·
2024-02-19 13:39
Flink
大数据
flink
java
数据库
一些Tcp
调优
参数
1.设置向外连接可用端口范围echo"102465535">/proc/sys/net/ipv4/ip_local_port_range2.设置time_wait连接重用echo1>/proc/sys/net/ipv4/tcp_tw_reuse3.设置快速回收time_wait连接echo1>/proc/sys/net/ipv4/tcp_tw_recycle4.设置最大time_wait连接长度e
ShootHzj
·
2024-02-19 13:03
【大数据面试题】006介绍一下Parquet存储格式的优势
同时一般查询使用时不会使用所有列,而是只用到几列,所以查询速度会更快压缩比例高因为是列式存储,所以可以对同一类型的一段做压缩,压缩比例高支持的平台和框架多在Hadoop,
Spark
,Presto,Python
Jiweilai1
·
2024-02-19 13:34
一天一道面试题
大数据
spark
hadoop
七天爆肝flink笔记
一.flink整体介绍及wordcount案例代码1.1整体介绍从上到下包含有界无界流支持状态特点与
spark
对比应用场景架构分层1.2示例代码了解了后就整个demo吧数据源准备这里直接用的文本文件gradle
我才是真的封不觉
·
2024-02-19 13:01
flink
笔记
大数据
(15)Hive
调优
——
数据倾斜
的解决指南
目录前言一、什么是
数据倾斜
二、发生
数据倾斜
的表现2.1MapReduce任务2.2
Spark
任务三、如何定位发生
数据倾斜
的代码四、发生
数据倾斜
的原因3.1key分布不均匀3.1.1某些key存在大量相同值
爱吃辣条byte
·
2024-02-19 11:50
#
Hive
大数据
hive
相机图像质量研究(20)常见问题总结:CMOS期间对成像的影响--全局快门/卷帘快门
系列文章目录相机图像质量研究(1)Camera成像流程介绍相机图像质量研究(2)ISP专用平台
调优
介绍相机图像质量研究(3)图像质量测试介绍相机图像质量研究(4)常见问题总结:光学结构对成像的影响--焦距相机图像质量研究
上天肖
·
2024-02-19 11:19
ISP
计算机视觉
数码相机
人工智能
相机图像质量研究(17)常见问题总结:CMOS期间对成像的影响--靶面尺寸
系列文章目录相机图像质量研究(1)Camera成像流程介绍相机图像质量研究(2)ISP专用平台
调优
介绍相机图像质量研究(3)图像质量测试介绍相机图像质量研究(4)常见问题总结:光学结构对成像的影响--焦距相机图像质量研究
上天肖
·
2024-02-19 11:18
ISP
计算机视觉
数码相机
人工智能
相机图像质量研究(14)常见问题总结:光学结构对成像的影响--伪像
系列文章目录相机图像质量研究(1)Camera成像流程介绍相机图像质量研究(2)ISP专用平台
调优
介绍相机图像质量研究(3)图像质量测试介绍相机图像质量研究(4)常见问题总结:光学结构对成像的影响--焦距相机图像质量研究
上天肖
·
2024-02-19 11:48
ISP
计算机视觉
数码相机
人工智能
相机图像质量研究(24)常见问题总结:CMOS期间对成像的影响--摩尔纹
系列文章目录相机图像质量研究(1)Camera成像流程介绍相机图像质量研究(2)ISP专用平台
调优
介绍相机图像质量研究(3)图像质量测试介绍相机图像质量研究(4)常见问题总结:光学结构对成像的影响--焦距相机图像质量研究
上天肖
·
2024-02-19 10:44
ISP
计算机视觉
数码相机
人工智能
相机图像质量研究(35)常见问题总结:图像处理对成像的影响--运动噪声
系列文章目录相机图像质量研究(1)Camera成像流程介绍相机图像质量研究(2)ISP专用平台
调优
介绍相机图像质量研究(3)图像质量测试介绍相机图像质量研究(4)常见问题总结:光学结构对成像的影响--焦距相机图像质量研究
上天肖
·
2024-02-19 10:06
ISP
计算机视觉
数码相机
人工智能
相机图像质量研究(33)常见问题总结:图像处理对成像的影响--锯齿
系列文章目录相机图像质量研究(1)Camera成像流程介绍相机图像质量研究(2)ISP专用平台
调优
介绍相机图像质量研究(3)图像质量测试介绍相机图像质量研究(4)常见问题总结:光学结构对成像的影响--焦距相机图像质量研究
上天肖
·
2024-02-19 10:05
计算机视觉
数码相机
人工智能
相机图像质量研究(34)常见问题总结:图像处理对成像的影响--拖影
系列文章目录相机图像质量研究(1)Camera成像流程介绍相机图像质量研究(2)ISP专用平台
调优
介绍相机图像质量研究(3)图像质量测试介绍相机图像质量研究(4)常见问题总结:光学结构对成像的影响--焦距相机图像质量研究
上天肖
·
2024-02-19 10:05
ISP
计算机视觉
数码相机
人工智能
相机图像质量研究(31)常见问题总结:图像处理对成像的影响--图像差
系列文章目录相机图像质量研究(1)Camera成像流程介绍相机图像质量研究(2)ISP专用平台
调优
介绍相机图像质量研究(3)图像质量测试介绍相机图像质量研究(4)常见问题总结:光学结构对成像的影响--焦距相机图像质量研究
上天肖
·
2024-02-19 10:35
ISP
计算机视觉
数码相机
人工智能
相机图像质量研究(32)常见问题总结:图像处理对成像的影响--振铃效应
系列文章目录相机图像质量研究(1)Camera成像流程介绍相机图像质量研究(2)ISP专用平台
调优
介绍相机图像质量研究(3)图像质量测试介绍相机图像质量研究(4)常见问题总结:光学结构对成像的影响--焦距相机图像质量研究
上天肖
·
2024-02-19 10:35
ISP
计算机视觉
数码相机
人工智能
Hive
调优
——count distinct替换
离线数仓开发过程中经常会对数据去重后聚合统计,而对于大数据量来说,count(distinct)操作消耗资源且查询性能很慢,以下是
调优
的方式。
爱吃辣条byte
·
2024-02-15 10:58
#
Hive
hive
数据仓库
Hive——动态分区导致的小文件问题
目录0问题现象1问题解决解决方案一:调整动态分区数方案一弊端:小文件剧增解决方案二:distributeby方案二弊端:
数据倾斜
解决方案三:distributeby命令2思考3小结0问题现象现象:报错errorr
爱吃辣条byte
·
2024-02-15 10:25
#
Hive
hive
数据仓库
Hive on
Spark
配置
前提条件1、安装好Hive,参考:Hive安装部署-CSDN博客2、下载好
Spark
安装包,链接:https://pan.baidu.com/s/1plIBKPUAv79WJxBSbdPODw?
在下区区俗物
·
2024-02-15 10:51
hive
spark
hadoop
配置hive on
spark
配置hiveon
spark
1、上传
Spark
纯净版jar包到HDFS:hdfsdfs-mkdir/
spark
-jarshdfsdfs-put/opt/
spark
/jars/*/
spark
-jars2、修改
空白格2519
·
2024-02-15 10:51
数据采集
big
data
hive
spark
hadoop
hive on
spark
配置经验
常规配置配置完,开启hadoop,开启
spark
(如果在hdfs上上传了纯净版的
spark
则不需要开启),开启hive注:当前节点一定要是namenode的active节点,因为hadoop长时间不用namenode
小五冲冲冲
·
2024-02-15 10:21
Spark
hive
spark
hadoop
NLP_ChatGPT的RLHF实战
而ChatGPT的训练工程称得上是复杂而又神秘的,迄今为止,OpenAl也没有开源它的训练及
调优
的细节。从OpenAl已经公开的一部分信息推知,ChatGPT的训练主要由三个步骤组成,如下图所示。
you_are_my_sunshine*
·
2024-02-15 09:41
NLP
大模型
chatgpt
自然语言处理
人工智能
Hive3.1.2——企业级
调优
前言本篇文章主要整理hive-3.1.2版本的企业
调优
经验,有误请指出~一、性能评估和优化1.1Explain查询计划使用explain命令可以分析查询计划,查看计划中的资源消耗情况,定位潜在的性能问题
爱吃辣条byte
·
2024-02-15 09:48
#
Hive
hive
数据仓库
MySQL性能
调优
篇(3)-缓存的优化与清理
MySQL数据库缓存的优化与清理数据库缓存在MySQL中扮演着非常重要的角色,它可以显著提高数据库的性能和响应速度。在本篇博客中,我们将介绍如何优化和清理MySQL数据库的缓存,以进一步提高数据库的效率。优化缓存1.适当调整缓存大小MySQL数据库的缓存大小对性能有着直接的影响。通过修改以下两个参数,可以调整缓存的大小:innodb_buffer_pool_size:适用于InnoDB存储引擎,用
俞兆鹏
·
2024-02-15 08:35
MySQL学习指南
mysql
MySQL性能
调优
篇(4)-查询语句的优化与重构
MySQL数据库查询语句的优化与重构MySQL是一种常用的关系型数据库管理系统,广泛应用于Web开发中。在实际应用中,对数据库查询语句的优化和重构是提高应用性能和响应速度的重要手段。本文将介绍一些常见的优化技巧和重构方法,帮助开发者提高数据库查询效率。优化索引索引是数据库中存储数据位置的数据结构,可以加快查询操作的速度。对于频繁查询的列,可以为其添加索引。常用的索引类型包括主键索引、唯一索引和普通
俞兆鹏
·
2024-02-15 08:24
MySQL学习指南
mysql
Hbase - 自定义Rowkey规则
中我们有时候需要分析数据1点到2点的范围,可是经过Region又比较慢,这时候我们就可以定制TableInputFormat来实现我们的需求了,我们还可以采用Flink的DataSet的方式读取,另外下面还有
Spark
kikiki2
·
2024-02-15 06:39
【MySQL进阶之路】亿级数据量表SQL
调优
实战
亿级数据量表SQL
调优
实战先说一下案例背景:在电商平台中,有一个商品表,数据量级别上亿,有一天晚上突然出现大量的慢查询告警,导致每一个数据库连接执行慢查询耗费几十秒的时间,以至于数据
11来了
·
2024-02-15 05:32
MySQL进阶之路
mysql
sql
数据库
【MySQL进阶之路】十亿量级评论表SQL
调优
实战
十亿量级评论表SQL
调优
实战先说一下案例背景:在电商系统的评论表中,数据量非常大,达到了十亿量级,因此对评论的数据库进行分库分表处理,在分库分表之后,基本上单表的评论数据在百万级别左
11来了
·
2024-02-15 05:32
MySQL进阶之路
mysql
sql
数据库
记一次PHP并发性能
调优
实战 -- 性能提升104%
适合阅读人群文中的
调优
思路无论是php,java,还是其他任何语言都是用.如果你有php使用经验,那肯定就更好了业务背景框架及相应环境laravel5.7,mysql5.7,redis5,nginx1.15centos7.5bbrdocker
PHP9年架构师
·
2024-02-15 04:59
Java 性能
调优
的 11 个实用技巧
大多数开发人员认为性能优化是个比较复杂的问题,需要大量的经验和知识。是的,这并不没有错。诚然,优化应用程序以获得最好的性能并不是一件容易的事情,但这并不意味着你在没有获得这些经验和知识之前就不能做任何事。下面有几个很容易遵循的建议和最佳实践能够帮你创建一个性能良好的应用程序。这些建议中的大多数都是基于Java的,但是也不一定,也有一些是可以应用于所有的应用程序和编程语言的。在我们分享基于Java的
java菜
·
2024-02-15 04:29
HIVE优化场景七--
数据倾斜
--Join 倾斜
2)由于数据类型不一致,导致的转换问题,导致的
数据倾斜
场景说明:用户表中user_id字段为int,log表中user_id为既有string也有int的类型。
xuanxing123
·
2024-02-15 01:10
(免费领源码)python+mysql+
spark
手机销售数据的可视化分析系统44127-计算机毕业设计项目选题推荐
摘要信息化社会内需要与之针对性的信息获取途径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题。针对手机销售数据管理等问题,对手机销售数据管理进行研究分析,然后开发设计出手机销售数据可视化系统以解决问题。手机销售数据可视化系统主要功能模块包括系统首页、轮播图、公告信息、资源管理(新闻资讯、新闻分类)交流管理(交流论坛、论坛分
2301_3224142804
·
2024-02-15 00:40
python
mysql
spark
java
spring
boot
php
c#
MySQL 优化
查看MySQL的运行状态如果系统的并发请求数不高,且查询速度慢,可以忽略该步骤直接进行SQL语句
调优
步骤。
Neo_zero
·
2024-02-14 22:24
Hive经典面试题
1.Hive表关联查询,如何解决
数据倾斜
的问题1)倾斜原因:map输出数据按keyHash的分配到reduce中,由于key分布不均匀、业务数据本身的特、建表时考虑不周、等原因造成的reduce上的数据量差异过大
Yang_6234
·
2024-02-14 20:03
基于Kafka的实时计算引擎如何选择?
以Flink和
Spark
为首的实时计算引擎,成为实时计算场景的重点考虑对象。那么,今天就来聊一聊基于Kafka的实时计算引擎如何选择?Flinkor
Spark
?2.为何需要实时计算?
java菜
·
2024-02-14 19:37
调用讯飞火星AI大模型WebAPI
getWebsocketUrl(){returnnewPromise((resolve,reject)=>{varapiKey=API_KEYvarapiSecret=API_SECRETvarurl='ws://
spark
-api
雲墨知秋
·
2024-02-14 18:54
javascript
开发语言
ecmascript
MySQL性能
调优
-(七)分区分表
分区表的应用场景1.表非常大以至于无法全部都放在内存中,或者只在表的最后部分有热点数据,其他均是历史数据2.分区表的数据更容易维护批量删除大量数据可以使用清除整个分区的方式对一个独立分区进行优化、检查、修复等操作3.分区表的数据可以分布在不同的物理设备上,从而高效地利用多个硬件设备4.可以使用分区表来避免某些特殊的瓶颈innodb的单个索引的互斥访问ext3文件系统的inode锁竞争5.可以备份和
努力的布布
·
2024-02-14 18:38
MySQL
mysql
Spark
通过jdbc性能
调优
--采用分区的方式从oracle读数据
spark
通过jdbc读取Oracle,当数据量很大的时候会出现两个问题:读取数据异常缓慢,甚至卡死大表中进行操作也会出现OOM的问题
调优
常规的读取数据库的方式如下ods_bdz=
spark
.read.format
korry24
·
2024-02-14 18:08
oracle
spark
mysql
MySQL性能
调优
篇(5)-分区表的设计和使用
数据库分区表是MySQL中一种高效的数据管理技术,能够帮助我们更好地进行数据存储和查询。在本文中,我们将介绍MySQL数据库分区表的设计和使用。什么是数据库分区表数据库分区表是将一个大表拆分成多个小表,每个小表称为一个分区。分区表在逻辑上仍然是一个完整的表,但在物理存储上被分成多个部分。分区表可以根据表中的某个列的值进行划分,比如根据日期、地区、用户ID等。这样可以将数据分散存储在不同的分区中,提
俞兆鹏
·
2024-02-14 18:38
MySQL学习指南
mysql
Py
Spark
介绍及其安装教程
一、Py
Spark
是什么PythonPy
Spark
是
Spark
官方提供的一个Python类库,其中内置了完全的
Spark
API,使得Python用户在导入这个类库后,可以使用自己熟悉的Python语言来编写
文景大大
·
2024-02-14 14:58
Spark
(四十二)
数据倾斜
解决方案之使用随机数以及扩容表进行join
一、背景当采用随机数和扩容表进行join解决
数据倾斜
的时候,就代表着,你的之前的
数据倾斜
的解决方案,都没法使用。这个方案是没办法彻底解决
数据倾斜
的,更多的,是一种对
数据倾斜
的缓解。
文子轩
·
2024-02-14 14:36
Spark
编程实验六:
Spark
机器学习库MLlib编程
目录一、目的与要求二、实验内容三、实验步骤1、数据导入2、进行主成分分析(PCA)3、训练分类模型并预测居民收入4、超参数
调优
四、结果分析与实验体会一、目的与要求1、通过实验掌握基本的MLLib编程方法
Francek Chen
·
2024-02-14 14:48
Spark编程基础
spark
mllib
大数据
机器学习
算法
2021金三银四面试跳槽必备:15个互联网大厂Java高级工程师核心面试宝典
内容包括:Java集合22题及答案解析JVM与
调优
21题及答案解析并发编程28题及答案解析Spring25题及答案解析23种设计模式解析SpringBoot25题及答案解析分布式高并发架构解析(消息队列
码农小芷
·
2024-02-14 11:43
ShuffleManager 原理
在
Spark
的源码中,负责shuffle过程的执行、计算、处理的组件主要是ShuffleManager。在
Spark
1.2以前,默认的shuffle计算引擎是HashShuffleManager。
stone_zhu
·
2024-02-14 10:03
openGauss学习笔记-218 openGauss性能
调优
-确定性能
调优
范围-硬件瓶颈点分析-I/O
文章目录openGauss学习笔记-218openGauss性能
调优
-确定性能
调优
范围-硬件瓶颈点分析-I/O218.1查看I/O状况218.2性能参数分析openGauss学习笔记-218openGauss
superman超哥
·
2024-02-14 10:36
openGauss学习笔记
openGauss
国产数据库
开源数据库
数据库
RDBMS
openGauss学习笔记-217 openGauss性能
调优
-确定性能
调优
范围-硬件瓶颈点分析-内存
文章目录openGauss学习笔记-217openGauss性能
调优
-确定性能
调优
范围-硬件瓶颈点分析-内存217.1查看内存状况217.2性能参数分析openGauss学习笔记-217openGauss
superman超哥
·
2024-02-14 10:34
openGauss学习笔记
openGauss
国产数据库
开源数据库
数据库
RDBMS
Hadoop+
Spark
+MongoDB+MySQL+C#大数据开发项目最佳实践
一、前言随着IT技术的飞速发展,各行各业都已在广泛尝试使用大数据技术提供更稳健和优质的服务。目前,医疗IT系统收集了大量极具价值的数据,但这些历史医疗数据并没有发挥出其应有的价值。为此,本文拟利用医院现有的历史数据,挖掘出有价值的基于统计学的医学规则、知识,并基于这些信息构建专业的临床知识库,提供诊断、处方、用药推荐功能,基于强大的关联推荐能力,极大地提高医疗服务质量,减轻医疗人员的工作强度。二、
yiyidsj
·
2024-02-14 07:08
大数据
人工智能
互联网
spark
Hadoop
MySQL
大数据开发
大数据学习
基于 C# 的 ETL 大数据并行编程
Apache
Spark
是一个用于Extract(提取),
dotNET跨平台
·
2024-02-14 07:07
c#
数据库
编程语言
java
大数据
《Java 简易速速上手小册》第8章:Java 性能优化(2024 最新版)
8.1.1基础知识8.1.2重点案例:使用VisualVM监控应用性能8.1.3拓展案例1:使用JProfiler分析内存泄漏8.1.4拓展案例2:使用Gatling进行Web应用压力测试8.2JVM
调优
江帅帅
·
2024-02-14 07:25
《Java
简易速速上手小册》
java
性能优化
spring
spring
boot
算法
数据结构
大数据
Spark
- 动态注册UDF
昨天有位大哥问小弟一个
Spark
问题,他们想在不停
Spark
程序的情况下动态更新UDF的逻辑,他一问我这个问题的时候,本猪心里一惊,
Spark
**还能这么玩?
kikiki2
·
2024-02-14 06:33
java面试题/认证答辩 ---linux系统操作
基本命令(cd,ls,top等)的使用掌握:掌握常用软件的安装(java,mysql等)精通:掌握常见运维工具的使用,能进行脚本开发综合应用:掌握linux操作系统的基本原理,具备在系统下进行网络配置,性能
调优
Fuly1024
·
2024-02-14 05:31
面试刷题
linux
MySQL高级篇——排序、分组、分页优化
MySQL高级篇+设计模式+牛客面试题目录5.排序优化5.1排序优化建议5.2测试5.2.1案例验证5.3.2练习5.3范围查询时索引字段选择5.4filesort算法5.4.1双路排序和单路排序5.4.2
调优
程序员小海绵【vincewm】
·
2024-02-14 02:01
Java学习路线
数据库
sql
java
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他