E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark调优
Python机器学习之交叉验证
交叉验证是一种非常常用的对于模型泛化能力进行评估方法,交叉验证既可以解决数据集的数据量不够大问题,也可以解决参数
调优
的问题。
一只怂货小脑斧
·
2024-02-13 09:32
Hive
调优
——explain执行计划
一、explain查询计划概述explain将HiveSQL语句的实现步骤、依赖关系进行解析,帮助用户理解一条HQL语句在底层是如何实现数据的查询及处理,通过分析执行计划来达到Hive
调优
,数据倾斜排查等目的
爱吃辣条byte
·
2024-02-13 07:10
#
Hive
大数据
数据仓库
探索XGBoost:多分类与不平衡数据处理
本教程将深入探讨如何在Python中使用XGBoost处理多分类和不平衡数据,包括数据准备、模型
调优
和评估等方面,并提供相应的代码示例。准备数据首先,我们需要准备多分类和不平衡的数据集。
Echo_Wish
·
2024-02-13 05:19
Python算法
Python
笔记
分类
数据挖掘
人工智能
Spark
编程实验五:
Spark
Structured Streaming编程
目录一、目的与要求二、实验内容三、实验步骤1、Syslog介绍2、通过Socket传送Syslog到
Spark
3、Syslog日志拆分为DateFrame4、对Syslog进行查询四、结果分析与实验体会一
Francek Chen
·
2024-02-13 05:49
Spark编程基础
spark
大数据
分布式
syslog
Spark
(三十五)troubleshooting之错误的持久化方式以及checkpoint的使用
一、背景错误的持久化使用方式:usersRDD,想要对这个RDD做一个cache,希望能够在后面多次使用这个RDD的时候,不用反复重新计算RDD;可以直接使用通过各个节点上的executor的BlockManager管理的内存/磁盘上的数据,避免重新反复计算RDD。usersRDD.cache()usersRDD.count()usersRDD.take()上面这种方式,不要说会不会生效了,实际上
文子轩
·
2024-02-13 02:26
Java从入门到精通
掌握Java语言本身、Java核心开发技术以及Java标准库的使用;2、如果继续学习JavaEE,那么Spring框架、数据库开发、分布式架构就是需要学习的;3、如果要学习大数据开发,那么Hadoop、
Spark
nightluo
·
2024-02-13 01:52
基础学习
java
开发语言
数据清洗
importorg.apache.
spark
.sql.
Spark
SessionobjectDataCleaning{defmain(args:Array[String]):Unit={val
spark
=
扣篮的左手
·
2024-02-12 23:46
【解决方案】py
spark
初次连接mongo 时报错Class not found exception:com.mongodb.
spark
.sql.DefaultSource
部分报错如下:Traceback(mostrecentcalllast): File"/home/cisco/
spark
-mongo-test.py",line7,in df=
spark
.read.format
能白话的程序员♫
·
2024-02-12 19:33
Spark
spark
Spark
- 动态注册UDF
>昨天有位大哥问小弟一个
Spark
问题,他们想在不停
Spark
程序的情况下动态更新UDF的逻辑,他一问我这个问题的时候,本猪心里一惊,
Spark
**还能这么玩?
kikiki5
·
2024-02-12 19:01
性价比满满的大显存甜点卡,
Spark
le(撼与科技)Intel Arc A770 TIT
●前言一直以来,2000元左右价位的独立显卡总是被玩家们称为“甜点级”显卡,因为这个价位段的显卡有着不俗的性能,游戏和生产力都能兼顾,而且不算太贵的定价也是能够让大众所接受,整体算下来还是很有性价比的。然而,在众多的甜点级显卡当中,除了N、A两家的甜点级显卡之外,前些年入局独显的英特尔也是有对应的产品可选,比如A770以及A750就有着优于同价位竞品的性能以及更低的售价,性价比尤为突出。作为英特尔
焦点易讯
·
2024-02-12 18:08
业界资讯
28、
Spark
核心编程之高级编程之二次排序
需求按照文件中的第一列排序。如果第一列相同,则按照第二列排序。文件内容2536241315Java实现自定义的二次排序key/***自定义的二次排序key*/publicclassSecondarySortKeyimplementsOrdered,Serializable{//首先在自定义key里面,定义需要进行排序的列privateintfirst;privateintsecond;public
ZFH__ZJ
·
2024-02-12 17:33
大数据视频教程百度网盘下载
同时,人们又试图用深度学习这样新的思路去解决过去MapReduce和
Spark
已经解决的问题,这也意味着大数据技术开始进入3.0时代。在这个全新阶段,可以看到整个市场上已经可以提
QFdongdong
·
2024-02-12 16:42
Hbase - 自定义Rowkey规则
中我们有时候需要分析数据1点到2点的范围,可是经过Region又比较慢,这时候我们就可以定制TableInputFormat来实现我们的需求了,我们还可以采用Flink的DataSet的方式读取,另外下面还有
Spark
大猪大猪
·
2024-02-12 15:45
MySQL性能
调优
篇(1)-分析执行计划的方法
MySQL是一种常用的关系型数据库管理系统,它的性能优化对于数据处理的效率和性能至关重要。在优化MySQL数据库的过程中,分析执行计划是一个重要的步骤。执行计划是查询优化器在执行SQL语句时生成的一种解析树或操作流程图,用于描述MySQL数据库系统按照哪种方式执行查询操作。本文将介绍如何使用MySQL的语法来分析执行计划,并提供详细的示例。在MySQL中,我们可以使用EXPLAIN关键字来分析执行
俞兆鹏
·
2024-02-12 13:56
MySQL学习指南
mysql
JVM
调优
的一些常用技术
JVM(Java虚拟机)
调优
是一个复杂的过程,涉及到对JVM运行时行为的监控和调整,以提高应用程序的性能和响应速度,减少内存使用,避免内存泄漏等问题。
dreammaker阿甘
·
2024-02-12 12:48
JAVA
jvm
Spark
MLlib
目录一、
Spark
MLlib简介(一)什么是机器学习(二)基于大数据的机器学习(三)
Spark
机器学习库MLlib二、机器学习流水线(一)机器学习流水线概念(二)流水线工作过程(三)构建一个机器学习流水线三
Francek Chen
·
2024-02-12 11:15
Spark编程基础
spark-ml
spark
mllib
机器学习
Structured Streaming
目录一、概述(一)基本概念(二)两种处理模型(三)StructuredStreaming和
Spark
SQL、
Spark
Streaming关系二、编写StructuredStreaming程序的基本步骤(
Francek Chen
·
2024-02-12 11:44
Spark编程基础
spark
zookeeper
kafka
Structured
Streaming
入门篇 -
Spark
简介
Spark
核心模块image.png
Spark
Core:提供了
Spark
最基础与最核心的功能,
Spark
其他的功能如:
Spark
SQL,
Spark
Streaming,GraphX,MLlib都是在
Spark
Core
君子何为
·
2024-02-12 10:22
Spark
作业执行
Spark
基本组件,Master和Worker,负责运行Client和Driver作业执行框架每个
Spark
Application由主控节点Master、集群资源管理节点ClusterManager、执行任务节点
Alex90
·
2024-02-12 05:04
读书笔记之《运动改造大脑》:运动是最佳的健脑丸
《运动改造大脑》的作者是约翰•瑞迪(JohnRatey)/埃里克•哈格曼(EricHagerman),原著名称为:
Spark
:therevolutionarynewscienceofexerciseandthebrain
AIGCTribe
·
2024-02-12 04:15
人工智能
Spark
共享变量
翻译
Spark
共享变量部分的官方文档(
Spark
2.4.3)。通常,当传递给
Spark
操作(如map或reduce)的函数在远程集群节点上执行时,在函数中使用的所有外部变量都是单独拷贝的变量副本。
stone_zhu
·
2024-02-12 03:02
gerrit
调优
——超级干货
一、确定配置大小根据gerrit使用的服务器集群的硬件配置来确定大小二、调整gerrit.configreceive.timeout处理传入更改和更新refs和Gerrit更改的超时。sshd.threads处理ssh请求的线程,限制可能的并行克隆/推送的数量httpd.maxThreads处理http克隆/推送请求和审查相关活动的线程数量database.poolLimitGerrit的数据库连
KEY丶
·
2024-02-11 21:50
Guava Cache之开启统计信息收集
GauvaCache开启统计信息收集1.开启统计在创建Cache时,我们可以配置Cache让其开启统计信息收集,这样我们就可以对Cache的内存使用情况进行监控,并根据统计信息对cache进行
调优
,如果您的应用比较重视性能的话
大风过岗
·
2024-02-11 21:00
hive 和
spark
环境同时部署linux环境变量后beeline命令冲突
由于两个应用都有相同的beelineshell文件所以在同时配置/etc/profile文件中环境变量时会导致先执行前面的环境变量指向的beeline,导致beeline命令报版本不一致错误。hivebeeline客户端报错,hive-jdbc版本不一致。
朱晔_74d3
·
2024-02-11 21:21
SpringBoot 接入讯飞星火大模型实现对话
申请地址https://xinghuo.xfyun.cn/
spark
api?
生产队的驴.
·
2024-02-11 20:17
Spring
Boot
spring
boot
后端
java
spring
maven
servlet
tomcat
一、全面理解 JVM 虚拟机
然后:学习JVM也是进行JVM
调优
的基础。写的代码放到线上要如何运行?要配多少内存?4G够不够?线上环境出问题,服务崩溃了,怎么快速定位?怎么解决问题?
硅谷子编程
·
2024-02-11 19:46
jvm
通义灵码——灵动指间,快码加编,你的智能编码助手
是阿里云出品的一款基于通义大模型的智能编码辅助工具,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释、研发智能问答、异常报错排查等能力,并针对阿里云的云服务使用场景
调优
·
2024-02-11 18:13
阿里云云原生
JVM | 第2部分:虚拟机执行子系统《深入理解 Java 虚拟机》
前言参考资料:《深入理解Java虚拟机-JVM高级特性与最佳实践》第1部分主题为自动内存管理,以此延伸出Java内存区域与内存溢出、垃圾收集器与内存分配策略、参数配置与性能
调优
等相关内容;第2部分主题为虚拟机执行子系统
多氯环己烷
·
2024-02-11 17:08
学成网html+css案例
商业预测>云计算&大数据>运维&测试>UI设计>产品>我的课程表继续学习程序语言设计正在学习-使用对象继续学习程序语言设计正在学习-使用对象继续学习程序语言设计正在学习-使用对象全部课程精品推荐JQuery
Spark
MySQLJavaWebMyS
倒霉娃不要倒霉
·
2024-02-11 15:33
案例
html
css
Spark
使用之操作Hudi表
Hudi
Spark
使用本篇为大家带来通过
Spark
shell和
Spark
SQL操作Hudi表的方式。
AlienPaul
·
2024-02-11 14:52
梯度提升树系列7——深入理解GBDT的参数
调优
目录写在开头1.GBDT的关键参数解析1.1学习率(learningrate)1.2树的数量(n_estimators)1.3树的最大深度(max_depth)1.4叶子节点的最小样本数(min_samples_leaf)1.5特征选择的比例(max_features)1.6最小分裂所需的样本数(min_samples_split)1.7子采样比例(subsample)1.8损失函数(loss)1
theskylife
·
2024-02-11 14:40
数据分析
数据挖掘
人工智能
数据挖掘
机器学习
python
分类
离线数仓(一)【数仓概念、需求架构】
前言今天开始学习数仓的内容,之前花费一年半的时间已经学完了Hadoop、Hive、Zookeeper、
Spark
、HBase、Flume、Sqoop、Kafka、Flink等基础组件。
让线程再跑一会
·
2024-02-11 11:58
离线数仓
大数据
相机图像质量研究(11)常见问题总结:光学结构对成像的影响--像差
系列文章目录相机图像质量研究(1)Camera成像流程介绍相机图像质量研究(2)ISP专用平台
调优
介绍相机图像质量研究(3)图像质量测试介绍相机图像质量研究(4)常见问题总结:光学结构对成像的影响--焦距相机图像质量研究
上天肖
·
2024-02-11 09:45
ISP
计算机视觉
数码相机
人工智能
基于Swoole的高性能系统监控及Nginx负载均衡的实现
优化可以从很多的角度处理,比如说底层代码,系统
调优
比如要加大核数或者是否借助es查mysql,或者不同地区用户走到哪个机房。Part1服务监控
Bing的天涯路
·
2024-02-11 08:54
Hive与ClickHouse的区别
Hive的存储引擎使用HDFS,计算引擎使用MapReduce或
Spark
。Hive本质上是一个元数据管理平台,通过对存储于HDFS上的数据文件附加元数据,赋予HDFS上的文件以数据库表的语义。
晓之以理的喵~~
·
2024-02-11 08:18
Hadoop
大数据
hive
hive
clickhouse
hadoop
一次显著的性能提升,从8s到0.7s
今天从实战的角度出发,给大家分享一下如何做SQL
调优
。经过两次优化之后,慢SQL的性能显著提升了,耗时从8s优化到了0.7s。1案发现场前几天,我收到了一封报警邮件,提示有一条慢查询SQL。
近咫/\ぃ天涯
·
2024-02-11 08:15
数据库
java
大数据
并发编程(一)-多线程&并发设计原理
在一些对性能要求比较高场合,多线程是java程序
调优
的重要方面。Java并发编程主要涉及以下几个部分:并发编程三要素原子性:即一个不可再被分割的颗粒。
Alan1914
·
2024-02-11 07:49
Spark
编程题
数据格式如下:张三|男|23|未婚|北京|海淀李四|女|25|已婚|河北|石家庄求:1.数据中所有人的平均年龄2.数据中所有男性未婚的人数和女性未婚人数3.数据中20-30已婚数量前3的省份答案:package
spark
08importorg.apache.
spark
.rdd.RDDimportorg.apache.spa
不愿透露姓名的李某某
·
2024-02-11 07:09
死磕
spark
中的job、stage、task
写在前面台风夜的电话面试里被问到了
spark
运行任务的过程中stage的划分依据。一下子就给整懵了,支支吾吾答非所问。从事大数据的开发也有一年半光景,
spark
任务的运行原理依旧知之甚少。
NikolasNull
·
2024-02-11 06:11
国外现代并行计算课程CMU-15-418/15-618: Parallel Computer Architecture and Programming
这是与计算物理最相关的CS课程,计算物理方向很容易吃透作为项目写到简历上这部分主要包括多核计算OpenMPSIMD集群计算MPIGPU计算CUDA分布式计算MapReduce
Spark
互联网主要重视分布式计算
wwxy261
·
2024-02-11 05:03
算法
深度剖析JVM
调优
法则:从两大特性CPU、内存出发轻松掌握
调优
实战技巧
1、JDK自带工具场景一、CPU过高CPU占用过高排查思路:(查进程->查线程列表->查线程堆栈)step1:通过top命令查询占用CPU情况topp.s.shift+p(大写的P-cpu排序)shift+m(大写的M-内存排序)step2:通过进程pid,查询对应的线程列表top-Hppid-H:显示线程信息-ppid1,pid2,...:只显示指定进程的信息step3:线程id转为十六进制从s
栈江湖
·
2024-02-11 03:04
jvm
java
开发语言
使用docker搭建
spark
(2.3.1)集群
使用Docker快速搭建
Spark
集群。
zealscott
·
2024-02-11 01:12
Android性能
调优
- 应用安全问题
Android应用安全1.组件暴露:像比如ContentProvider,BroadcastReceiver,Activity等组件有android:exported属性;如果是私有组件android:exported=“false”;如果是公有组件android:exported=“true”且进行权限控制;2.Log敏感信息泄漏:3.权限申请敏感权限调用在Manifest文件中调用一些敏感的用
emmmmsuperdan
·
2024-02-11 00:46
Android应用安全
android
安全
性能测试流程-性能测试2
性能测试流程1.性能测试需求分析2.性能测试计划及方案3.性能测试用例4.搭建测试环境5.测试数据准备6.测试脚本编写7.执行测试脚本8.性能测试监控9.性能分析和
调优
10.性能测试回归11.性能测试报告总结
Yasar.l
·
2024-02-10 22:24
性能测试
压力测试
测试工具
大数据毕业设计django+vue.js+scrapy租房推荐系统 租房大屏可视化 租房爬虫 hadoop
spark
58同城租房爬虫 房源推荐系统 计算机毕业设计
博主介绍:✌全网粉丝100W+,前互联网大厂软件研发、集结硕博英豪成立工作室。专注于计算机相关专业毕业设计项目实战6年之久,选择我们就是选择放心、选择安心毕业✌由于篇幅限制,想要获取完整文章或者源码,或者代做,可以给我留言或者找我聊天。感兴趣的可以先收藏起来,还有大家在毕设选题,项目以及论文编写等相关问题都可以给我留言咨询,希望帮助更多的人。文章包含:项目选题+项目展示图片(必看)计算机毕业设计吊
B站计算机毕业设计超人
·
2024-02-10 20:52
大数据毕业设计
大数据
课程设计
scrapy
hadoop
大数据毕业设计
计算机毕业设计
爬虫
李健《当你老了》背后的故事动人心——“求不得”也许才是世间最大的痛
歌词隽永,曲
调优
美,李健用舒缓、清冽的声音唱出来,分外打动人心。特别是在黄昏日暮时分,橘黄的光影,风吹过来,听着这首歌,心底想起一个人,那种情境让人沉思、迷醉。这首歌词取
风云舞实用育儿365
·
2024-02-10 19:08
游戏数据分析方法实践
一般而言会有以下几个场景:1.版本测试2.版本更新3.活动发布4.版本
调优
......所以对于数据分析师而言,掌握好分析方法则至关重要。
一条咸鱼的干货
·
2024-02-10 16:44
在Ubuntu上部署Stable Video Diffusion动画制作
其特点主要包括:1、微
调优
化:通过在特定条件下进行微调,提高了视频输出的一致性和质量。2、改进的生成性能:在生成视频的清晰度、分辨率以及帧数方面可能有
BBM的开源HUB
·
2024-02-10 15:08
ubuntu
linux
报表任务治理计划
先给大家介绍我们我们公司的报表产出组件图:报表产出图底层平台由HDFS、Yarn分别提供存储和计算支持在这之上我们提供了一套支持MR、
Spark
任务开发、依赖执行的调度系统BI业务同学利用调
liujianhuiouc
·
2024-02-10 12:46
计算机毕业设计Python+
Spark
+LSTM微博大屏情感分析 微博大数据分析 微博情感分析 微博爬虫可视化 微博数据分析 微博采集分析平台
开发技术前端:vue.jsechartswebsocket后端API:springboot+
spark
+mybatis爬虫/算法:python、lstm情感分析(python实现)数据库:mysql创新点
计算机毕业设计大神
·
2024-02-10 12:42
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他