E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark调优
机器学习调参指南:提升模型性能的关键步骤
诸神缄默不语-个人CSDN博文目录文章目录1.理解模型的参数和超参数2.使用网格搜索进行超参数
调优
3.随机搜索4.贝叶斯优化5.使用交叉验证避免过拟合6.考虑正则化7.调整学习率和其他优化器参数8.实验和记录
诸神缄默不语
·
2023-11-24 01:51
人工智能学习笔记
机器学习
人工智能
调参
xml文件的注释CDATA必须写在元素的里面
配置-
Spark
3.5.0文档(apache.org)
青春不流名
·
2023-11-24 00:06
linux
k8s集群引入外部服务kafka
apiVersion:v1kind:Servicemetadata:labels:app:kafkaname:kafkanamespace:apache-
spark
spec:type:ClusterIPports
青春不流名
·
2023-11-24 00:36
hadoop
聊聊并发(3):Java线程池的分析和使用
线程是稀缺资源,如果无限制的创建,不仅会消耗系统资源,还会降低系统的稳定性,使用线程池可以进行统一的分配,
调优
和监控。但是要做到合理的利用线程池,必须对其
Java面试:
·
2023-11-24 00:12
java
面试
并发
线程池
聊聊Java线程池原理
使用线程池的好处如下:降低资源消耗:可重复利用已创建的线程池,降低创建和销毁带来的消耗;提高响应速度:任务到达时,可立即执行,无需等待线程创建;提高线程的可管理性:线程池可对线程统一分配、
调优
和监控。
平凡的java梦
·
2023-11-24 00:11
Java
队列
java
面试
多线程
编程语言
代码思路分享 计算机毕业设计Python+Hadoop+
Spark
+Hive旅游可视化 旅游数据分析 数据仓库 旅游推荐系统 旅游大数据 大数据毕业设计 大数据毕设
涉及技术hadoophiveazkabanpython爬虫huesqoopmysql运行截图
haochengxu2022
·
2023-11-24 00:09
推荐系统
机器学习
数据分析
大数据
hive
hadoop
大数据毕设-基于hadoop+
spark
+大数据+机器学习+大屏的电商商品数据分析可视化系统设计实现 电商平台数据可视化实时监控系统 评论数据情感分析
定制开发,远程调试代码讲解,文档指导,ppt制作精彩专栏推荐订阅:在下方专栏Java精彩实战毕设项目案例小程序精彩项目案例Python实战项目案例文末获取源码文章目录电商商品数据分析可视化系统-系统前言简介
spark
雨晨源码
·
2023-11-24 00:37
Python实战项目集
大数据
hadoop
机器学习
spark
毕业设计
python
预测模型
大数据毕设-基于hadoop+
spark
+echarts+机器学习的豆瓣图书数据可视化分析系统设计实现(附开发文档+部署)
作者:雨晨源码简介:java、微信小程序、安卓;定制开发,远程调试代码讲解,文档指导,ppt制作精彩专栏推荐订阅:在下方专栏Java精彩实战毕设项目案例小程序精彩项目案例Python实战项目案例文末获取源码文章目录豆瓣图书数据可视化分析系统-系统前言简介Hadoop豆瓣图书数据可视化分析系统-开发技术与环境Hadoop豆瓣图书数据可视化分析系统-功能介绍Hadoop豆瓣图书数据可视化分析系统-演示
雨晨源码
·
2023-11-24 00:37
Python实战项目集
信息可视化
大数据
python
django
hadoop
spark
毕业设计
多线程及并发编程之线程池一
线程是稀缺资源,如果无限制的创建,不仅会消耗系统资源,还会降低系统的稳定性,使用线程池可以进行统一的分配,
调优
和监控。但是如果想要合
都要好好的O
·
2023-11-24 00:36
并发编程
并发编程
多线程
线程池
基于Python+
Spark
的热门旅游景点数据可视化分析系统的设计与实现
作者:雨晨源码简介:java、微信小程序、安卓;定制开发,远程调试代码讲解,文档指导,ppt制作精彩专栏推荐订阅:在下方专栏Java精彩实战毕设项目案例小程序精彩项目案例Python实战项目案例文末获取源码文章目录系统前言开发技术与环境需求分析-功能介绍演示图片代码展示结语(文末获取源码)本次文章主要是介绍基于python的热门旅游景点数据可视化分析系统系统前言随着旅游业的迅速发展,人们对热门旅游
雨晨源码
·
2023-11-24 00:01
Python实战项目集
python
spark
django
毕业设计
课程设计
选题推荐
网络爬虫
Hbase - 自定义Rowkey规则
中我们有时候需要分析数据1点到2点的范围,可是经过Region又比较慢,这时候我们就可以定制`TableInputFormat`来实现我们的需求了,我们还可以采用Flink的`DataSet`的方式读取,另外下面还有`
Spark
kikiki5
·
2023-11-23 23:03
使用JMX监控ZooKeeper和Kafka
JVM默认会通过JMX的方式暴露基础指标,很多中间件也会通过JMX的方式暴露业务指标,比如Kafka、Zookeeper、ActiveMQ、Cassandra、
Spark
、Tomcat、Flink等等。
跟着大数据和AI去旅行
·
2023-11-23 23:16
大数据企业级实战
zookeeper
kafka
监控
【
Spark
技术与实战】
Spark
+Scala对化妆品指标的计算处理
文章目录前言项目要求一、数据集介绍二、指标介绍三、项目实现流程1.创建
Spark
Session2.读取数据3.计算价格范围4.分析品牌分布5.分析适用皮肤类型分布6.分析成分7.分析排名变化最大的品牌8
db_lmr_2071
·
2023-11-23 22:35
spark
scala
大数据
Spark
YARN Cluster和Client两种不同提交模式区别:
Spark
YARNCluster和Client两种不同提交模式区别文章目录
Spark
YARNCluster和Client两种不同提交模式区别
Spark
使用
spark
-submit启动应用程序deploy-mode
wang2leee
·
2023-11-23 21:48
spark
大数据
spark
大数据
分布式
spark
broadcast广播原理优缺点示例源码权威讲解
spark
broadcast广播原理优缺点示例源码权威讲解文章目录
spark
broadcast广播原理优缺点示例源码权威讲解广播原理适用场景缺点示例源码broadcast方法基础类Broadcast抽象类实现类
wang2leee
·
2023-11-23 21:47
大数据
spark
spark
大数据
spark
RDD 概述用法官方权威资料(建议收藏)
spark
RDD概述用法权威资料(建议收藏)文章目录
spark
RDD概述用法权威资料(建议收藏)概述与
Spark
的链接初始化
Spark
使用Shell弹性分布式数据集(RDD)并行化集合外部数据集RDD操作基础知识将函数传递给
wang2leee
·
2023-11-23 21:17
spark
大数据
spark
大数据
分布式
Windows下用py
spark
连接mysql数据库
最近开始学
spark
,本来想在虚拟机上学的,但是配置完之后老是报错,搜了半天也找不到解决方案,无奈只好回windows主机上学习了,用的语言是python(不是cs,只会python。。)
芊芊是我的
·
2023-11-23 21:59
Gitlab快速安装
1、环境准备:windows10(作者是在windows下docker安装的,虽然官网不推荐,但是现在win里的wsl2环境提供了可能性,作者的电脑配置不高,经过
调优
后,gitlab能正常运行~)ubuntu18.04LTS
FrankyD90
·
2023-11-23 21:39
其他
docker
github
计算机毕业设计吊打导师hadoop+
spark
+hive微博预警系统 微博数据分析可视化大屏 微博情感分析 微博爬虫 微博大数据 微博推荐系统 微博预测系统
mapreduce对mysql中采集的微博数据进行数据清洗,转为.csv文件上传hdfs文件系统;3.使用hive建库建表,导入.csv数据集;4.一半指标使用hive_sql进行离线分析,一半指标使用
Spark
计算机毕业设计大神
·
2023-11-23 20:09
Linux 的性能
调优
的思路
Linux操作系统是一个开源产品,也是一个开源软件的实践和应用平台,在这个平台下有无数的开源软件支撑,我们常见的apache、tomcat、mysql等。开源软件的最大理念是自由、开放,那么Linux作为一个开源平台,最终要实现的是通过这些开源软件的支持,以最低廉的成本,达到应用最优的性能。因此,谈到性能问题,主要实现的是Linux操作系统和应用程序的最佳结合。01性能问题综述系统的性能是指操作系
程序员曦曦
·
2023-11-23 20:00
自动化测试
软件测试
软件测试工程师
linux
运维
服务器
功能测试
软件测试
自动化测试
程序人生
Educoder中
Spark
任务提交
第1关:
spark
-submit提交#!
小施没烦恼
·
2023-11-23 20:19
大数据处理Spark
spark
大数据
big
data
MySQL缩短查询时间小技巧
背景今天我要统计数据表的最新更新时间,有些表数据量特别大,所以统计比较费时间,但是如果使用一下小技巧,就会极大加快查询时间,适合小白的
调优
手段。
枫叶梨花
·
2023-11-23 20:11
mysql
数据库
Spark
Session读取json格式数据和去除null和空字符串问题
spark
读取不同文件类型的配置都是不同的,首先先看一下不同格式的option的参数。
早上好_先生
·
2023-11-23 19:31
吴恩达深度学习笔记8-Course3-Week1【机器学习策略(ML Strategy)1】
结构化机器学习项目机器学习策略(MLStrategy)1一、机器学习策略介绍(IntroductiontoMLStrategy)1、机器学习策略就是超参数
调优
的策略,怎么调?怎们评估
调优
的效果?
Wang_Jiankun
·
2023-11-23 19:58
吴恩达深度学习
吴恩达深度学习笔记
吴恩达
深度学习
【GaussDB数据库简介】
1、在GaussDB运行的整个生命周期中实现了自运维、自管理、自
调优
、故障自诊断和自愈。通俗讲就相当于实现了数据库动态智能调参、
调优
,而传统的PostgreSql数
Zhao.Mr
·
2023-11-23 19:10
GaussDB
postgresql
Spark
-06:共享变量
为了解决这个问题,
Spark
引入了共享变量的概念。共享变量允许在多个任务之间共享数据,而不是为每个任务分别复制一份变
m0_37559973
·
2023-11-23 18:14
Spark
spark
Spark
任务输出文件过程详解
https://blog.csdn.net/u013332124/article/details/92001346一、
Spark
任务输出文件的总过程当一个Job开始执行后,输出文件的相关过程大概如下:1
疯狂的哈丘
·
2023-11-23 16:32
Spark
的通用运行流程与
Spark
YARN Cluster 模式的运行流程
Spark
的通用运行流程集群启动后Worker节点会向Master节点心跳汇报资源Client向Driver提交APP,根据不同的运行模式在不同的地方创建Driver。
地球魔
·
2023-11-23 15:42
spark
java
服务器
伪分布式系列 - 第三篇 -
spark
-2.4.3环境搭建on hadoop3.2.0
目录基础环境搭建
spark
配置
spark
下载
spark
配置文件环境配置拷贝包yarn配置
spark
启动测试基础环境搭建基于前面的文章,hadoop已经搭建好,下面我们将进行
spark
onyarn搭建下载并配置
rolin-刘瑞
·
2023-11-23 15:22
spark
大数据生态搭建系列
hadoop
spark
免费图书教材配套资料:
Spark
大数据技术与应用(第2版)
《
Spark
大数据技术与应用(第2版)》课程内容全面介绍了
Spark
大数据技术的相关知识,内容包含包括
Spark
概述、Scala基础、
Spark
编程、
Spark
编程进阶、
Spark
SQL结构化数据文件处理
泰迪智能科技
·
2023-11-23 14:36
图书教材推荐
大数据
spark
分布式
Spark
---基于Standalone模式提交任务
/
spark
-submit--master
spark
://mynode1:7077--classorg.apache.
spark
.examples.
Spark
Pi..
30岁老阿姨
·
2023-11-23 14:23
spark
大数据
分布式
Elasticsearch日志配置--性能
调优
之慢查询日志
es里面的操作,主要分为两种,一种写入(增删改),另一种是查询(搜索)我们分别要识别出来,哪些写入操作性能比较慢,哪些查询操作性能比较慢,先要识别出来有性能问题的这些慢查询,慢写入,然后才能去考虑如何优化写入的性能,如何优化搜索的性能搜索慢查询日志无论是慢查询日志,还是慢写入日志,都是针对shard级别的,因为大家应该知道,无论你是执行增删改,还是执行搜索,都是对某个数据执行写入或者是搜索,其实都
kennygu
·
2023-11-23 12:17
elasticsearch
Hive on
Spark
调优
(大数据技术3)
相关文章:Hiveon
Spark
调优
(大数据技术1)Hiveon
Spark
调优
(大数据技术2)Hiveon
Spark
调优
(大数据技术3)HiveonSpa
菜鸟Octopus
·
2023-11-23 12:43
Spark
On
Hive调优
大数据
hive
spark
spark
shuffle 剖析
ShuffleExchangeExecprivatelazyvalwriteMetrics=SQLShuffleWriteMetricsReporter.createShuffleWriteMetrics(
spark
Context
zhixingheyi_tian
·
2023-11-23 12:12
spark
spark
内置数据类型
在用scala编写
spark
的时候,假如我现在需要将我
spark
读的数据源的字段,做一个类型转换,因为需求中要拼接出sql的createtable语句,需要每个字段的sql中的类型,那么就需要去和
spark
sql
后季暖
·
2023-11-23 12:41
spark
大数据
分布式
spark
(一)----算子
1.算子:RDD的方法就叫算子RDD:
spark
中分区的集合textFile(“文件路径”)parallilize(数组/元组/map等一系列集合)2.
spark
中算子分类:(1)Transformations
计算机界的小学生
·
2023-11-23 12:41
spark
spark
big
data
大数据
图解
Spark
Graphx基于connectedComponents函数实现连通图底层原理
原创/朱季谦第一次写这么长的graphx源码解读,还是比较晦涩,有较多不足之处,争取改进。一、连通图说明连通图是指图中的任意两个顶点之间都存在路径相连而组成的一个子图。用一个图来说明,例如,下面这个叫graph的大图里,存在两个连通图。左边是一个连接图,该子图里每个顶点都存在路径相连,包括了顶点:{(5L,"Eve"),(7L,"Grace"),(1L,"Alice"),(2L,"Bob"),(3
朱季谦
·
2023-11-23 12:09
图计算
spark
大数据
分布式
spark
算子大全glom_
Spark
算子- Value Transformation
Spark
算子的作用
Spark
的输入、运行转换、输出过程,在运行转换中通过算子对RDD进行转换输入:外部数据空间(HDFS、Scala集合)输入
Spark
,数据进入
Spark
运行时数据空间,转化为
Spark
weixin_39736934
·
2023-11-23 12:38
spark算子大全glom
大数据开发之Hive优化篇6-Hive on
spark
备注:Hive版本2.1.1一.Hiveon
Spark
介绍Hive是基于Hadoop平台的数据仓库,最初由Facebook开发,在经过多年发展之后,已经成为Hadoop事实上的SQL引擎标准。
只是甲
·
2023-11-23 12:06
大数据和数据仓库
#
Hive
hive
on
spark
hadoop
hive
spark
spark
-RDD编程 持久化,常用算子总结
spark
-RDD编程持久化,常用算子总结RDD编程RDD基础RDD:弹性分布式数据集(ResilientDistributedDataset),是
spark
对数据的核心抽象,
spark
中RDD其实就是不可变的分布式的元素集合
qq_38558851
·
2023-11-23 12:35
spark
大数据
spark
大数据
大数据最佳实践-hive on
spark
目录Hiveon
Spark
与
Spark
SQL
Spark
内存配置
spark
动态分配HiveHiveon
Spark
与
Spark
SQLHive是Hadoop中的标准SQL引擎,也是最古老的引擎之一。
WakeUpCcc
·
2023-11-23 12:33
大数据
hive
spark
hadoop
数据仓库
spark
RDD操作,转换算子和行动算子
RDD介绍在
Spark
中,RDD代表弹性分布式数据集(ResilientDistributedDataset),是一种可以并行计算的、不可变的分布式数据结构。
严同学正在努力
·
2023-11-23 12:02
大数据
spark
分布式
CDH之HIVE-ON-
SPARK
、
Spark
配置
原:CDH之HIVE-ON-
SPARK
、
Spark
配置_小基基o_O的博客-CSDN博客_cdhhiveon
spark
HIVEON
SPARK
配置CDH6.3.2的HIVE版本为:2.1.1+cdh6.3.2HIVE
javastart
·
2023-11-23 12:00
hadoop
spark
hive
大数据
spark
Spark
(三)【
Spark
Core】-
Spark
转换算子、行动算子、持久化算子、代码流程
1.Transformations转换算子1.1概念:Transformations类算子是一类算子(函数)叫做转换算子,如map,flatMap,reduceByKey等。Transformations算子是延迟执行,也叫懒加载执行。1.2Transformation类算子:filter过滤符合条件的记录数,true保留,false过滤掉。map将一个RDD中的每个数据项,通过map中的函数映射
plenilune-望月
·
2023-11-23 11:59
Spark分布式计算框架
Hive-on-
Spark
调优
集群规划Yarn配置yarn.nodemanager.resource.memory-mb该参数的含义是,一个NodeManager节点分配给Container使用的内存。该参数的配置,取决于NodeManager所在节点的总内存容量和该节点运行的其他服务的数量。考虑上述因素,此处可将该参数设置为64G,如下:yarn.nodemanager.resource.memory-mb65536yarn
工作变成艺术
·
2023-11-23 11:57
Hive
hive
spark
大数据
Spark
---集群搭建
Standalone集群搭建与
Spark
onYarn配置1、StandaloneStandalone集群是
Spark
自带的资源调度框架,支持分布式搭建,这里建议搭建Standalone节点数为3台,1台
30岁老阿姨
·
2023-11-23 11:24
Spark
spark
大数据
分布式
Spark
---转换算子、行动算子、持久化算子
一、转换算子和行动算子1、Transformations转换算子1)、概念Transformations类算子是一类算子(函数)叫做转换算子,如map、flatMap、reduceByKey等。Transformations算子是延迟执行,也叫懒加载执行。2)、Transformation类算子filter:过滤符合条件的记录数,true保留,false过滤掉map:将一个RDD中的每个数据项,通
30岁老阿姨
·
2023-11-23 11:54
Spark
spark
大数据
人工智能
大数据学习(23)-hive on mapreduce对比hive on
spark
&&大数据学习&&系列专栏:哲学语录:承认自己的无知,乃是开启智慧的大门如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦Hiveon
Spark
和HiveonMapReduce是两种不同的
viperrrrrrr
·
2023-11-23 11:23
hive
spark
大数据
spark
Sql遇见数组越界错误:java.lang.ArrayIndexOutOfBoundsException: 3
这里写自定义目录标题
spark
Sql遇见数组越界错误:java.lang.ArrayIndexOutOfBoundsException:3
spark
Sql遇见数组越界错误:java.lang.ArrayIndexOutOfBoundsException
找工作的大数据开发
·
2023-11-23 11:14
spark
doris通关之分区分桶
调优
doris通关之分区分桶
调优
1.名词解释2.数据分布2.1.分区列如何选择2.2.分桶列如何选择2.3.分桶数如何确定3.最佳实践4.分区、分桶常用命令分区分桶是将数据划分为子集,按一定规则,均衡地分布在不同节点上
左林右李02
·
2023-11-23 10:19
数据仓库
大数据
上一页
65
66
67
68
69
70
71
72
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他