E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark调优
Spark
的这些事(三)——
spark
常用的Transformations 和Actions
Transformationsmap,filter
spark
最长用的两个Transformations:map,filter,下面就来介绍一下这两个。
数据社
·
2023-12-21 07:12
Py
Spark
中DataFrame的join操作
异常检测机器学习算法—时间序列数据可视化数据可视化—折线图数据可视化—箱线图数据可视化—柱状图数据可视化—饼图、环形图、雷达图统计学检验箱线图筛选异常值3Sigma原则筛选离群值Python统计学检验大数据Py
Spark
数据科学知识库
·
2023-12-21 07:26
Python
Pyspark
大数据
python
PySpark
DataFrame
join
大数据
big
data
联接
“大数据分析挖掘-基于Hadoop/Mahout/Mllib的大数据挖掘(含
Spark
、Storm和Docker应用介绍)”培训
随着互联网、移动互联网和物联网的发展,我们已经切实地迎来了一个大数据的时代。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合,对大数据的分析已经成为一个非常重要且紧迫的需求。目前对大数据的分析工具,首选的是Hadoop/Yarn平台。Hadoop/Yarn在可伸缩性、健壮性、计算性能和成本上具有无可替代的优势,事实上已成为当前互联网企业主流的大数据分析平台。为解决广大
shenmanli
·
2023-12-21 06:58
培训课程
公开课
企业培训
大数据
hadoop
spark
吴恩达深度学习笔记(28)-网络训练验证测试数据集的组成介绍
之前可能大家已经了解了神经网络的组成的几个部分,那么我们将继续学习如何有效运作神经网络,内容涉及超参数
调优
,如何构建数据,以及如何确保优化算法快速运行,从而使学习算法在合理时间内完成自我学习。
极客Array
·
2023-12-21 06:18
2023_
Spark
_实验三十二:消费Kafka数据并保存到MySQL中
实验目的:掌握Scala开发工具消费Kafka数据,并将结果保存到关系型数据库中实验方法:消费Kafka数据保存到MySQL中实验步骤:一、创建Job_ClickData_Process代码如下:packageexamsimportorg.apache.kafka.clients.consumer.ConsumerRecordimportorg.apache.kafka.common.TopicP
pblh123
·
2023-12-21 06:46
Spark实验
Scala
Linux
spark
kafka
mysql
Spark
SQL 日期时间转换指南
Spark
SQL日期时间转换指南在
Spark
SQL中,日期时间的处理是非常重要的。本文将介绍如何在
Spark
SQL中进行日期时间转换操作,并提供相应的源代码示例。
海上的风浪
·
2023-12-21 06:41
spark
sql
大数据
编程
计算机毕业设计吊打导师hadoop+
spark
+hive知识图谱股票推荐系统 股票数据分析可视化大屏 股票基金爬虫 股票基金大数据 机器学习 大数据毕业设计
开发技术:
spark
hadoophive装杯显摆虚拟机Linux敲命令炫酷吊打flaskechartssqoopscalahdfsyarnmysqlselenium爬虫框架等;1.png2.png5.png6
计算机毕业设计大神
·
2023-12-21 05:47
JVM性能
调优
准备之Visual GC插件
文章目录jvisualvm安装VisualGC插件VisualGC插件功能介绍区域划分spaces区域Graphs区域Histogram区域oracle官方文章介绍jvisualvm安装VisualGC插件以管理员身份打开cmd命令行窗口查看JDK版本(VisualGC插件需要对应JDK的版本)在cmd窗口输入jvisualvm命令打开JavaVisualVM工具(JDK自带)点击jvisualv
月球程序猿
·
2023-12-21 04:26
性能调优
JVM
jvm
java
JVM性能
调优
辅助手册之JVM指令
文章目录栈和局部变量操作将常量压入栈的指令从栈中的局部变量中装载值的指令将栈中的值存入局部变量的指令wide指令通用(无类型)栈操作类型转换整数运算逻辑运算移位操作按位布尔运算浮点运算对象和数组对象操作指令数组操作指令控制流条件分支指令比较指令无条件转移指令表跳转指令异常方法调用与返回方法调用指令方法返回指令线程同步JVM指令助记符栈和局部变量操作将常量压入栈的指令aconst_null将null
月球程序猿
·
2023-12-21 04:25
性能调优
JVM
jvm
Apache Kyuubi 讲解与实战操作
文章目录一、概述二、
Spark
Kyuubi架构三、Hadoop基础环境安装1)hadoop下载部署包2)创建网络3)部署MySQL4)部署HadoopHive四、
Spark
Kyuubi安装1)下载Kyuubi2
大数据老司机
·
2023-12-21 02:02
Kyuubi
大数据
Spark
Kyuubi
大数据
大数据之
Spark
(4)-
Spark
Core(下)
(1)创建一个RDD[Int]scala>valrdd1=sc.makeRDD(1to10,2)rdd1:org.apache.
spark
.rdd.RDD[Int]=ParallelCollectionR
jackyan163
·
2023-12-21 02:23
spark
-submit
进入$
SPARK
_HOME目录,输入bin/
spark
-submit--help可以得到该命令的使用帮助。
EricLee_1900
·
2023-12-21 01:04
【
spark
】
spark
内核调度(重点理解)
目录
spark
内核调度DAGDAG的宽窄依赖和阶段划分内存迭代计算面试题
Spark
是怎样做内存计算的?DAG的作用是什么?Stage阶段划分的作用?
小赵要加油
·
2023-12-21 01:56
spark
spark
ajax
服务器
Iceberg (一、presto和trino实践——行级更新)
为什么先讲述presto和trino引擎操作,主要是这两个组件没有找到详细介绍的文档,另外关于
spark
/flink会有更多的文章
yyoc97
·
2023-12-20 23:18
大数据
iceberg
presto
大数据
iceberg
presto
实践
数据湖
spark
课程大纲
Spark
环境搭建Centos
Spark
单机版伪分布式模式
Spark
单机版intelij开发(maven)
Spark
完全分布式集群搭建
Spark
historyserver配置使用二种方法实现
Spark
计算
数据萌新
·
2023-12-20 22:26
Python高级算法——支持向量机(Support Vector Machine,SVM)
本文将深入讲解Python中的支持向量机,包括算法原理、核函数、超参数
调优
、软间隔与硬间隔、优缺点,以及使用代码示例演示SVM在实际问题中的应用。算法原理1.SVM的基本原理支持向量机的基本原理是找
Echo_Wish
·
2023-12-20 22:09
Python
笔记
数据结构与算法
Python算法
支持向量机
算法
python
49
spark
宽窄依赖和任务调度
join算子作用在K,V格式的RDD上。根据K进行连接,对(K,V)join(K,W)返回(K,(V,W))join后的分区数与父RDD分区数多的那一个相同。leftOuterJoin,rightOuterJoin,fullOuterJoinunion合并两个数据集。两个数据集的类型要一致。返回新的RDD的分区数是合并RDD分区数的总和。intersection取两个数据集的交集,返回新的RD
文茶君
·
2023-12-20 19:34
spark
sql介绍
1.1
Spark
SQL介绍
Spark
SQL,顾名思义,就是
Spark
生态体系中的构建在
Spark
Core基础之上的一个基于SQL的计算模块。
Guff_hys
·
2023-12-20 16:25
spark
sql
大数据
系统架构
mapreduce
eclipse
程序人生
spark
_rdd算子介绍
1.9算子介绍1.9.1RDD概念RDD(ResilientDistributedDataset)叫做弹性分布式数据集,是
Spark
中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合
Guff_hys
·
2023-12-20 16:24
分布式
spark
ajax
程序人生
服务器
scala
开发语言
Spark
SQL的编程模型(DataFrame和DataSet)
1.2
Spark
SQL的编程模型(DataFrame和DataSet)1.2.1编程模型简介主要通过两种方式操作
Spark
SQL,一种就是SQL,另一种为DataFrame和Dataset。
Guff_hys
·
2023-12-20 16:53
mapreduce
eclipse
大数据
scala
spark
sql
程序人生
Linux内核参数
调优
一、Linux内核配置文件Linux在系统运行时修改内核参数(/proc/sys与/etc/sysctl.conf),而不需要重新引导系统,这个功能是通过/proc虚拟文件系统实现的。在/proc/sys目录下存放着大多数的内核参数,并且设计成可以在系统运行的同时进行更改,可以通过更改/proc/sys中内核参数对应的文件达到修改内核参数的目的(修改过后,保存配置文件就马上自动生效),不过重新启动
wespten
·
2023-12-20 15:02
Linux
SRE
运维部署与监控
系统性能指标
故障排除
linux
服务器
运维
Idea2019.3+Hadoop-3.0.0+
Spark
3.0.0+Scala2.12安装部署
首先在安装环境前,最好确认各个版本之间的兼容性,避免出现不必要的错误而耽误时间!!!!!!系统环境安装1.JDK8+安装a.设置JAVA_HOME变量b.设置Path变量,添加;%JAVA_HOME%\bin;%JAVA_HOME%\jre\binc.设置Classpath添加:.;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar2.Scala安装下
忘了盖被
·
2023-12-20 15:50
高级
调优
:查找并修复 Elasticsearch 慢查询
原文链接https://www.elastic.co/cn/blog/advanced-tuning-finding-and-fixing-slow-elasticsearch-queriesElasticsearch是一个非常灵活且功能丰富的应用程序,它提供了许多不同的数据查询方法。但是,您是否遇到过查询速度低于预期的情况?对于像Elasticsearch这样的分布式系统,可能会有各种影响查询性
水的精神
·
2023-12-20 14:17
Elasticsearch
ES搜索优化
运维
elasticsearch
es
慢查询调优
Go函数指针是如何让你的程序变慢的?
本文作者根据自己对Go代码的使用与
调优
经验,分享了Go的函数值对性能影响的原因以及优化方案,值得深度阅读!
腾讯云开发者
·
2023-12-20 14:56
golang
算法
开发语言
后端
【jvm从入门到实战】(十) 实战篇-内存
调优
内存溢出和内存泄漏:在Java中如果不再使用一个对象,但是该对象依然在GCROOT的引用链上,这个对象就不会被垃圾回收器回收,这种情况就称之为内存泄漏。内存泄漏绝大多数情况都是由堆内存泄漏引起的。少量的内存泄漏可以容忍,但是如果发生持续的内存泄漏,就像滚雪球雪球越滚越大,不管有多大的内存迟早会被消耗完,最终导致的结果就是内存溢出。但是产生内存溢出并不是只有内存泄漏这一种原因内存泄漏的常见场景:内存
小星星*
·
2023-12-20 13:53
Java
jvm
2018-11-12Py
spark
win环境配置参考
Anaconda中配置Py
spark
的
Spark
开发环境
Spark
搭建机器学习系统
Spark
机器学习win+本地Py
spark
QQsoso
·
2023-12-20 10:49
Execution Error, return code 3 from org.apache.hadoop.hive.ql.exec.
spark
.
Spark
Task.
Spark
job faile
hiveon
spark
错误Errorwhileprocessingstatement:FAILED:ExecutionError,returncode3fromorg.apache.hadoop.hive.ql.exec.
spark
.
Spark
Task.
Spark
jobfailedduringruntime.Pleasecheckstacktracefortherootcause
墨卿风竹
·
2023-12-20 09:48
hadoop
apache
hive
hive
on
spark
生产环境_
Spark
解析JSON字符串并插入到MySQL数据库
业务背景:最近开发有一个需求,是这样的我需要将一段从前端传过来的JSON字符串进行解析,并从中提取出所需的数据,然后将这些数据插入到MySQL数据库中。json格式样例如下{\"区域编号\":\"001\",\"区域名称\":\"测试区域\",\"速度\":\"50\",\"速度分数\":\"80\",\"gj\":\"中国\",\"区域顶点集\":\"[{'x':1,'y':2},{'x':3,
Matrix70
·
2023-12-20 08:29
Spark
数据分析与处理
SQL
数据库
spark
json
mysql
2023_
Spark
_实验三十:测试Flume到Kafka
实验目的:测试Flume采集数据发送到Kafka实验方法:通过centos7集群测试,将flume采集的数据放到kafka中实验步骤:一、kafka可视化工具介绍KafkaTool是一个用于管理和使用ApacheKafka集群的GUI应用程序。KafkaTool提供了一个较为直观的UI可让用户快速查看Kafka集群中的对象以及存储在topic中的消息,提供了一些专门面向开发人员和管理员的功能,主要
pblh123
·
2023-12-20 08:23
Spark实验
flume
Linux
spark
flume
kafka
Spark
- SQL查询文件数据
那么我们可以利用
spark
-sql直接操作文件的特性处理这类的需求,姐姐再也不用担心我不会
spark
了,因为我就只会sql。使用方法csv
spark
.sql("select*fromcsv.
kikiki5
·
2023-12-20 08:02
Spark
单节点配置
1.
Spark
configuration1.1ConfigureEnvironment1.1.1Edit.bashrcvi~/.bashrc#JAVAENVexportJAVA_HOME=~/JavaexportJRE_HOME
CleanClear_0c7a
·
2023-12-20 07:47
AI创作系统ChatGPT网站源码,支持Midjourney绘画,GPT语音对话+智能AI思维导图生成
一、前言
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-12-20 07:06
人工智能
ChatGPT
软件源码
人工智能
chatgpt
语音识别
AI作画
AIGC
midjourney
AI创作系统ChatGPT网站源码,支持AI绘画,GPT语音对话+智能思维导图生成+智能AI思维导图生成
一、前言
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-12-20 07:05
人工智能
ChatGPT
软件源码
人工智能
chatgpt
语音识别
AI作画
midjourney
AI创作系统ChatGPT网站源码,支持AI绘画,支持GPT语音对话+DALL-E3文生图+智能思维导图生成
一、前言
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-12-20 07:01
人工智能
ChatGPT
软件源码
人工智能
chatgpt
语音识别
AI作画
AIGC
hive企业级
调优
策略之数据倾斜
测试所用到的数据参考:原文链接:https://blog.csdn.net/m0_52606060/article/details/135080511本教程的计算环境为HiveonMR。计算资源的调整主要包括Yarn和MR。数据倾斜概述数据倾斜问题,通常是指参与计算的数据分布不均,即某个key或者某些key的数据量远超其他key,导致在shuffle阶段,大量相同key的数据被发往同一个Reduc
Appreciate(欣赏)
·
2023-12-20 06:05
hive
hive
hadoop
数据仓库
hive企业级
调优
策略之小文件合并
测试所用到的数据参考:原文链接:https://blog.csdn.net/m0_52606060/article/details/135080511本教程的计算环境为HiveonMR。计算资源的调整主要包括Yarn和MR。优化说明小文件合并优化,分为两个方面,分别是Map端输入的小文件合并,和Reduce端输出的小文件合并。Map端输入文件合并合并Map端输入的小文件,是指将多个小文件划分到一个
Appreciate(欣赏)
·
2023-12-20 06:05
hive
hive
hadoop
数据仓库
hive企业级
调优
策略之分组聚合优化
测试用表准备hive企业级
调优
策略测试数据(阿里网盘下载链接):https://www.alipan.com/s/xsqK6971Mrs订单表(2000w条数据)表结构建表语句droptableifexistsorder_detail
Appreciate(欣赏)
·
2023-12-20 06:35
hive
hive
hadoop
数据仓库
hive企业级
调优
策略之Join优化
测试所用到的数据参考:原文链接:https://blog.csdn.net/m0_52606060/article/details/135080511本教程的计算环境为HiveonMR。计算资源的调整主要包括Yarn和MR。Join算法概述Hive拥有多种join算法,包括CommonJoin,MapJoin,BucketMapJoin,SortMergeBucktMapJoin等,下面对每种jo
Appreciate(欣赏)
·
2023-12-20 06:00
hive
hive
hadoop
数据仓库
《Py
Spark
大数据分析实战》-15.云服务模式Databricks介绍创建集群
对大数据技术栈Hadoop、Hive、
Spark
、Kafka等有深入研究,对Data
wux_labs
·
2023-12-20 06:47
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
小节测验
在py
spark
中读取Linux系统本地文件/data/bigfiles/data.txt,该数据集包含了某大学计算机系的成绩,数据格式如下所示:Tom,DataBase,80Tom,Algorithm
Ssaty.
·
2023-12-20 05:07
Educoder实训
java
数据库
前端
性能测试流程
流程性能测试需求分析性能测试计划性能测试用例测试脚本编写测试场景设计测试场景运行场景运行监控运行结果分析系统性能
调优
性能测试报告总结1性能测试需求分析需求分析就是把真正需求搞清楚例如:1).公司需要对所有的功能都进行性能测试
仲夏那片海
·
2023-12-20 05:01
测试文档
压力测试
【
Spark
精讲】
Spark
五种JOIN策略
目录三种通用JOIN策略原理HashJoin散列连接原理详解SortMergeJoin排序合并连接NestedLoop嵌套循环连接影响JOIN操作的因素数据集的大小JOIN的条件JOIN的类型
Spark
话数Science
·
2023-12-20 05:42
Spark精讲
Spark
大数据
spark
大数据
数据可视化---离群值展示
异常检测机器学习算法—时间序列数据可视化数据可视化—折线图数据可视化—箱线图数据可视化—柱状图数据可视化—饼图、环形图、雷达图统计学检验箱线图筛选异常值3Sigma原则筛选离群值Python统计学检验大数据Py
Spark
数据科学知识库
·
2023-12-20 02:29
Python
数据可视化
数据可视化
matplotlib
seaborn
折线图
散点图
异常值
离群值
Linux中命令添加-r的作用
异常检测机器学习算法—时间序列数据可视化数据可视化—折线图数据可视化—箱线图数据可视化—柱状图数据可视化—饼图、环形图、雷达图统计学检验箱线图筛选异常值3Sigma原则筛选离群值Python统计学检验大数据Py
Spark
数据科学知识库
·
2023-12-20 02:28
Linux环境
linux
r语言
信息可视化
AI创作系统ChatGPT网站源码,支持AI绘画,支持GPT语音对话+智能思维导图生成
一、前言
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-12-19 15:26
人工智能
ChatGPT
软件源码
人工智能
chatgpt
AI作画
性能测试需要关注的指标
性能测试就是为了验证系统的性能是否达到用户的要求,并通过大量的持续性的并发找到系统性能的极限,从而对系统性能进行
调优
。
测试小张z
·
2023-12-19 15:04
性能测试
性能优化
从零开始学
Spark
系列(1)——
Spark
概览
目录1.
Spark
简介2.
Spark
的相关术语2.1master和worker节点2.2Application2.3driver和executor进程2.4ClusterManager2.5Task2.6Job2.7Stage2.8DAGScheduler2.9TASKScheduler3
xiaoziHZP
·
2023-12-19 14:55
Spark
spark
大数据
服务器raid1做系统,服务器raid1系统安装
需要准备OpenStack
调优
weixin_39766867
·
2023-12-19 13:49
服务器raid1做系统
Wireshark在网络性能
调优
中的应用
第一章:Wireshark基础及捕获技巧1.1Wireshark基础知识回顾1.2高级捕获技巧:过滤器和捕获选项1.3Wireshark与其他抓包工具的比较第二章:网络协议分析2.1网络协议分析:TCP、UDP、ICMP等2.2高级协议分析:HTTP、DNS、SSH等2.3高级协议分析:VoIP、视频流嗅探等第三章:Wireshark插件开发3.1使用Lua编写自定义插件3.2使用Python编写
Kali与编程~
·
2023-12-19 12:08
网络
wireshark
测试工具
消息队列kafka详解:Kafka原理分析总结
目前越来越多的开源分布式处理系统如Cloudera、ApacheStorm、
Spark
等都支持与Kafka集成。
码农小旋风
·
2023-12-19 11:43
后端
上一页
46
47
48
49
50
51
52
53
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他