E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark调优
Spark
SQL
目录一、
Spark
SQL简介(一)从Shark说起(二)
Spark
SQL架构(三)为什么推出
Spark
SQL二、DataFrame概述三、DataFrame的创建四、DataFrame的保存五、DataFrame
Francek Chen
·
2023-12-24 16:03
Spark编程基础
spark
大数据
分布式
Spark
编程实验三:
Spark
SQL编程
目录一、目的与要求二、实验内容三、实验步骤1、
Spark
SQL基本操作2、编程实现将RDD转换为DataFrame3、编程实现利用DataFrame读写MySQL的数据四、结果分析与实验体会一、目的与要求
Francek Chen
·
2023-12-24 16:02
Spark编程基础
spark
sql
大数据
Spark
SQL
大数据开发都要学习什么?什么是大数据平台?
大数据平台知识:是大数据开发的基础,在学习期间,往往以搭建Hadoop、
Spark
平台为主,一方面Hadoop对机器的硬件要求不高,另一方面Hadoo
金光闪闪耶
·
2023-12-24 14:49
linux
调优
之swap设置
通过free-h查询到内存还剩余很多,却使用swap分区;原因分析:1.swap设置开启的阀值过大,造成内存达到可使用swap的值2.docker设置了内存限制,但没限制swap的值(待求证)根虚拟机machine.slice和系统system.slices、user.slices等使用了swap空间。1.swap设置大小安装系统时,选择swap分区;swap不是越大越好,越大的时候说明内存不够用
IT杂人
·
2023-12-24 13:37
服务器
linux
调优优化
docker
linux
【
调优
】Linux优化Swap设置
【
调优
】Linux优化Swap设置1通过free-h查询到free-h内存还剩余很多,却使用swap分区;原因分析:1.swap设置开启的阀值过大,造成内存达到可使用swap的值2.docker设置了内存限制
我是Superman丶
·
2023-12-24 13:36
运维服务
linux
运维
服务器
这是测试的
异常检测机器学习算法—时间序列数据可视化数据可视化—折线图数据可视化—箱线图数据可视化—柱状图数据可视化—饼图、环形图、雷达图统计学检验箱线图筛选异常值3Sigma原则筛选离群值Python统计学检验大数据Py
Spark
数据科学知识库
·
2023-12-24 13:56
机器学习
大数据
统计学
工程应用
mac系统
spark
环境搭建
所需工具1.jdk2.scala下载地址:scala官网下载scala版本下载需注意,后期idea编译可能导致报错,scala版本和
spark
版本存在一些兼容性问题
spark
开发语言支持scala、java
Maximilian_M
·
2023-12-24 13:19
Spark学习之路
spark
idea
scala
mac
环境搭建
控制map个数与性能
调优
参数
本文转自:涤生手记本系列几章系统地介绍了开发中Hive常见的用户配置属性(有时称为参数,变量或选项),并说明了哪些版本引入了哪些属性,常见有哪些属性的使用,哪些属性可以进行Hive
调优
,以及如何使用的问题
xuanxing123
·
2023-12-24 13:13
案例系列:泰坦尼克号_预测幸存者_TensorFlow决策森林
文章目录1.导入依赖库2.加载数据集3.准备数据集4.将Pandas数据集转换为TensorFlow数据集5.使用默认参数训练模型6.使用改进的默认参数训练模型7.进行预测8.使用超参数
调优
训练模型9.
愤斗的橘子
·
2023-12-24 11:37
tensorflow
人工智能
python
基于SpringBoot和
spark
的共享单车存储管理系统
文章目录项目介绍主要功能截图:部分代码展示设计总结项目获取方式作者主页:超级无敌暴龙战士塔塔开简介:Java领域优质创作者、简历模板、学习资料、面试题库【关注我,都给你】文末获取源码联系项目介绍基于SpringBoot和
spark
超级无敌暴龙战士塔塔开
·
2023-12-24 10:33
Java课设与毕设资源
spring
boot
spark
后端
《Py
Spark
大数据分析实战》-04.了解
Spark
对大数据技术栈Hadoop、Hive、
Spark
、Kafka等有深入研究,对Data
wux_labs
·
2023-12-24 10:32
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
《Py
Spark
大数据分析实战》-06.安装环境准备
对大数据技术栈Hadoop、Hive、
Spark
、Kafka等有深入研究,对Data
wux_labs
·
2023-12-24 10:32
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
《Py
Spark
大数据分析实战》-17.云服务模式Databricks介绍运行作业
对大数据技术栈Hadoop、Hive、
Spark
、Kafka等有深入研究,对Data
wux_labs
·
2023-12-24 10:32
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
《Py
Spark
大数据分析实战》-02.了解Hadoop
对大数据技术栈Hadoop、Hive、
Spark
、Kafka等有深入研究,对Data
wux_labs
·
2023-12-24 10:02
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
《Py
Spark
大数据分析实战》-01.关于数据
对大数据技术栈Hadoop、Hive、
Spark
、Kafka等有深入研究,对Data
wux_labs
·
2023-12-24 10:01
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
《Py
Spark
大数据分析实战》-18.什么是数据分析
对大数据技术栈Hadoop、Hive、
Spark
、Kafka等有深入研究,对Data
wux_labs
·
2023-12-24 10:01
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
Spark
资源调度与任务调度
Spark
资源任务调度一.资源调度1.集群起来后,Worker向Master汇报资源2.客户端提交application,启动Driver,创建DAGschedulerDAG调度器和TaskScheduler
乔一波一
·
2023-12-24 09:27
内容导航目录
异常检测机器学习算法—时间序列数据可视化数据可视化—折线图数据可视化—箱线图数据可视化—柱状图数据可视化—饼图、环形图、雷达图统计学检验箱线图筛选异常值3Sigma原则筛选离群值Python统计学检验大数据Py
Spark
数据科学知识库
·
2023-12-24 08:37
python
fastapi
hive
Linux---基础操作命令
异常检测机器学习算法—时间序列数据可视化数据可视化—折线图数据可视化—箱线图数据可视化—柱状图数据可视化—饼图、环形图、雷达图统计学检验箱线图筛选异常值3Sigma原则筛选离群值Python统计学检验大数据Py
Spark
数据科学知识库
·
2023-12-24 08:35
Linux环境
linux
操作命令
Linux
操作系统
利用Py
Spark
进行商业洞察与可视化
利用Py
Spark
进行商业洞察与可视化引言数据集与技术栈数据集:YELP数据集技术栈:Flask、MySQL、Echarts、Py
Spark
分析维度与功能创新点与应用引言近年来,数据分析和可视化技术在商业决策中的应用越来越广泛
爱欲无极
·
2023-12-24 08:58
数据分析与挖掘
Flask
python
spark
YELP
hive企业级
调优
策略之CBO,谓词下推等优化
测试所用到的数据参考:原文链接:https://blog.csdn.net/m0_52606060/article/details/135080511本教程的计算环境为HiveonMR。计算资源的调整主要包括Yarn和MR。CBO优化优化说明CBO是指CostbasedOptimizer,即基于计算成本的优化。在Hive中,计算成本模型考虑到了:数据的行数、CPU、本地IO、HDFSIO、网络IO
Appreciate(欣赏)
·
2023-12-24 07:26
hive
hive
hadoop
数据仓库
Spark
一、
Spark
框架概述1.1
spark
是什么Apache
Spark
是用于大规模数据(large-scaladata)处理的统一(unified)分析引擎。
weixin_50458070
·
2023-12-24 05:36
大数据
spark
windows
大数据
数据质量监控框架及解决方案总结
概述随着业务发展和数据量的增加,大数据应用开发已成为部门应用开发常用的开发方式,由于部门业务特点的关系,
spark
和hive应用开发在部门内部较为常见。
坨坨的大数据
·
2023-12-24 05:41
Java 与 Scala 使用Maven混合编译打包
在SpringBoot上使用
spark
的时候会遇到的混合编译问题,在java代码中打包会找不到scala定义的包,即可参考使用如下配置。
kikiki5
·
2023-12-24 04:27
7000字超详细讲解Hadoop、
Spark
、Storm、YARN,建议收藏!
一、Hadoop1.1.概念就是一个大数据解决方案。它提供了一套分布式系统基础架构。核心内容包含hdfs和mapreduce。hadoop2.0以后引入yarn.hdfs是提供数据存储的,mapreduce是方便数据计算的。hdfs又对应namenode和datanode.namenode负责保存元数据的基本信息,datanode直接存放数据本身;mapreduce对应jobtracker和tas
套马杆的程序员
·
2023-12-24 04:49
Spark
RDD 之持久化
1.Background当我们需要多次使用同一个RDD时,如果简单的调用Action操作,
Spark
每次都会重算RDD以及它所有的依赖,此时需要用到持久化技术。
xiaoc024
·
2023-12-24 03:50
技本功|Hive优化之监控(三)
Hive是大数据领域常用的组件之一,主要是大数据离线数仓的运算,关于Hive的性能
调优
在日常工作和面试中是经常涉及的一个点,因此掌握一些Hive
调优
是必不可少的技能。
云掣YUNCHE
·
2023-12-24 03:15
技术文档
数据库
运维
hive
大数据
mysql
技本功|Hive优化之
Spark
执行引擎参数
调优
(二)
Hive是大数据领域常用的组件之一,主要是大数据离线数仓的运算,关于Hive的性能
调优
在日常工作和面试中是经常涉及的的一个点,因此掌握一些Hive
调优
是必不可少的一项技能。
云掣YUNCHE
·
2023-12-24 03:44
技术文档
spark
hive
软件测试报告-专业第三方检测机构-CNAS专业资质
用于各类软件和硬件系统相结合的综合性集成项目的第三方验收测试,如政府、事业单位、企业、学校等项目验收)4、系统测试报告(用于软件和系统集成项目,开发方发起并组织的项目验收)5、性能测试报告(适用于项目性能验证、性能
调优
新支点小星
·
2023-12-24 03:13
单元测试
压力测试
集成测试
安全性测试
可用性测试
性能优化
网络安全
Flink1.17版本安装部署
这里可以添加本文要记录的大概内容:随着实时计算需求场景的增加,对计算引擎的实时计算要求也越来越高,而在实时计算方面表现优秀的当属flink,计算引擎从第一代mapreduce到第二代的Tez,再到第三代计算引擎
spark
以茉萱
·
2023-12-24 02:18
大数据
flink
Spark
Streaming流计算框架的运行流程源码分析
1.
spark
streaming程序代码实例代码如下:objectOnlineTheTop3ItemForEachCategory2DB{defmain(args:Array[String]){valconf
尼小摩
·
2023-12-24 01:47
Mysql
调优
之Explain
extendexplainextended+showwarnings例子:mysql>explainextendedselect*fromuser_scoreusinnerjoinuser_infouionus.uid=ui.uidwhereus.id=5;+----+-------------+-------+-------+-------------------+---------+-----
10968ce0f35d
·
2023-12-23 22:06
Py
spark
的Intellij idea环境搭建
为什么需要IDE在本地搭建一个
spark
环境可以方便
spark
代码的调试,可以和一般程序一样打断点,看变量,否则可能就只能打很多日志来debug了选哪个IDEPy
spark
的IDE我用Intellijidea
祗談風月
·
2023-12-23 22:38
spark
核心概念
Application:基于
Spark
的应用程序=1driver+executorsUserprogrambuilton
Spark
.
shone_shawn
·
2023-12-23 21:45
记录一次生产jvm
调优
jvm参数配置几个必须知道的参数含义说下我们生产配置,服务四个节点,单节点分配16g内存-Xms16g初始化堆大小-Xmx16g最大堆内存-Xmn6gm年轻代内存大小-Xss256k每个线程的初始化内存-XX:MetaspaceSize=256m元空间触发gc的大小-XX:+HeapDumpOnOutOfMemoryError配置堆栈内存溢出错误日志-XX:HeapDumpPath=/opt/lo
Charon笔记
·
2023-12-23 20:32
在Linux系统中安装MySQL数据库
解决密钥异常问题4、安装MySQL服务器5、开启MySQL服务6、查看MySQL服务器中root用户的初始密码7、使用初始密码登录MySQL服务器8、修改root用户登录MySQL服务器的密码三、配置
Spark
Francek Chen
·
2023-12-23 19:14
Spark编程基础
数据库
linux
mysql
AI创作系统ChatGPT系统源码,支持Midjourney绘画,GPT语音对话+DALL-E3文生图
一、前言
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-12-23 18:02
人工智能
AIGC
ChatGPT
人工智能
chatgpt
语音识别
midjourney
AI作画
2018年9月14日
上午先是解决了贝叶斯优化报错的问题(昨天的自己简直傻逼),然后随便试了一下用随机森林做联通数据集并进行超参
调优
,结果比较微妙(。)可能是自己超参范围没设好。
真昼之月
·
2023-12-23 17:28
android studio3.1.2 gradle升级的坑以及android studio卡顿
调优
姿势技巧大全
最新版开发工具Windows版本卡成狗,之前编辑gradle卡死现在不卡了,但是卡xml和卡java编写代码,之后弹出了修改VM配置导致问题更加严重,看来不是所有配置都应该改大的。12:17Unabletosavepluginsettings:Thepluginorg.jetbrains.androidfailedtosavesettingsandhasbeendisabled.Pleaseres
吉凶以情迁
·
2023-12-23 17:25
android
android
studio
java
gradle
mac
Spark
Streaming和Kafka
0.一些问题
Spark
Streaming如何消费KafkaKafka的offset如何维护如何获取Kafka的offsetKafka获取offset的时候会不会消费kafka的记录Kafka的分区和
spark
task
天之見證
·
2023-12-23 16:25
python 断点重传_性能
调优
-python SDK
调优
-阿里云开发者社区
pythonSDKpython和java或者和GO,在性能上来说都不是最好的,而且python无法支持多核的并发,只能跑在单核上的多线程。但是oss也提供了相应的方法提高多线程的文件吞吐;初始化在初始化时python有两个地方可以做调整connect_timeout可以增大客户端在数据读写过程中的超时时间,常用在客户端到OSS公网情况下上传大文件时增长时间,防止在公网抖动或者丢包情况下出现传输超时
农村猿
·
2023-12-23 16:31
python
断点重传
Spark
Core
Spark
Core介绍
Spark
Core是
Spark
的核心计算引擎。它有着速度快和通用的特点,并且实现了
Spark
的基本功能,包含任务调度,内存管理,错误恢复,与存储交互等模块。
hipeer
·
2023-12-23 15:35
MINIO在java中的使用
对象存储可以充当主存储层,以处理
Spark
、Presto、TensorFlow、H2O.ai等各种复杂工作负载以及成为HadoopHDFS的替代品--------引自官网的话。
IT小学僧
·
2023-12-23 14:48
MinIo
Java
java
spring
boot
Hago 的
Spark
on ACK 实践
作者:华相Hago于2018年4月上线,是欢聚集团旗下的一款多人互动社交明星产品。Hago融合优质的匹配能力和多样化的垂类场景,提供互动游戏、多人语音、视频直播、3D虚拟形象互动等多种社交玩法,致力于为用户打造高效、多样、最具沉浸式的社交娱乐体验,在东南亚、中东和南美等地区拥有广泛的用户群。在技术层面,Hago提供优秀的自研音视频技术,实现更加稳定、高效和优质的数字人服务。包括3D超写实模型、真人
阿里云云原生
·
2023-12-23 13:59
spark
大数据
分布式
解锁Redis Stream新境界:高级用法大揭秘【二】
代码的世界里,每一行都是一个故事解锁RedisStream新境界:高级用法大揭秘前言Stream基础回顾ConsumerGroups消息过滤技巧延迟队列的实现持久化与备份分区与多节点支持流的优化和性能
调优
结语前言在
一只牛博
·
2023-12-23 12:02
#
redis
redis
数据库
缓存
Spark
Shell的简单使用
简介
Spark
shell是一个特别适合快速开发
Spark
原型程序的工具,可以帮助我们熟悉Scala语言。即使你对Scala不熟悉,仍然可以使用这个工具。
necessary653
·
2023-12-23 11:12
spark
大数据
分布式
Spark
Machine Learning进行数据挖掘的简单应用(兴趣预测问题)
数据挖掘的过程数据挖掘任务主要分为以下六个步骤:1.数据预处理2.特征转换3.特征选择4.训练模型5.模型预测6.评估预测结果数据准备这里准备了20条关于不同地区、不同性别、不同身高、体重…的人的兴趣数据集(命名为hobby.csv):id,hobby,sex,address,age,height,weight1,football,male,dalian,12,168,552,pingpang,f
冲鸭嘟嘟可
·
2023-12-23 10:28
spark
机器学习
数据挖掘
4. Mysql索引优化实战一
MySQL性能
调优
1.示例表`举一个大家不容易理解的综合例子`2.Mysql如何选择合适的索引3.常见sql深入优化3.1Orderby与Groupby优化`3.2优化总结:`3.3Usingfilesort
俺就是菜得很
·
2023-12-23 10:09
性能调优MySQL
mysql
数据库
java
Cassandra 配置详解
文章目录HintsBatchlog请求调度属性ThriftKey缓存与全局属性计数器缓存性能
调优
CommitLogCompactionMemtable缓存与索引磁盘设置网络超时设置节点间的设置本地传输(
开发实习生
·
2023-12-23 09:17
大数据运维监控
大数据技术栈
cassandra
多臂老虎机算法步骤
异常检测机器学习算法—时间序列数据可视化数据可视化—折线图数据可视化—箱线图数据可视化—柱状图数据可视化—饼图、环形图、雷达图统计学检验箱线图筛选异常值3Sigma原则筛选离群值Python统计学检验大数据Py
Spark
数据科学知识库
·
2023-12-23 08:57
算法
多臂老虎机
MAB
上一页
43
44
45
46
47
48
49
50
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他