E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark性能调优
VMware导入ova/ovf虚拟机文件
VMware导入ova/ovf虚拟机文件按图片步骤导入完成点击开启此虚拟机,就可以使用了自己制作的一个ova虚拟机文件百度网盘提取码:ptfw这个ova文件是基于UbuntuKylin安装了hadoop,
spark
坤坤不爱吃鱼
·
2023-11-23 05:33
Linux
虚拟机
vm
Spark
Shop小程序商城系统 支持多端,并带有分销功能
Spark
Shop(星火商城)是一个基于ThinkPHP6+ElementUI的开源免费高性能商城系统,可用于商业用途。
软希源码
·
2023-11-23 05:46
软希网源码下载
小程序
SparkShop商城系统
Spark
提交执行源码学习
Spark
Submit执行后,执行环境准备工作privatedefrunDriver():Unit={addAmIpFilter(None,System.getenv(ApplicationConstants.APPLICATION_WEB_PROXY_BASE_ENV
ShiPF
·
2023-11-23 04:21
Spark
常用命令
启动
Spark
命令首先启动Hadoop:start-all.sh启动master:进入
spark
安装目录:./sbin/start-master.sh启动slaves:进入
spark
安装目录:.
在努力的Jie
·
2023-11-23 02:27
米哈游大数据云原生实践
背景简介为了解决原有架构缺乏弹性、运维复杂、资源利用率低等问题,2022年下半年,我们着手调研将大数据基础架构云原生化,并最终落地了
Spark
云布道师
·
2023-11-23 02:26
阿里云
人工智能学习路线,文末赠书活动(深度学习
Spark
机器学习)
另外本次文末机械工业出版社华章分社闫老师提供给本公众号五本技术图书《深度学习
Spark
机器学习》,免费赠送给大家!第一课:机器学习的数学基础1.机器学习的数学基础a.函数与
程序IT圈
·
2023-11-23 01:30
算法
决策树
人工智能
机器学习
深度学习
一文对比storm与
spark
(特性与应用场景)
ApacheStorm和
Spark
是该列表中最流行的两种实时技术。让我们根据它们的功能比较ApacheStorm和
Spark
,并帮助用户做出选择。
行思坐忆,志凌云
·
2023-11-23 00:51
微服务与分布式
分布式
大数据
storm
spark
【Python大数据笔记_day11_Hadoop进阶之MR和YARN&ZooKeeper】
MR单词统计流程已知文件内容: hadoophivehadoop
spark
hive flinkhivelinuxhivemysqlinput结果: k1(行偏移量) v1(每行文本内容) 0
LKL1026
·
2023-11-22 21:37
Python大数据学习笔记
hadoop
大数据
笔记
计算机毕业设计之Python+
Spark
+Flink考研测与推荐系统 考研大数据分析 考研推荐系统 考研预测系统 考研大数据可视化 考研爬虫可视化 考研数据分析
springboot+mybatis-plus数据库:mysql算法(机器学习、深度学习):协同过滤算法(基于用户、基于物品全部实现)、KNN爬虫:python、requests、chrome_driver大数据分析:
spark
计算机毕业设计大神
·
2023-11-22 21:10
第一篇:深入理解JVM类加载机制
通过深入了解JVM,我们可以更好地理解Java应用程序的运行机制和
性能调优
,为Java开发者提供有价值的指导。
Java铁仙人
·
2023-11-22 18:46
深入学习JVM
jvm
java
后端
助力企业前行——Scala&
Spark
最佳实践课程
时间飞逝,转眼间我们的Scala&
Spark
培训课程已经圆满结束!在这段精彩的学习旅程中,你们展现了坚韧、决心和追求卓越的品质。
焦点快讯
·
2023-11-22 18:46
业界资讯
期末考试题库2
62.下面哪一个是属于
Spark
的分布式图处理框架?
m0_74487105
·
2023-11-22 17:34
模拟退火算法
mysql left join 耗时_
性能调优
:mysql之left join
需求是一个普通的两个表连接从而查询出详细信息。其中A表是大表,测试数据都有数万条;B表是小表大概1000多条数据。1.为了赶工写出的未优化SQL(为突出主题,返回字段用*代替不写出详细字段,WHERE条件也去掉了):SELECT*FROMAaLEFTJOINBbONa.JOB_ID=b.ID耗时:3.712srows字段代表这个步骤相对上一步结果每一行需要扫描的行数,可以看到这个sql需要扫描的行
帅小伙-路飞
·
2023-11-22 17:43
mysql
left
join
耗时
云计算与大数据第16章 分布式内存计算平台
Spark
习题
第16章分布式内存计算平台
Spark
习题16.1选择题1、
Spark
是Hadoop生态(B)组件的替代方案。
高校知识店铺合集汇总
·
2023-11-22 16:24
spark
分布式
大数据
Midjourney绘画提示词Prompt参考教程
一、AI工具
Spark
Ai:
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-22 16:37
人工智能
AIGC
教程
midjourney
AIGC
AI作画
人工智能
prompt
最新AIGC创作系统ChatGPT系统源码,支持最新GPT-4-Turbo模型,支持DALL-E3文生图,图片对话理解功能
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-22 16:06
AIGC
软件源码
ChatGPT
AIGC
AI作画
人工智能
chatgpt
最新AIGC创作系统ChatGPT网站源码,Midjourney绘画系统,支持最新GPT-4-Turbo模型,支持DALL-E3文生图
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-22 16:56
人工智能
软件源码
ChatGPT
chatgpt
人工智能
AIGC
Hive VS
Spark
spark
是一个计算引擎,hive是一个存储框架。他们之间的关系就像发动机组与加油站之间的关系。类似于
spark
的计算引擎还有很多,像mapreduce,flink等等。
AII派森
·
2023-11-22 16:55
hive
spark
hadoop
数据倾斜(五):
Spark
是如何解决数据倾斜的
Spark
数据倾斜表现
Spark
数据倾斜原理
Spark
数据倾斜例子
Spark
数据倾斜解决方案七、
Spark
解决数据倾斜具体方法7.1概述mapjoin设置rdd压缩合理设置driver的内存
Spark
Sql
longLiveData
·
2023-11-22 15:51
python图书推荐系统的设计_在线图书推荐系统的实现含源码(协同过滤)
项目简介源码地址http://github.com/XuefengHuang/RecommendationSystem基于
Spark
,PythonFlask,和Book-CrossingDataset的在线图书推荐系统
比利海灵顿
·
2023-11-22 14:59
python图书推荐系统的设计
Apache
Spark
【从无到有从有到无】【编程指南】【AS5】结构化流编程指南
目录1.概观2.快速示例3.编程模型3.1.基本概念3.2.处理事件时间和延迟数据3.3.容错语义4.使用数据集和数据框架的API4.1.创建streamingDataFrames和streamingDatasets4.1.1.输入源(InputSources)4.1.2.流式数据帧/数据集(streamingDataFrames/Datasets)的模式推断和划分4.2.流式数据帧/数据集(st
琴 韵
·
2023-11-22 13:02
Apache
Spark
Apache
Spark
[
Spark
版本更新]--2.3.0发行说明(二)
新功能·[
SPARK
-3181]-使用Huber估计器添加鲁棒回归算法·[
SPARK
-4131]-支持“通过查询将数据写入文件系统”·[
SPARK
-12139]-Hive查询的REGEX列规范·[
SPARK
浅汐王
·
2023-11-22 13:54
sql
Spark
时间处理函数
year()month()day()hour():日期转化:要处理的数据格式为'yyyy-mm-ddhh:mm:ss'计算数据'2023-01-0112:01:00'year():取数据的年year('2023-01-0112:01:00')----2023month():取数据的月份month('2023-01-0112:01:00')----01day():取数据的日day('2023-01-
邂逅↪秋
·
2023-11-22 13:34
sql
hive
spark
数据仓库
离线数据处理——子任务一:数据抽取
目录子任务一:数据抽取实现代码(1)定义工具类(2)定义工作类子任务一:数据抽取编写Scala代码,使用
Spark
将MySQL的shtd_store库中表user_info、sku_info、base_province
长风有续X
·
2023-11-22 13:27
大数据
spark
hive
<Zhuuu_ZZ>
Spark
项目之log日志数据分析处理
Spark
项目之log日志数据分析处理一项目准备二项目需求三项目战斗1、数据清洗日志字段拆分分析IDEA开发程序2、用户留存分析3活跃用户分析四项目拓展之复杂Json格式的log日志处理分析
Spark
-Shell
Zhuuu_ZZ
·
2023-11-22 13:26
Spark
项目
spark
log
数据处理
数据分析
5、
Spark
DataFrame理解和使用之不同数据类型的操作(二)
DatesandTimestamps日期和时间戳HandlingNull空值ComplexTypes复杂类型UserDefinedFunctions用户自定义函数布尔型、数值型、字符型数据操作见前博文4、
Spark
DataFrame
Just Jump
·
2023-11-22 13:26
Spark权威指南
spark
spark
大数据处理技术
Spark
内容有虚拟机配置,ubuntu安装,创建项目,hadoop部署,python使用
spark
库等等,也附上所有用到的软件的网盘下载链接,算是提供一个完整的思路。
我叫桃小夭
·
2023-11-22 13:54
大数据
hadoop
分布式
python
spark
手写操作系统(1)——HelloOS
对于后端开发而言,操作系统层面的进程、线程、内存、I/O等相关知识根本逃不掉;对于WEB开发,
性能调优
更是离不开操作系统;对于运维、测试,如果操
青玉白露
·
2023-11-22 13:44
Linux应用参数配置和调优,Hadoop
性能调优
重要参数设置技巧
这里主要针对Mapreduce的
性能调优
。
花猹猹
·
2023-11-22 09:13
Linux应用参数配置和调优
Hadoop
性能调优
Hadoop
性能调优
1.简介Hadoop
性能调优
不仅涉及Hadoop本身的
性能调优
,还涉及更底层的硬件、操作系统和Java虚拟机等系统的调优。
回忆美好
·
2023-11-22 09:42
hadoop
性能调优
一、禁止文件系统记录时间Linux文件系统会记录文件创建、修改和访问操作的时间信息,这在读写操作频繁的应用中将带来不小的性能损失。在挂载文件系统时设置noatime和nodiratime可禁止文件系统记录文件和目录的访问时间,这对HDFS这种读取操作频繁的系统来说,可以节约一笔可观的开销。可以修改/etc/fstab文件中noatime和nodiratime来实现这个设置。如对/mnt/disk1
挑战不可能,努力
·
2023-11-22 09:12
大数据
spark
stream消费kafka序列化报错
本篇介绍在window运行环境下,使用
spark
消费kafka数据遇到的几个坑。。
小爽123
·
2023-11-22 09:12
大数据
spark
kafka
大数据
hadoop
性能调优
之参数调优
本文转载自:http://blog.csdn.net/fp196391196391/article/details/8302121这里主要针对Mapreduce的
性能调优
。
我是机智的鱼油
·
2023-11-22 09:12
Hadoop Yarn
性能调优
文章目录HadoopYarn
性能调优
1环境2yarn-site.xml配置HadoopYarn
性能调优
版本:hadoop-3.1.31环境内存vCode线程数hadoop1018G4核CPU4hadoop1028G4
老鼠扛刀满街找猫@
·
2023-11-22 09:41
hadhoop
hadoop
big
data
转载:Hadoop
性能调优
blog.csdn.net/dxl342/article/details/52840455https://blog.csdn.net/u014156013/article/details/81347670Hadoop
性能调优
DT鸽子
·
2023-11-22 09:09
Hadoop
hadoop调优
Hadoop
性能调优
概要说明
本文试着从
性能调优
的总体原则入手来了解概要,实际生产中遇到的问题也会在这个框架下处理。Hadoop运行环境:下面大致给出这四个层次的调优原则。1、硬件选型原则2、操作系统调优1)避免使用swap分区将
fjssharpsword
·
2023-11-22 09:07
Big
data
Hadoop专栏
Hadoop参数调优
Hadoop参数调优
性能调优
涉及4个方面:CPU利用率、内存占用情况、磁盘I/O和网络流量。有很多因素会对HadoopMapReduce性能产生影响。
MrZhangBaby
·
2023-11-22 09:05
谈笑间学会HDFS
Hadoop
谈笑间学会大数据
hadoop
mapreduce
hdfs
Hadoop
性能调优
建议
一、服务器配置1.BIOS配置:关闭smmu/关闭cpu预取/performance策略2.硬盘优化raid0打卡cache/jbodscheduler/sector_size/read_ahead_kb3.网卡优化rx_buff/ring_buffer/lro/中断绑核/驱动升级4.内存插法:要用均衡插法,内存配对插。5.占用通道:先把每个通道都插满,再去插对应通道。(内存通道分布请查看机箱背板
shining_yyds
·
2023-11-22 09:33
hadoop
运维
linux
JVM
性能调优
JVM
性能调优
JVM(JavaVirtualMachine)
性能调优
是优化Java应用程序性能的关键步骤。
我の唯一
·
2023-11-22 09:24
系统架构
jvm
测试工具
java
这些神奇而没有用的体质
对方却大笑着上前来,说:you
spark
edme。然后,我们象征性地稍微捏了一下手,我尴尬的笑了,以示抱歉。昨天中午的时候,胳膊估计是碰到隔壁桌的印度同事了,
沉吟君
·
2023-11-22 08:33
Java优质资源汇总(持续更新)
ReentrantLock的实现看AQS的原理及应用不可不说的Java“锁”事CompletableFuture原理与实践Java线程池实现原理及其在美团业务中的实践MySQL优化官方文档:MySQL优化大数据
Spark
tcoding
·
2023-11-22 08:43
java
Doris系列之动态分区操作
Doris系列注:大家觉得博客好的话,别忘了点赞收藏呀,本人每周都会更新关于人工智能和大数据相关的内容,内容多为原创,PythonJavaScalaSQL代码,CVNLP推荐系统等,
Spark
FlinkKafkaHbaseHiveFlume
陈万君Allen
·
2023-11-22 05:32
Java和大数据
大数据
数据库
数据治理入门
处理模式模式名称常见场景常见框架批处理夜间几个小时,无人值守hive
spark
datax流处理7*24H一直运行,无人值守maxwell,flink,flume,kafka即席处理人机交互接口访问web
十七✧ᐦ̤
·
2023-11-22 04:36
数据仓库
大数据
CK03# ClickHouse日志存储设计点梳理
本文主要梳理了使用ClickHouse作为日志存储的设计点,主要内容有:应用日志存储时长定制ClickHouse数据的冷热存储ClickHouse数据迁移与删除ClickHouse查询
性能调优
点一、应用日志存储时长定制公司所有的应用存储日志时长统一设置固定存储时长
瓜农老梁
·
2023-11-22 03:54
大数据
java
数据库
mysql
redis
使用JMX监控ZooKeeper和Kafka
JVM默认会通过JMX的方式暴露基础指标,很多中间件也会通过JMX的方式暴露业务指标,比如Kafka、Zookeeper、ActiveMQ、Cassandra、
Spark
、Tomcat、Flink等等。
跟着大数据和AI去旅行
·
2023-11-22 01:34
大数据企业级实战
zookeeper
kafka
JMX
aix系统java堆_浅谈AIX环境下的Java
性能调优
fromIBMJava性能准则在编写Java应用程序时,以下是基本的准则:使用字符串缓冲区而不是字符串连接,当进行连续字符串操作时要避免不必要地创建那些最终必须经过垃圾回收的对象。避免连续写入Java控制台以减少字符串操作、文本格式化以及输出的花费。必要时通过使用变量的原语类型来避免对象创建和操作的花费。经常高速缓存用过的对象以减少必须的垃圾回收数量,并且避免重复创建对象的需求。尽可能分组本地操作
weixin_39571938
·
2023-11-21 22:32
aix系统java堆
Iceberg学习笔记(1)—— 基础知识
是一个面向海量数据分析场景的开放表格式(TableFormat),其设计的目的是解决数据存储和计算引擎之间的适配的问题表格式(TableFormat)可以理解为元数据以及数据文件的一种组织方式,处于计算框架(Flink,
Spark
THE WHY
·
2023-11-21 22:50
大数据
数据湖
学习
笔记
大数据
数据库
数据仓库
Spark
-Core 计算基础核心(三) 概念及原理介绍
运行原理当一个
spark
应用被提交时,首先要为这个
spark
APPlication构建基本的运行环境,即由任务节点Driver创建一个
spark
context;
spark
Context向clustermanager
章云邰
·
2023-11-21 19:09
spark
简单数据查询与常见算子
60Jim,DataBase,90Jim,Algorithm,60Jim,DataStructure,80该系总共有多少学生;vallines=sc.textFile("file:///usr/local/
spark
背帆
·
2023-11-21 17:53
大数据
spark
大数据
scala
sql
基于Scala版本的TMDB大数据电影分析项目
所以在使用
Spark
SQL处理该数据集的时候,需要创建S
数仓白菜白
·
2023-11-21 17:20
Spark
SQL
big
data
scala
spark
上一页
49
50
51
52
53
54
55
56
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他