E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark学习之路
机器学习模型开发必读:开源数据库最全盘点
类似于TensorFlow、Torch和
Spark
这样的开源工具,在AI开发者群体中已是无处不在。
isuccess88
·
2023-11-20 07:57
机器学习
机器学习
开源数据
大数据学习(22)-
spark
&&大数据学习&&系列专栏:哲学语录:承认自己的无知,乃是开启智慧的大门如果觉得博主的文章还不错的话,请点赞+收藏⭐️+留言支持一下博主哦
Spark
是一个基于内存计算的大数据并行计算框架,具有快速、易用
viperrrrrrr
·
2023-11-20 07:23
大数据
学习
spark
Hbase - 自定义Rowkey规则
中我们有时候需要分析数据1点到2点的范围,可是经过Region又比较慢,这时候我们就可以定制TableInputFormat来实现我们的需求了,我们还可以采用Flink的DataSet的方式读取,另外下面还有
Spark
kikiki2
·
2023-11-20 06:12
努力的那些年,我们是否还记得
记得高考的前夕,同学们都紧张起来,不论是学习好的,还是学习坏的,在老师的催促下,开始了漫长的
学习之路
。
二月福星
·
2023-11-20 06:20
Spark
系列之
Spark
Submit提交任务到YARN
title:
Spark
系列第十三章
Spark
Submit提交任务到YARN13.1
Spark
Submit提交的一些参数解释local本地单线程local[K]本地多线程(指定K个内核)local[*]本地多线程
落叶飘雪2014
·
2023-11-20 04:28
Spark
数据计算
Spark
大数据
Scala_scopt 解析命令行参数
一、说明1、在做
spark
项目时,在命令行提交任务时,可以利用--参数名:参数进行动态传参;2、操作步骤(1)首先写个表示配置的caseclass类,里面为每一个参数指定默认值;(2)Config配置对象作为参数传递给
郝少
·
2023-11-20 04:53
Spark技术经验
大数据
scopt
spark
scala
Failed to execute goal net.alchim31.maven:scala-maven-plugin:3.2.2:testCompile问题解决
解决方法1转载:http://www.cnblogs.com/war3blog/p/7864804.html在编译
spark
源码的时候老师报类似的错误然后在
spark
文件夹下的pom.xml里加入如下依赖
xiaoliuyiting
·
2023-11-20 03:51
spark
IDEA+Maven构建scala项目【一篇就够】
一、新建项目输入项目名称:
Spark
Demo_WordCount,点击“完成”项目创建成功,如下所示:"C:\ProgramFiles\Java\jdk1.8.0_45\bin\java"-Dmaven.multiModuleProjectDirectory
sjmz30071360
·
2023-11-20 03:48
Spark
Process exited with an error: -10000 (Exit value: -10000) 以error: java.lang.StackOverflowError为起源
Processexitedwithanerror:-10000(Exitvalue:-10000)1.问题描述编译一段
spark
-scala程序时,打包文件失败,由于之前也偶发性存在这种问题,关闭其他应用
我真的有在变好
·
2023-11-20 03:18
java
scala
开发语言
net.alchim31.maven:scala-maven-plugin:maven依赖无法下载或无法编译
背景:测试
spark
代码时,部分类无法正常导入,具体原因是部分maven依赖没有下载下来,导致类无法正常导入;原因:package默认只处理java源代码的编译、打包,而不管scala;解决方法:mvncleanscala
东耳飘雪
·
2023-11-20 03:45
每日随笔
spark
顺序表实现多项式相加
数据结构
学习之路
——顺序表本文思路参考:https://blog.csdn.net/seu_nuaa_zc/article/details/73136455题目如下:#include#include/*
Stru le
·
2023-11-20 02:07
C
数据结构
顺序表
多项式相加
【图数据库实战】HugeGraph架构
OLAP计算是基于
Spark
GraphX实现。二、组件HugeGraph的主要功能分为HugeC
码农丁丁
·
2023-11-20 02:15
后端技术
#
大数据
#
数据库
数据库
架构
图数据库
HugeGraph
大数据流式处理框架Flink介绍
1、Flink的介绍随着数据的飞速发展,出现了很多热门的开源社区,比如:hadoop、
spark
、storm社区,他们都有各自专注的适用场景,比如hadoop主要是做数据的存储及批处理计算,
spark
既可以做批处理也可以做准实时计算
大数据动物园
·
2023-11-20 01:57
大数据flink学习及问题解决
大数据
大数据常见面试题及答案
大特性:2、Hive分桶和分区的区别:3、Hive表动态分区和静态分区4、一个Hive表,数据量很大,分布在集群的100个节点,现在需要定期取top100,如何设计/实现:5、窗口函数6、hivesql和
spark
sql
遐想者csdn
·
2023-11-20 01:18
大数据
hadoop
spark
hdfs
mapreduce
大数据
hive lateral view explode列拆分与行转列用法
先创建一张临时表供测试,sql如下:--执行引擎:
spark
引擎--1.创建表createtabletmp.tmp1(book_namestri
平凡的大数据之路
·
2023-11-20 00:03
hive
hadoop
数据仓库
大数据组件
spark
hadoop hive简单介绍
spark
单机启动
spark
-shell集群启动/usr/local/
spark
-2.4.5-bin-hadoop2.7/sbin/start-all.sh提交任务1.打包python环境:whereispython
转身之后才不会
·
2023-11-19 23:29
大数据
hadoop
大数据
spark
QT学习笔记
HelloWorld开局0、信号槽1、QT
学习之路
2(5):自定义信号槽不得不说,大神真牛,有几处我特别摘抄,因为写的太透彻了下面总结一下自定义信号槽需要注意的事项:发送者和接收者都需要是QObject
TsubasaAngel
·
2023-11-19 22:41
qt
学习
开发语言
AIGC创作系统ChatGPT源码,AI绘画源码,支持最新GPT-4-Turbo模型,支持DALL-E3文生图
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-19 22:09
AIGC
人工智能
软件源码
chatgpt
AIGC
AI作画
人工智能
2011-2022年高职大数据竞赛-赛题内容
-离线数据抽取第四部分赛题模拟实现-离线数据统计第五部分赛题模拟实现-数据采集与实时计算第六部分赛题模拟实现-数据可视化第一部分竞赛内容赛项以大数据技术与应用为核心内容和工作基础,重点考查参赛选手基于
Spark
xlw2003
·
2023-11-19 21:54
大数据
Spark
hadoop
flink
高职大数据竞赛
2011-2022年高职大数据竞赛-赛题任务剖析
离线数据抽取第四部分赛题模拟实现-离线数据统计第五部分赛题模拟实现-数据采集与实时计算第六部分赛题模拟实现-数据可视化(一)任务一:大数据平台环境搭建具体内容按照大数据分析平台需求,需要完成Hadoop完全分布式、
Spark
xlw2003
·
2023-11-19 21:54
Spark
Flink
hadoop
spark
flume
kafka
flink
电商大数据分析案例(Hadoop+Hive+
Spark
+Azkaban+Spring MVC+ECharts)
项目描述某著名电商平台双十一美妆销售数据分析。由于是真实的商业数据,所以做了脱敏处理,数据集中对店名的引用被处理为产品的品牌名以保护店家隐私。。通过对该平台双十一美妆销售数据的品牌、销量、热度等特征的分析(平台视角和用户视角),尝试探索以下问题:双十一期间,最受消费者青睐的产品或品牌是哪些?双十一期间,美妆行业各品类的销售情况?双十一期间,消费高峰何时出现?双十一期间,客户的评论数对销量的影响?.
xlw2003
·
2023-11-19 21:53
Spark
hive
Hadoop
hive
spark
hadoop
Spark
SQL
spring
Doris Routine Load接入Kafka0.8.0实战
DorisRoutineLoad接入Kafka0.8.0实战想要更全面了解
Spark
内核和应用实战,可以购买我的新书。
wangleigiser
·
2023-11-19 21:48
Doris
kafka
大数据
java
【
Spark
深入学习 02】- 我是一个凶残的
spark
学一门新鲜的技术,其实过程都是相似的,先学基本的原理和概念,再学怎么使用,最后深究这技术是怎么实现的,所以本章节就带你认识认识
spark
长什么样的,帅不帅,时髦不时髦(这货的基本概念和原理),接着了解
spark
weixin_34055910
·
2023-11-19 21:47
大数据
CAPL
学习之路
-测试功能集函数(故障注入函数)
TestDisableMsg禁止发送消息,除非调用函数TestSetMsgEvent使用TestEnableMsg重新启用消息。此函数影响分配CANoe交互层或CANopen仿真的仿真节点这个函数可以在测试用例中控制SimulationSetup界面仿真节点报文的发送与停止testcaseTCExample(){testDisableMsg(LightState);//LightState是dbc
jasonj33
·
2023-11-19 21:33
【付费专栏】CAPL编程语言
CANoe
CAPL
flink原理实战与性能优化 pdf_三万字长文 |
Spark
性能优化实战手册
本文分为四个部分,基本涵盖了所有
Spark
优化的点,面试和实际工作中必备。
weixin_39685697
·
2023-11-19 18:07
flink原理实战与性能优化
pdf
spark算子
spark
性能调优之合理的并行度设置
Spark
性能调优之合理设置并行度1.
Spark
的并行度指的是什么?
spark
作业中,各个stage的task的数量,也就代表了
spark
作业在各个阶段stage的并行度!
浪子城
·
2023-11-19 18:07
大数据
spark优化
大数据
Spark
性能调优之合理设置并行度
1.
Spark
的并行度指的是什么?
spark
作业中,各个stage的task的数量,也就代表了
spark
作业在各个阶段stage的并行度!
跳跃的list
·
2023-11-19 18:06
spark
spark
调优
【
Spark
】|【
Spark
性能调优】|【设置并行度】|【
Spark
多配置优先级】|【总结】
一、【关于
Spark
并行度】1.什么是
Spark
的并行度?
Haven.Liu
·
2023-11-19 18:35
Spark
Spark
性能调优
task并行度
配置读取优先级
spark
性能调优 | 默认并行度
Spark
Sql默认并行度看官网,默认并行度200https://
spark
.apache.org/docs/2.4.5/sql-performance-tuning.html#other-configuration-options
Knight_AL
·
2023-11-19 18:04
Spark优化
spark
大数据
分布式
Spark
性能调优之并行度设置
Spark
性能调优之并行度设置
Spark
作业中的并行度什么是并行度
Spark
在每一个stage中task数量,就称为这个stage上的并行度;为什么要设置并行度如果你按照集群能给的最大资源给当前
Spark
fffalconer
·
2023-11-19 18:04
Spark
spark
大数据
学习之路
指南:GitHub 教程与指南精选手册一
NameStarCountRepositoryNameOwnerTopicsAboutLabelpractical-tutorials/project-based-learning121419project-based-learningpractical-tutorialsjavascript,python,golang,tutorial,cpp,beginner-project,project,
milan-xiao-tiejiang
·
2023-11-19 17:56
github
大数据之
Spark
:
Spark
数据倾斜
目录1.预聚合原始数据1.避免shuffle过程2.增大key粒度(减小数据倾斜可能性,增大每个task的数据量)2.预处理导致倾斜的key1.过滤2.使用随机key3.sample采样对倾斜key单独进行join3.提高reduce并行度1.reduce端并行度的设置2.reduce端并行度设置存在的缺陷4.使用mapjoin1.核心思路:2.不适用场景分析:数据倾斜:就是数据分到各个区的数量不
浊酒南街
·
2023-11-19 17:23
大数据系列三
big
data
spark
hive
Spark
数据倾斜解决
Spark
中的数据倾斜问题主要指shuffle过程中出现的数据倾斜问题,是由于不同的key对应的数据量不同导致的不同task所处理的数据量不同的问题。
浪尖聊大数据-浪尖
·
2023-11-19 17:20
spark
java
python
大数据
数据分析
spark
数据倾斜
原本能够正常执行的
Spark
作业,某天突然报出OOM(内存溢出)异常,观察异常栈,是我们写的业务代码造成的。这种情况比较少见。数据倾斜发生的原理数据倾斜的原理很简单:在进行shuffle的时候,必须
什么都要取名累不累
·
2023-11-19 17:49
hive
hadoop
hdfs
spark
数据倾斜优化
目录
spark
数据倾斜优化数据倾斜产生的原因数据倾斜七种解决方案使用HiveETL预处理数据过滤少数导致倾斜的key提高shuffle操作的并行度双重聚合将reducejoin转为mapjoin采样倾斜
赤兔胭脂小吕布
·
2023-11-19 17:15
spark
大数据
hive
hadoop
分布式
Spark
数据倾斜解决方案
倾斜场景1.2解决方案2.大表Join小表倾斜2.1倾斜场景2.2解决方案3.大表Join大表倾斜3.1倾斜场景3.2解决方案4.两表Join时空值过多倾斜4.1倾斜场景4.2解决方案今天我们来详细介绍下
Spark
伯利恒教堂
·
2023-11-19 17:14
spark
大数据
分布式
Spark
数据倾斜解决思路
1.避免数据源倾斜-HDFS
Spark
通过textFile(path,minPartitions)方法读取文件时,使用TextInputFormat。
小小大数据
·
2023-11-19 17:13
Spark
spark
大数据
kafka
Spark
数据倾斜
一、
Spark
数据倾斜介绍1.1数据倾斜介绍
Spark
中的数据倾斜问题主要指shuffle过程中出现的数据倾斜问题,是由于不同的key对应的数据量不同导致的不同task所处理的数据量不同的问题。
火成哥哥
·
2023-11-19 17:10
spark
spark
java
大数据
hive
scala
Spark
数据倾斜
Spark
数据倾斜调优数据倾斜是大数据计算中一个最棘手的问题,出现数据倾斜后,
Spark
作业的性能会比期望值差很多,两大直接后果:
Spark
任务OOM异常退出,数据倾斜拖慢整个任务的执行。
WovJf
·
2023-11-19 17:04
Spark
spark
大数据
分布式
大数据课程结构
1、第一阶段javaSE基础阶段-张一峰2、第二阶段-JavaWeb+数据库阶段-张3、第三阶段-大数据分布式架构-张一峰4、第四阶段-大数据Hadoop实战-张一峰5、第五阶段-大数据
spark
实战-
张一峰
·
2023-11-19 16:31
大数据
大数据
1.javascript 自动定时刷新网页脚本
一、问题跑一些
spark
任务时要运行很久,每次想看最新进度都要手动刷新一下,手按F5按多了很累,就想为什么不搞个自动刷新脚本呢二、解决1.思路输入时间间隔如果时间间隔大于0那么每次时间超过输入的时间间隔后
终回首
·
2023-11-19 14:17
Other
Language
javascript
数仓开发面试题之Hadoop相关
提纲MapReduce原理,map数、reduce数的参数说一下mapjoin与reducejoinhivesql怎么优
spark
和hive的区别数据倾斜几种解决方式数据如何清洗说一下udf、udtf、
话数Science
·
2023-11-19 13:39
面试
大数据
hadoop
大数据
Java 与 Scala 使用Maven混合编译打包
在SpringBoot上使用
spark
的时候会遇到的混合编译问题,在java代码中打包会找不到scala定义的包,即可参考使用如下配置。
kikiki4
·
2023-11-19 12:16
Spark
自定义分区(Partitioner)
基于优化和数据的有序性等问题考虑,某个设备的日志数据分到指定的计算节点,减少数据的网络传输我们都知道
Spark
内部提供了HashPartitioner和RangePartitioner两种分区策略,这两种分区策略在很多情况下都适合我们的场景
达微
·
2023-11-19 11:36
前端
学习之路
——scss篇
一、什么是SASSSASS是一种CSS的开发工具,提供了许多便利的写法,大大节省了设计者的时间,使得CSS的开发,变得简单和可维护。二、安装和使用Sass依赖于ruby环境,所以装sass之前先确认装了ruby。先导官网下载个ruby。在安装的时候,请勾选AddRubyexecutablestoyourPATH这个选项,添加环境变量,不然以后使用编译软件的时候会提示找不到ruby环境。安装好rub
weixin_30586085
·
2023-11-19 10:27
前端
ruby
开发工具
ViewUI
刻意将每天的生活都和英语学习建立连接——新概念英语联想2
笔者每天下班回来总会看见这样的场景,很生气的然后我就想到了新概念28课Whenhereturnshomeatnight,healwaysfindsthatsomeoneha
spark
edacaroutsidehisgate
生财日历
·
2023-11-19 10:52
浅析图数据库 Nebula Graph 数据导入工具——
Spark
Writer
Spark
Writer从Hadoop说起近年来随着大数据的兴起,分布式计算引擎层出不穷。Hadoop是Apache开源组织的一个分布式计算开源框架,在很多大型网站上都已经得到了应用。
NebulaGraph
·
2023-11-19 09:22
最新AI创作系统ChatGPT系统运营源码+支持GPT-4多模态模型
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
只恨天高
·
2023-11-19 08:52
人工智能
系统源码
chatgpt
chatgpt
人工智能
源码软件
AI写作
2023.11.18 Hadoop之 YARN
支持多个数据处理框架(MapReduce
Spark
Storm等)。具有资源利用率高、运行成本底、数据共享等特点资源调度管理的作用MapReduce是基于yarn运行的,没有y
白白的wj
·
2023-11-19 08:41
database
hadoop
hive
sql
big
data
yarn
JAVA
学习之路
181206
早上,半个小时,学习了Debug,软件工程,大三上学期上了一大半,才开始学习使用Debug,不免有点无耻了,昨天9.9买的淘宝视频,前端后端都有了,我最近才发现前端不太适合我,决心狠心学习后端,且吧前端当作练手。把当作学习日记本吧。看看我能有什么成就。啊哈,想成为一个幽默且有技术的程序猿。写几篇装逼的博客,以后给我的孩子看,让他们在快乐中学习编程,不对不对,我曾经立下祖训,从我之后张家不能学习编程
全栈程序员_元婴期
·
2023-11-19 08:01
上一页
55
56
57
58
59
60
61
62
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他