E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark边缘计算
Spark
二、
Spark
技术栈之
Spark
Core
Spark
Core
spark
核心:包括RDD、RDD算子、RDD的持久化/缓存、累加器和广播变量学习链接:https://mp.weixin.qq.com/s/caCk3mM5iXy0FaXCLkDwYQ
eight_Jessen
·
2024-01-04 08:51
spark
scala
spark
大数据
分布式
2024.1.3
Spark
架构角色和提交任务流程
目录一.Yarn的角色回顾二、
Spark
提交任务流程1、
Spark
OnStandalone2.
Spark
onYarn三.
Spark
比MapReduce执行效率高的原因四.
Spark
的排序算子一.Yarn
白白的wj
·
2024-01-04 08:46
spark
大数据
分布式
python
开发语言
hdfs
mapreduce
mllib可扩展学习库java api使用
mllib可扩展学习库javaapi是使用Apache
Spark
构建的机器学习库,包括分类,聚类,特征提取和预处理等功能。本文将从以下几个方面详细介绍如何使用mllib可扩展学习库javaapi。
卖兔子的胡萝卜zz
·
2024-01-04 08:43
API接口开发系列
mllib
学习
java
Spark
- SQL查询文件数据
那么我们可以利用
spark
-sql直接操作文件的特性处理这类的需求,姐姐再也不用担心我不会
spark
了,因为我就只会sql。使用方法csv
spark
.sql("select*fromcsv.
大猪大猪
·
2024-01-04 07:02
spark
资源动态释放
通过
spark
-submit会固定占用一占的资源,有什么办法,在任务不运作的时候将资源释放,让其它任务使用呢,yarn新版本默认已经支持了,我们使用的是HDP。
kikiki2
·
2024-01-04 07:35
【深度学习】02--框架
文章导读:•机器学习框架:•Scikit-Learn•
Spark
MLlib•深度学习框架•Theano蒙特利尔理工学院•TensorFlow谷歌•PytorchFacebook•Deeplearning4j
创造new_world
·
2024-01-04 06:55
Antlr4 - 自定义
Spark
SQL解析
Antlr4是一个强大的解析器的生成器,可以用来读取、处理、执行或翻译结构化文本,ANTLR可以从语法上来生成一个可以构建和遍历解析树的解析器,最出名的
Spark
计算引擎2.x就是用它来解析SQL的,是一个牛到没朋友的家伙
大猪大猪
·
2024-01-04 04:40
Spark
RDD及其常用算子介绍
一、RDD介绍1.1什么是RDDRDD(ResilientDistributedDataSet),称作弹性分布式数据集,是
Spark
中最基本的数据抽象,表示一个不可变的,分区的,其中元素可以被并行计算的数据集合
文景大大
·
2024-01-03 23:40
Spark
---RDD介绍
文章目录1.
Spark
核心编程2.RDD介绍2.1.RDD基本原理2.2RDD特点1.弹性2.分布式:数据存储在大数据集群的不同节点上3.数据集:RDD封装了计算逻辑,并不保存数据4.数据抽象:RDD是一个抽象类
肥大毛
·
2024-01-03 23:34
spark
大数据
spark
学习
大数据
Spark
相关知识点(期末复习集锦)
嗨喽,最近小伙伴们快要期末考试了吧,下面是我对《
Spark
零基础实战》的总结,希望能帮助到你们。
夜をむかえる
·
2024-01-03 22:49
spark
大数据
分布式
from py
spark
.mllib.recommendation import Rating出错
进入py
spark
输入frompy
spark
.mllib.recommendationimportRating报错nomodulenamednumpy我的环境:centos6.5,python2.6显然是我的虚拟机系统里自带的
路人乙yh
·
2024-01-03 22:47
Spark
优化的小细节,堆和栈
堆和栈的使用。堆是内存存储对象,有较大的内存空间。栈是内存存储方法,内存空间分配较少。当程序多次调用一个方法时,可以将方法当做一个对象放入堆中,来减少栈内存的使用。降低CPU的占用,使更多内存分配到计算处理。
坐在你的树下
·
2024-01-03 22:38
Spark
向Hbase中写数据报异常:org.apache.hadoop.hbase.client.RetriesExhaustedWithDetailsException: Failed 5
解决:将第二行代码中的表名写全,并指定在哪个名称空间valtable:Table=con.getTable(TableName.valueOf("info:tb_order"))
夺命大翻斗
·
2024-01-03 22:12
spark
hbase
apache
数组索引越界异常
Causedby:org.apache.
spark
.
Spark
Exception:Jobabortedduetostagefailure:Task1instage0.0failed1times,mostrecentfailure
夺命大翻斗
·
2024-01-03 21:40
spark
学习大数据的第43天(python篇)——学习python第3天
Scipylibrary主要是积分运算,优化以及图形Matplotlib画图(二维图形)IPythonSympy用的不多pandas主要是数据分析,数据处理(比较重要)数据清洗,提供比较好的数据结构Dataframe(
spark
三岁清风
·
2024-01-03 21:18
maven
spring
mysql
python
当前IoT(物联网)的发展趋势
AI视觉与
边缘计算
的应用:什么是
边缘计算
:
边缘计算
也称为边缘外理,是一种将服务器放置在设备附近的网络技术,这有助于减少系统处理负载和解决数据传输延迟。
阿珍爱上了阿强,在一个有星星的夜晚
·
2024-01-03 18:54
IOT
物联网
人工智能
简述
spark
的架构与作业提交流程
1.首先
spark
在yarn下的作业提交分两种,一种是yarn-cluster模式,一种是yarn-client模式。
scott_alpha
·
2024-01-03 18:48
【
Spark
精讲】RDD缓存源码分析
面试题:cache后面能不能接其他算子,它是不是action操作?能,不是action算子。源码解析RDD调用cache或persist之后,会指定RDD的缓存级别,但只是在成员变量中记录了RDD的存储级别,并未真正地对RDD进行缓存。只有当RDD计算的时候才会对RDD进行缓存。以HadoopRDD为例overridedefcompute(split:Partition,context:TaskC
话数Science
·
2024-01-03 18:08
Spark
Spark精讲
大数据
spark
大数据
【
Spark
精讲】
Spark
SQL Join选择逻辑
Spark
SQLJoin选择逻辑先看JoinSelection的注释Ifitisanequi-join,wefirstlookatthejoinhintsw.r.t.thefollowingorder:
话数Science
·
2024-01-03 18:37
大数据
Spark
Spark精讲
spark
大数据
面试
Spark
Streaming + Flume
Push,指的是Flume主动push数据给
Spark
Streaming。Pull,指的是
Spark
Streaming主动从Flume拉取数据。
歌哥居士
·
2024-01-03 18:53
Spark
分区器HashPartitioner和RangePartitioner/全局排序
Spark
分区器 在
Spark
中分区器直接决定了RDD中分区的个数,RDD中每条数据经过Shuffle过程属于哪个分区以及Reduce的个数。
K. Bob
·
2024-01-03 18:34
Spark
【大数据面试知识点】分区器Partitioner:HashPartitioner、RangePartitioner
Spark
HashParitioner的弊端是什么?
话数Science
·
2024-01-03 18:02
大数据
Spark
面试
大数据
spark
面试
Scala - 反射动态创建方法
有时候我们想定义一个字符串的方法,然后通过scala的动态创建class,然后反射调用方法,在很多情景下是在学有用的,比较动态自定义
spark
的mapParations,当然了,每个人的需求都不一样,但是底层原理是一样的
kikiki2
·
2024-01-03 17:07
大数据系列之:读取parquet文件统计数据量
大数据系列之:读取parquet文件统计数据量一、
Spark
读取parquet文件统计数据量二、parquet-tools统计parquet文件数据量三、实际应用案例一、
Spark
读取parquet文件统计数据量首先
最笨的羊羊
·
2024-01-03 16:49
日常分享专栏
大数据系列
读取parquet文件
统计数据量
玩转贝启科技BQ3588C开源鸿蒙系统开发板 —— 开发板详情与规格
Bearkey-官网1.开发板详情RK3588核心板是一款由贝启科技自主研发的基于瑞芯微RK3588AI芯片的智能核心板,该核心板性能强劲、接口丰富,可以广泛应用于ARM电脑、AR/VR、智能座舱、智慧大屏、
边缘计算
蓝天居士
·
2024-01-03 14:44
开发板
harmonyos
开发板
RK3588
推荐一个小孩儿学编程的App
code
spark
嗯嗯,当然这个软件本质上还是一个游戏,但是和其他游戏的区别在于它可以把我们的编程思想放到小孩玩游戏的过程当中。
花生草
·
2024-01-03 14:03
使用UDF扩展
Spark
SQL
Apache
Spark
是一个强大的分布式计算框架,
Spark
SQL是其一个核心模块,用于处理结构化数据。虽然
Spark
SQL内置了许多强大的函数和操作,但有时可能需要自定义函数来处理特定的数据需求。
晓之以理的喵~~
·
2024-01-03 12:08
Spark
spark
sql
大数据
性能优化:
Spark
SQL中的谓词下推和列式存储
Apache
Spark
是一个强大的分布式计算框架,
Spark
SQL是其一个核心模块,用于处理结构化数据。
晓之以理的喵~~
·
2024-01-03 12:02
Spark
性能优化
spark
sql
大数据实时项目必备技能二:kafka有话说
导读:Kafka是由LinkedIn开发并开源的分布式消息系统,因其分布式及高吞吐率而被广泛使用,现已与ClouderaHadoop,ApacheStorm,Apache
Spark
集成。
栀子花_ef39
·
2024-01-03 11:05
边缘计算
和云计算的关系
边缘计算
实际上属于一种分布式计算,利用靠近数据源的边缘地带来完成的运算程序,而不需要将大量数据上传到云端。
边缘计算
的运算既可以在大型运算设备内完成,也可以在中小型运算设备、本地端网络内完成。
守正待
·
2024-01-03 10:01
边缘计算
边缘计算和云计算
Application Scenarios of Edge Computing——
边缘计算
的应用场景
EdgecomputingisplayinganincreasingimportantroleinInternetofThingsandhasagreatnumberofapplicationscenarios.Inthisarticle,wewilltalkabouttheroleofedgecomputingbygivingseveralexamples.I、SmartCity1、SmartG
xingjiarong
·
2024-01-03 10:01
边缘计算
物联网
分布式
边缘计算与物联网
物联网
云计算
边缘计算
十大
边缘计算
基础设施管理解决方案提供商:为企业数字化转型保驾护航
“盘点:2022年十大
边缘计算
基础设施管理解决方案提供商转载”随着数字化时代的到来,数据的产生和处理量呈现爆炸式增长,传统的集中式计算已经难以满足人们对计算效率的需求,
边缘计算
作为一种新型计算模式应运而生
百度_开发者中心
·
2024-01-03 10:00
程序人生
【
边缘计算
+云计算】
云计算
边缘计算
首先,
边缘计算
和云计算,是属于两个层面的概念,实际上应用领域并不相同。从原理上来看:
边缘计算
是指在数据源头的附近,采用开放平台,就近直接提供最近端的服务。
trireal仇
·
2024-01-03 10:00
Nvidia
边缘计算
云计算
人工智能
一文了解
边缘计算
与云计算
这就是为什么许多企业使用
边缘计算
部署AI应用,
边缘计算
边缘计算社区
·
2024-01-03 10:59
云计算
边缘计算
人工智能
新书推荐 | 《
边缘计算
技术与应用》
书籍简介
边缘计算
被公认为一项关键技术,可为广泛的领域提供创新服务,包括运营商,基础架构所有者,技术领导者,应用程序以及内容提供商,创新者,创业公司等等。
weixin_37097605
·
2024-01-03 10:59
人工智能
python
编程语言
大数据
java
云计算与
边缘计算
文章目录云计算概念云产生背景云四种模式云计算的应用场景
边缘计算
边缘计算
优势
边缘计算
解决堵车问题
边缘计算
VS云计算博文配套视频课程:人工智能、区块链、物联网、云计算(1课四通免费课程)云计算概念云计算时一种按使用量付费的模式
lsqzedu
·
2024-01-03 10:50
前沿技术分享
云计算
边缘计算
大数据
物联网
人工智能
云计算中的
边缘计算
技术及其应用
章节一:云计算和
边缘计算
的简介随着互联网的发展,数据中心的规模不断扩大,云计算也成为了越来越受欢迎的计算模式。但是,云计算存在着一些问题,比如延迟较高,网络瓶颈,数据隐私和安全性等等。
小正太浩二
·
2024-01-03 10:12
云计算
边缘计算
人工智能
Spark
之Adaptive Query Execution
文章目录AdaptiveQueryExecutionCoalescingPostShufflePartitionsSplitingskewedshufflepartitionsConvertingsort-mergejointobroadcastjoinConvertingsort-mergejointoshuffledhashjoinOptimizingSkewJoin(forsore-merg
zincooo
·
2024-01-03 09:16
Spark
spark
大数据
分布式
【
Spark
精讲】
Spark
SQL的RBO与CBO
Spark
SQL核心:Catalyst
Spark
SQL的核心是Catalyst查询编译器,它将用户程序中的SQL/Dataset/DataFrame经过一系列操作,最终转化为
Spark
系统中执行的RDD
话数Science
·
2024-01-03 09:45
大数据
Spark
Spark精讲
spark
大数据
【
Spark
精讲】记一个
Spark
SQL引擎层面的优化:SortMergeJoinExec
Spark
SQL的Join执行流程如下图所示,在分析不同类型的Join具体执行之前,先介绍Join执行的基本框架,框架中的一些概念和定义是在不同的SQL场景中使用的。
话数Science
·
2024-01-03 09:44
Spark精讲
大数据
Spark
spark
大数据
Spark
大数据分析与实战笔记(第二章
Spark
基础-02)
文章目录每日一句正能量章节概要2.2搭建
Spark
开发环境2.2.1环境准备2.2.2
Spark
的部署方式2.2.3
Spark
集群安装部署一、
Spark
下载二、
Spark
安装三、环境变量配置2.2.4
Spark
HA
想你依然心痛
·
2024-01-03 09:14
#
Spark大数据分析与实战
spark
数据分析
笔记
2024.1.2
Spark
简介,架构,环境部署,词频统计
目录一.
Spark
简介二.
Spark
框架模块三.环境准备3.1
Spark
Local模式搭建3.2通过Anaconda安装python3环境3.3Py
Spark
库安装四.
Spark
集群模式架构介绍五.pycharm
白白的wj
·
2024-01-03 09:41
spark
大数据
分布式
hadoop
数据仓库
python
Spark
一:
Spark
介绍、技术栈与运行模式
一、
Spark
简介
Spark
官网https://
spark
.apache.org/1.1
Spark
是什么
Spark
是一种通用的大数据计算框架,是基于RDD(弹性分布式数据集)的一种计算模型。
eight_Jessen
·
2024-01-03 09:11
spark
spark
大数据
分布式
Spark
导入报错:object security is not a member of package org.apache.kafka.common
引言 build
spark
里自带的示例项目时报了这样一个错:objectkafkaisnotamemberofpackageorg.apache,排查后发现是因为添加的jar依赖里没有kafka这一项,
夜半罟霖
·
2024-01-03 09:40
spark
apache
kafka
Spark
之Dynamic Resource Allocation
文章目录DynamicResourceAllocation请求策略移除策略移除存在的问题相关参数DynamicResourceAllocation
Spark
提供一种基于负载使用情况来动态调整application
zincooo
·
2024-01-03 09:39
Spark
spark
大数据
分布式
Hive/
Spark
SQL中UDF/UDTF/UDAF的含义、区别、有哪些函数
Hive官网:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-Built-inTable-GeneratingFunctions(UDTF)1.UDF(User-DefinedFunction)含义即用户定义函数,UDF用于处理一行数据并返回一个标量值(单个值),这个值可以是
TRX1024
·
2024-01-03 08:39
hive
hadoop
数据仓库
Hive/
Spark
SQL中Map、Array的基本使用和转换
一、Map1.构建语法:map(key1,value1,key2,value2,…)说明:根据输入的key和value对构建map类型-->1.一般创建方法selectmap('key1_name','张三','key2_age',20)asmap_col--结果:{"key1_name":"张三","key2_age":"20"}-->2.根据SQL查询结果构建mapselectmap('k_n
TRX1024
·
2024-01-03 08:09
hive
hadoop
数据仓库
Spark
解决构建倒排索引问题的步骤
相比于MapReduce,采用
spark
解决问题则简单得多:用户无需受限于(MapReduce中的)Mapper、Combiner和Reducer等组件要求的固定表达方式,而只需将解决方案翻译成
Spark
皮皮杂谈
·
2024-01-03 08:26
【kettle】pdi/data-integration 集成kerberos认证连接hive或
spark
thriftserver
spark
thriftserver本质就是通过hivejdbc协议连接并运行
spark
sql任务。二、思路kettle中可以使用js调用java类的方法。
lisacumt
·
2024-01-03 08:37
hive
spark
hadoop
计算机毕业设计吊打导师hadoop+
spark
+hive知识图谱医生推荐系统 医生数据分析可视化大屏 医生爬虫 医疗可视化 医生大数据 机器学习 大数据毕业设计
,使用高德地图解析地理位置,并将结果转入.csv文件同时上传到hdfs文件系统;3.使用hive建库建表,导入.csv数据集;4.一半指标使用离线数仓hive_sql分析,一半指标使用实时数仓实时计算
Spark
计算机毕业设计大神
·
2024-01-03 07:53
上一页
26
27
28
29
30
31
32
33
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他