E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
********Spark
Spark
的简介
1.
spark
是一门大规模数据处理的同一分析引擎.2.
Spark
可以对任意类型的数据进行自定义计算,结构化,半结构化,非结构化的数据都可以进行处理.3.Hadoop
Spark
基础平台,包含计算,存储,调度纯计算工具
一只不起眼的猪
·
2023-10-30 08:40
spark
spark
集群配置
目录1.集群部署规划2.安装
Spark
3.文件配置4.分发文件5.启动集群6.查看集群1.集群部署规划表1-1集群部署规划主机名masterslave1slave2HDFSNameNodeDataNodeSecondaryNameNodeDataNodeDataNodeYARNResourceManagerNodeManageNodeManageNodeManager
Spark
MasterWork
EsmeZhao
·
2023-10-30 08:39
Spark
spark
spark
安装配置
目录1.准备工作2.下载
spark
-3.1.1-bin-hadoop2.7和scala-2.12.13并解压3.配置环境变量4.配置文件$
SPARK
_HOME/conf/
spark
-env.sh6.配置
小田月朔一
·
2023-10-30 08:39
#
spark
spark
scala
Spark
系列之
Spark
启动与基础使用
title:
Spark
系列第三章
Spark
启动与基础使用3.1
Spark
Shell3.1.1
Spark
Shell启动安装目录的bin目录下面,启动命令:
spark
-shell$
SPARK
_HOME/bin
落叶飘雪2014
·
2023-10-30 08:09
Spark
数据计算
Spark
大数据
spark
环境配置
下载完成后进行解压:tar-zxvf
spark
-2.1.1.tgz#简短的名字易于操作mv
spark
-2.1.2-bin-hadoop2.7.
Zx-Deere
·
2023-10-30 08:39
spark
spark
大数据
spark
spark
Spark
可以将Hadoop集群中的应用在内存中的运行速度提升100倍,甚至能够将应用在磁盘上的运行速度提升10倍。
haobu枳
·
2023-10-30 08:07
spark
ajax
javascript
Azure - 机器学习:使用 Apache
Spark
进行交互式数据整理
目录本文内容先决条件使用Apache
Spark
进行交互式数据整理Azure机器学习笔记本中的无服务器
Spark
计算从AzureDataLakeStorage(ADLS)Gen2导入和整理数据从AzureBlob
TechLead KrisChang
·
2023-10-30 07:50
人工智能
azure
机器学习
人工智能
microsoft
真实大数据简历模版(一)【大数据-4年经验】在线教育
抗压能力强,能自我激励,善于沟通与团队协作3.具备扎实的Java相关知识,熟练使用Java和Scala语言编程4.掌握
Spark
及其组件
Spark
Core、
Spark
SQL、
Spark
Streaming
大模型Maynor
·
2023-10-30 03:25
#
大数据面试辅导
大数据
近期学习收藏
BookmarksBookmarks收藏夹栏百度一下,你就知道华力-李天鹏Py
Spark
Spark
Context-Py
Spark
教程|编程字典(61条消息)
Spark
读取csv文件操作,option参数解释
Tony-甲
·
2023-10-30 01:11
学习
hive
spark
Nebula Importer 数据导入实践
有大而全的NebulaExchange,小而精简的NebulaImporter,还有为
Spark
/Flink引擎提供的Nebula
Spark
Connector和NebulaFlinkConnector。
NebulaGraph
·
2023-10-29 20:21
Spark
新特性与核心概念
一、
Spark
shuffle(1)Map和Reduce在shuffle过程中,提供数据的称之为Map端(ShuffleWrite),接受数据的称之为Redeuce端(ShuffleRead),在
Spark
吗喽也是命
·
2023-10-29 20:53
spark
大数据
分布式
基于Kubernetes的
Spark
集群部署实践
2019独角兽企业重金招聘Python工程师标准>>>
Spark
是新一代分布式内存计算框架,Apache开源的顶级项目。
weixin_34414196
·
2023-10-29 19:19
大数据
ui
5g
k8s部署
spark
集群
-twyx/
spark
:2.4.42、推送镜像到镜像仓库进入harbor界面,项目-新建项目-新建wyxx项目dockertagdc45b940369710.0.3.47:5000/wyx/
spark
:
牾桡
·
2023-10-29 19:48
spark
kubernetes
docker
基于k8s搭建
spark
1、安装k8s集群2、基于standalone模式搭建
spark
集群helmrepoaddmy-repohttps://charts.bitnami.com/bitnamihelminstallmy-releasemy-repo
Rory602
·
2023-10-29 19:48
大数据
spark
在 Nebula K8s 集群中使用 nebula-
spark
-connector 和 nebula-algorithm
Python微信订餐小程序课程视频https://edu.csdn.net/course/detail/36074Python实战量化交易理财系统https://edu.csdn.net/course/detail/35475本文首发于NebulaGraphCommunity公众号解决思路解决K8s部署NebulaGraph集群后连接不上集群问题最方便的方法是将nebula-algorithm/n
洛蕾
·
2023-10-29 19:48
计算机
spark
big
data
大数据
计算机
kubernetes 部署
spark
集群
创建DockerFile文件FROMjava:openjdk-8-jdkENVhadoop_ver2.8.2ENV
spark
_ver2.4.4RUNmkdir-p/optADDhadoop-${hadoop_ver
itcast_xiaohuer
·
2023-10-29 19:17
k8s
kubernetes
spark
容器
k8s工作总结1:
spark
原生支持k8s
当前
spark
支持k8s有三种方式,第一种是以standalone的方式部署在k8s集群中,资源由
spark
自己管理,第二种是
spark
原生支持k8s,此时k8s相当于是yarn的作用,用户在使用上与standalone
arlen_chen
·
2023-10-29 19:45
k8s
云原生
【
Spark
】配置参数关系-重要
并行度数量并行度指所有Executor可以同时执行的Task数,每个Executor中的一个Core(线程,虚拟核数)同时只能执行一个Task,所以最大并行度=Executor数量*每个Executor的Core数;eg:资源配置10个Executor节点,每个节点2个Core,那么同一时间可以并行计算的task数为20,如果RDD有100个分区,那么需要5轮计算完毕,如果RDD有2个分区,那么计
sdbhewfoqi
·
2023-10-29 19:44
Hive
&
Sql
&
Spark
spark
大数据
分布式
基于Headless构建高可用
spark
+py
spark
集群
1、创建HeadlessService服务Headless服务类型并不分配容器云虚拟IP,而是直接暴露所属Pod的DNS记录。没有默认负载均衡器,可直接访问PodIP地址。因此,当我们需要与集群内真实的PodIP地址进行直接交互时,Headless服务就很有用。其中Service的关键配置如下:clusterIP:None,不让其获取clusterIP,DNS解析的时候直接走pod。---kind
Moutai码农
·
2023-10-29 19:13
spark
大数据
分布式
ALS算法在菜品智能推荐系统的应用
什么是
spark
?什么是ALS?计算公式整体模型
Wzideng
·
2023-10-29 19:37
科研--论文--实验
神仙参考文献!!!
1024程序员节
矩阵
线性代数
java
算法
ALS算法原理
它已经集成到
Spark
的Mllib库中,使用起来比较方便。从协同过滤的分类来说,ALS算法属于User-ItemCF,也叫做混合CF。它同时考虑了User和Item两个方面。
闲云野鹤~~~
·
2023-10-29 19:37
java
als算法参数_
Spark
2.0协同过滤与ALS算法介绍
ALS矩阵分解一个的打分矩阵A可以用两个小矩阵和的乘积来近似,描述一个人的喜好经常是在一个抽象的低维空间上进行的,并不需要把其喜欢的事物一一列出。再抽象一些,把人们的喜好和电影的特征都投到这个低维空间,一个人的喜好映射到了一个低维向量,一个电影的特征变成了纬度相同的向量,那么这个人和这个电影的相似度就可以表述成这两个向量之间的内积。我们把打分理解成相似度,那么“打分矩阵A(m*n)”就可以由“用户
鲁舒天
·
2023-10-29 19:36
als算法参数
Spark
踩坑记——初试
Spark
踩坑记——初试[TOC]
Spark
简介整体认识Apache
Spark
是一个围绕速度、易用性和复杂分析构建的大数据处理框架。
sysmedia
·
2023-10-29 18:51
spark
spark
Scala中的模式匹配
普通的模式匹配语句如下:valarr=Array("
spark
","storm","flink","hadoop")valname=arr(scala.util.Random.nextInt(arr.length
叩丁狼教育
·
2023-10-29 15:18
【无标题】Linux root 环境变量配置错,导致无法使用常规命令
在安装
spark
时候需要配置环境变量,因为参数没写正确,导致root的用户无法使用lllsvicat等一系列命令。最后按照一个博主的方法解决问题了。
斯蒂芬挥
·
2023-10-29 12:45
linux
ubuntu
全网最详细的大数据架构搭建配置及说明文档
版本兼容JDK1.8.0_211ZooKeeper3.4.14Hadoop3.2.1Hive3.1.2HBase2.2.1Scala2.13.1
Spark
2.4.4MySQL5.7.28基本配置修改ip
骇客567
·
2023-10-29 10:52
Linux
大数据
架构
spark
day06 + day07 + day08
目录1.
spark
SQL基本信息1.什么是
spark
sql2.strucrureddata3.
spark
sql特征4.概述1.
spark
sql性能比
spark
rdd高2.
Spark
SQLincluding3
姚circle
·
2023-10-29 08:15
spark
spark
大数据
分布式
Spark
系列 - 实时数仓之近1小时各个广告点击量实战(三)
为了资源共用,我们的数据和上一篇文章一样,这个实战案例的技术和思想在现实开发的需求中还是比较常见的,以广告为例子,需求是:需求:统计各广告最近1小时内的点击量趋势一、Kafka消费主题的数据[root@cdh101kafka]#bin/kafka-console-consumer.sh--bootstrap-servercdh101:9092,cdh102:9092,cdh103:9092--
小飞牛_666
·
2023-10-29 07:57
云服务器搭建
Spark
集群
文章目录1.Local模式1.1安装local模式1.2命令行工具1.3提交本地应用2.Standlone模式2.1集群配置2.2修改配置文件2.3启动集群与停止集群2.4提交应用到集群环境2.5提交应用的参数详细说明2.6配置历史服务2.7配置高可用(HA)3.Yarn模式(常用)3.1集群配置3.2安装Yarn模式3.3配置历史服务器3.4关于配置高可用的相关说明|3.5停止集群1.Local
几窗花鸢
·
2023-10-29 07:29
hadoop
Spark
Scala
服务器
spark
Spark
实战第二版(涵盖
Spark
3.0)
关注公众号:登峰大数据,阅读
Spark
实战第二版(完整中文版),系统学习
Spark
3.0大数据框架!如果您觉得作者翻译的内容有帮助,请分享给更多人。您的分享,是作者翻译的动力!
登峰大数据
·
2023-10-29 06:52
随想
用Java8的Steam有一段时间了,虽然理解的还不深,但是在写
Spark
任务的时候,看到各种RDD算子就莫名的熟悉,用的还算自觉比较称手。
日更专用小马甲
·
2023-10-29 05:07
nodejs+vue+elementui+express酒店管理系统
会员用户登录后具有客房预定、信息查询等功能,管理者可以通过基于
spark
的酒店管理系统,全面掌握酒店客房的各项状态,会员通过系统查询酒店客房
QQ_1963288475
·
2023-10-29 05:40
vue.js
elementui
express
spring
boot
javascript
Mac Vagrant box Mesos 集群管理搭建
这些应用包括Hadoop、
Spark
、Kafka、ElasticSearch。还可配合框架Marathon来管理大规
瓦哥架构实战
·
2023-10-29 03:59
mesos
IDEA2022 配置
spark
开发环境
本人强烈建议在linux环境下学习
spark
!!!
小白兔奶糖ovo
·
2023-10-29 02:35
spark
大数据
分布式
IDEA下使用maven配置
Spark
开发环境
IDEA下使用maven配置
Spark
开发环境1、安装Java2、配置环境变量3、配置Hadoop环境4、安装Scala插件5、配置maven4、
Spark
编程
Spark
测试使用到的软件安装包:https
听海的石头
·
2023-10-29 02:32
spark
java
idea
agx 安装ros opencv_【环境踩坑002】MIT kimera-VIO-ROS 之opencv,python报错
kexueshangwang的方法,此文也不会出现hhhhh(我kexueshangwang后网速还是巨差无比)欢迎各位给我介绍kexueshangwang的供应商:DMITkimera-VIO-ROSgithub网址MIT-
SPARK
weixin_39646628
·
2023-10-28 22:36
agx
安装ros
opencv
dio
上传文件报错
运行报错
ubuntu 18.04 + Kimera slam 安装与demo测试
首先进行组件的安装一、Kimera-VIO安装参考文档:https://github.com/MIT-
SPARK
/Kimera-VIO/blob/master/docs/kimera_vio_install.md
dna葡萄糖
·
2023-10-28 22:05
ros学习
kimera-vio-ros编译记录
使用Eigen3.3.7以上版本,我用的是3.3.9,能解决很多问题我的系统是ubuntu18.04.5https://github.com/MIT-
SPARK
编译过程:一、各种依赖sudoapt-getinstallros-melodic-image-geometryros-melodic-pcl-rosros-melodic-cv-bridgesudoapt-getinstall
问题出现再研究
·
2023-10-28 22:05
语义SLAM
kimera-semantic编译记录
https://github.com/MIT-
SPARK
一、安装依赖1、sudoapt-getinstallpython-wstoolpython-catkin-toolsprotobuf-compilerautoconf2
问题出现再研究
·
2023-10-28 22:05
语义SLAM
kafka maven 依赖_py
spark
+ kafka 环境搭建
环境:win7+Anaconda3+py
spark
2.3.1+kafka1.0.1一,win7安装kafka(单机)1.下载压缩包Indexof/dist/kafka/1.0.1archive.apache.org2
weixin_39978276
·
2023-10-28 22:52
kafka
maven
依赖
kafka
maven没有下载
大数据Hadoop、Hive、Kafka、Hbase、
Spark
等框架面经
大数据组件学习路线:阶段1:学习绿色箭头的知识点;阶段2:学习红色箭头的知识点;阶段3:学习蓝色箭头的知识点;1Hadoop1.1Hadoop1.x与Hadoop2.x的区别1.2HDFS架构(1)NameNode(nn):存储文件的元数据,如文件名、文件目录结构、文件属性(生成时间、副本数、文件权限)、以及每个文件的块列表和块所在的DataNode;(2)DataNode:在本地文件系统存储文件
For Coding
·
2023-10-28 21:50
大数据
hadoop
hive
spark
flume
zookeeper
【大数据概述】Hadoop技术栈
Presto1.1.概述1.2.PrestoHive对比2.Hive2.1.Hive概述2.2.Hive与关系型数据库关系3.Hadoop3.1.概述3.2.Hadoop生态技术3.2.1.概述3.2.2.架构4.
Spark
4.1
vk-fengz
·
2023-10-28 21:17
数据库
数据仓库
大数据
处理大数据的基础架构,OLTP和OLAP的区别,数据库与Hadoop、
Spark
、Hive和Flink大数据技术
处理大数据的基础架构,OLTP和OLAP的区别,数据库与Hadoop、
Spark
、Hive和Flink大数据技术2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发
冰露可乐
·
2023-10-28 21:45
数据挖掘
国考
大数据
数据库
kafka
网络警察
国考
spark
读写minio文件代码实践
它支持与
Spark
\Flink等技术方案进行整合,并且通过S3协议实现数据查询的下沉,这让大数据的存储与查询分离提供了事实依据。
Moutai码农
·
2023-10-28 21:30
spark
大数据
分布式
Minio
推荐系统-基于物品协同过滤算法代码实现
1、简介当前
Spark
没有像mahout那样,严格区分基于物品的协同过滤推荐(ItemCF)和基于用户的协同过滤推荐(UserCF),只有基于模型的协同过滤推荐算法ALS(model-basedCF)。
Moutai码农
·
2023-10-28 21:29
大数据
推荐系统
算法
推荐算法
大数据
spark
一名大数据新手,如何成为大数据工程师?附上学习路线
大部份的讨论似乎都仅止于怎么搜集大量的数据,然后用个工具(hadoop/
spark
)后就会马上变出商机和钱来。
juan333
·
2023-10-28 21:25
Hadoop
大数据开发
程序员
大数据
编程语言
程序员
大数据开发
spark
Spark
学习笔记01-基础
本文基于
Spark
2.4.1进行演示,相关代码可以在我的Github上看到。
GreenWang
·
2023-10-28 21:04
Spark
SQL综合案例-省份维度的销售情况统计分析
每个省份的销售额统计②TOP3销售省份中,有多少家店铺日均销售额1000+③TOP3省份中,各个省份的平均单价④TOP3省份中,各个省份的支付类型比例(2)要求①将需求结果写出到mysql②将数据写入到
Spark
OnHive
吗喽也是命
·
2023-10-28 18:19
spark
新书《图算法——Apache
Spark
和Neo4j实战》
Amazon上正在预售,不过买英文原版书还是太贵了好在Neo4j官网上也放出了电子版,填写个人信息即可下载,快戳这里一睹为快吧GraphAlgorithms:PracticalExamplesinApache
Spark
andNeo4j
yahal
·
2023-10-28 18:14
Pycharm调用Py
spark
API配置,小记
1、py
spark
安装参见http://blog.csdn.net/zjjfjcs/article/details/77748726注意:需要配置环境变量:$sudovim/etc/profile在文件末尾添加
fengjcs
·
2023-10-28 18:02
Spark
pyspark配置
pycharm
上一页
54
55
56
57
58
59
60
61
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他