E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark集群部署yarn
Spark
学习笔记五:
Spark
资源调度和任务调度
一、Stage
Spark
任务会根据RDD之间的依赖关系,形成一个DAG有向无环图,DAG会提交给DAGScheduler,DAGScheduler会把DAG划分相互依赖的多个stage,划分stage的依据就是
开发者连小超
·
2024-01-26 04:42
Apache Flink1.13.x HA
集群部署
Flink简介Flink起源于Stratosphere项目,Stratosphere是在2010~2014年由3所地处柏林的大学和欧洲的一些其他的大学共同进行的研究项目,2014年4月Stratosphere的代码被复制并捐赠给了Apache软件基金会,参加这个孵化项目的初始成员是Stratosphere系统的核心开发人员,2014年12月,Flink一跃成为Apache软件基金会的顶级项目。在德
willops
·
2024-01-26 04:52
bigdata
hadoop
大数据
flink1.13.0 环境搭建
#flink部署1.standalone模式2.
yarn
模式session-cluster模式job-cluster模式3.k8s模式注:
yarn
模式需要依赖hadoop环境,搭建请参考:https:/
AinUser
·
2024-01-26 04:50
flink
hadoop
flink
yarn
k8s
standalone
py
spark
数据类型转换_apache
spark
-将py
spark
字符串转换为日期形式
apache
spark
-将py
spark
字符串转换为日期形式我有一个日期py
spark
数据框,其中的字符串列格式为df.select(to_date(df.STRING_COLUMN).alias('new_date
weixin_39860201
·
2024-01-26 04:39
pyspark
数据类型转换
Py
Spark
-DataFrame各种常用操作举例--转载
最近开始接触py
spark
,其中DataFrame的应用很重要也很简便。因此,这里记录一下自己的学习笔记。详细的应用可以参看py
spark
.sqlmodule。
zuoseve01
·
2024-01-26 02:10
pyspark
Py
Spark
SQL 入门(概述、DataFrame操作)
#博学谷IT学习技术支持#第一章快速入门1.1什么是
Spark
SQL
Spark
SQL是
Spark
的一个模块,用于处理海量结构化数据第一、针对结构化数据处理,属于
Spark
框架一个部分第二、抽象数据结构:
y鱼鱼
·
2024-01-26 02:10
大数据
大数据
spark
Py
spark
读 DataFrame 的使用与基本操作
一、安装基于mac操作系统安装jdkjdk下载地址安装py
spark
pipinstallpy
spark
二、读取HDFS文件读json注意,如果是多行的json,需要用“multiLine”模式,否则会报错
苏学算法
·
2024-01-26 02:10
spark
sql
hadoop
spark
sql
pyspark
spark
学习_rdd常用操作
【
spark
API函数讲解详细】https://www.iteblog.com/archives/1399#reduceByKey[重要API接口,全面】http://
spark
.apache.org/
weixin_30852367
·
2024-01-26 02:40
5g
python
scala
py
spark
学习_wordcount
#统计文件中每个字母出现次数#第一版rdd文件行类型:Aaron,OperatingSystem,100frompy
spark
import
Spark
Conf,
Spark
Contextconf=
Spark
Conf
heiqizero
·
2024-01-26 02:09
spark
spark
python
py
spark
学习_RDD转为DataFrame
#方法1:反射机制推断RDD模式people.txtTom12Jack13Janny14frompy
spark
.sqlimport
Spark
Session,Row
spark
=
Spark
Session.builder.getOrCreate
heiqizero
·
2024-01-26 02:09
spark
spark
python
py
spark
学习-RDD转换和动作
#RDD创建#1.parallelize方法:创建RDD,参数为list,返回RDDsc.parallelize(param:list)#demosc.parallelize(['tom','jack','black'])#2.textFile方法:读取文件,创建RDD,参数为hdfs文件地址或者本地文件地址,返回RDDsc.textFile(param:filepath)#demosc.text
heiqizero
·
2024-01-26 02:39
spark
spark
python
Py
Spark
—DataFrame笔记
本人博客园同篇文章:Py
Spark
—DataFrame笔记 DataFrame基础+示例,为了自查方便汇总了关于Py
Spark
-dataframe相关知识点,集合了很多篇博客和知乎内容,结合了自身实践
了无痕1314
·
2024-01-26 02:38
PySpark
spark
大数据
【
Spark
】py
spark
基于DataFrame使用MLlib包
另外,根据
Spark
文档,现在主要的
Spark
机器学习API是
spark
.ml包中基于DataFrame的一套模型。1ML包的介绍从顶层上看,ML包主要包含三大抽象类:转换器、预测器和工作流。
beautiful_huang
·
2024-01-26 02:37
Spark
spark
Py
Spark
常见操作
DataFrame创建1、RDD转换DataFrame首先创建一个rdd对象frompy
spark
.sqlimport
Spark
Sessioncolumns=["language","users_count
kang0709
·
2024-01-26 02:37
Spark
大数据
机器学习
py
spark
学习_dataframe常用操作_01
1.创建DataFrame本文使用DataFrame通过读取json文件获取数据,代码如下:frompy
spark
.sqlimport
Spark
Session
spark
=
Spark
Seesion.builder.getOrCreate
heiqizero
·
2024-01-26 02:37
spark
spark
python
使用CDH的api接口对cdh服务进行滚动重启
写了个py脚本实现此功能importtimeimportrequestsimportjsonimportsys#可操作的服务列表server_list=['hdfs','
yarn
','zookeeper
Mumunu-
·
2024-01-26 01:32
大数据
python
如何快速搭建springboot+前后端分离(vue),多商户客户端实现微信小程序+ios+app使用uniapp(一处编写,处处编译)
同时支持单机部署、
集群部署
,用户与店铺范围动态定位,中小商户企业可根据业务动态扩容。
you来有去
·
2024-01-26 00:13
spring
boot
vue.js
微信小程序
放大镜插件 Ti-Zoom
installnpminstallti-zoom//or
yarn
addti-zoom欢迎交流多提建议[握手]详细文档来源
泥巴树 Tui.TANCE
·
2024-01-25 23:56
开源
前端
javascript
github
微信
推荐一款 vue3组件 ti-element-vue
yarn
addti-element-vuenpmiti-element-vue已有企业项目在使用,组件库迭代升级。希望能帮你快速实现,让写代码成为简单的事情。
泥巴树 Tui.TANCE
·
2024-01-25 23:26
开源
前端
vue.js
javascript
github
CDH浏览器安装流程
然后根据自己安装得版本来进行选择选择对应版本4然后等待安装等待配置5出现问题根据提示进行操作进行相关设置(安装得时候,一般做了配置)6然后下一步,然后选择自定义安装,先安装最基本得几个组件:HDFSHbaseZooKeePer
YARN
7
PunkP
·
2024-01-25 23:41
Day 1322:架构师训练营学习总结(w13)
本周主要讲了
Spark
流计算、数据分析和机器学习。
Spark
的主要特点是DAG切分多阶段计算、内存存储中间结果、RDD的编程模型。RDD是
Spark
的核心概念。
kafkaliu
·
2024-01-25 22:18
做一个真正会聊天的人
当你正在纠结(struggleto)要和别人说什么的时候,有些人却有先天的本领(anaturalability)可以发起有趣而且吸引人的讨论话题(
spark
upinterestingandengagingtopic
英语学习资料
·
2024-01-25 22:13
毕业设计——基于
spark
的电影推荐系统,包括基于ALS、LFM的离线推荐、实时推荐
项目以推荐系统建设领域知名的经过修改过的MovieLens数据集作为依托,以电影网站真实业务数据架构为基础,包含了离线推荐与实时推荐体系,综合利用了协同过滤算法以及基于内容的推荐方法来提供混合推荐。提供了从前端应用、后台服务、算法设计实现、平台部署等多方位的闭环的业务实现【用户可视化】:主要负责实现和用户的交互以及业务数据的展示,主体采用AngularJS2进行实现,部署在Apache服务上。【综
Python豆豆
·
2024-01-25 22:21
毕业设计指导及定制
课程设计
spark
大数据
大数据|
Spark
介绍
前文回顾:Hive和数据仓库目录为什么会有
Spark
Spark
的基本架构和组件主要体系结构和组件
Spark
集群的基本结构
Spark
系统的基本结构
Spark
应用程序的基本结构
Spark
程序运行机制⭐️
Spark
啦啦右一
·
2024-01-25 21:08
大数据与数据分析
#
大数据管理与分析笔记
大数据
spark
大数据技术之
Spark
Spark
概述1.1
Spark
是什么官方解释:
Spark
是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。
严同学正在努力
·
2024-01-25 21:38
大数据
spark
hadoop
apache
kafka
大数据开发之
Spark
(
spark
streaming)
第1章:
Spark
Streaming概述1.1
spark
streaming是什么
spark
streaming用于流式数据的处理。
Key-Key
·
2024-01-25 21:07
大数据
spark
分布式
年度案例大数据盘点之
Spark
篇
Spark
最新的特性以及功能2015年中
Spark
版本从1.2.1升级到当前最新的1.5.2,1.6.0版本也马上要进行发布,每个版本都包含了许多的新特性以及重要的性能改进,我会按照时间顺序列举部分改进出来
BAO7988
·
2024-01-25 21:06
大数据
大数据
spark
大数据开发之
Spark
(完整版)
第1章:
Spark
概述1.1什么是
spark
回顾:hadoop主要解决,海量数据的存储和海量数据的分析计算。
spark
是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。
Key-Key
·
2024-01-25 21:05
大数据
spark
分布式
弹性分布式数据集
hadoop
Tonemapping不够用了:Local Tonemapping方案总结
【U
Spark
le专栏】如果你深怀绝技,爱“搞点研究”,乐于分享也博采众长,我们期待你的加入,让智慧的火花碰撞交织,让知识的传递生生不息!
UWA
·
2024-01-25 21:21
厚积薄发
Unity优化
计算机图形学
实时渲染
游戏引擎
Hadoop on
Yarn
提交job失败:java.net.ConnectException:Connection refused
INFOorg.apache.hadoop.service.AbstractService:ServiceNodeManagerfailedinstateSTARTED;cause:org.apache.hadoop.
yarn
.exceptions.
Yarn
RuntimeException
Anthons
·
2024-01-25 20:58
Linux 安装 py
Spark
1、安装Java和Scale。1.1、Java参考Java安装运行1.2、Scale安装1)下载并解压官网地址:https://www.scala-lang.org/download/wgethttps://downloads.lightbend.com/scala/2.13.1/scala-2.13.1.tgztar-zxvfscala-2.13.1.tgzmvscala-2.13.1scala
兰叶书
·
2024-01-25 20:00
Linux
spakr 提交任务
当前集群支持3中集群管理Standalone(spak框架自身拥有能力)ApacheMesosHadoop
YARN
Kubernetes使用/
spark
-submit脚本提交任务,脚本后面可以接参数.
新鲜氧气
·
2024-01-25 19:55
大数据
#
scala
#
spark
scala
spark
大数据
spark
关联外部数据
importorg.apache.
spark
.rdd.RDDimportorg.apache.
spark
.
新鲜氧气
·
2024-01-25 19:54
#
spark
#
scala
大数据
spark
大数据
分布式
Spark
累加器LongAccumulator
Accumulator有两个性质:1、只会累加,合并即累加;2、不改变
Spark
作业懒执行的特点,即没有action操作触发job的情况下累加器的值有可能是初始值。o
新鲜氧气
·
2024-01-25 19:53
#
spark
#
scala
#
hadoop
spark
大数据
分布式
修改npm镜像源为淘宝镜像以及恢复
得到原本的镜像地址npmgetregistry>https://registry.npmjs.org/设成淘宝的npmconfigsetregistryhttp://registry.npm.taobao.org/
yarn
configsetregistryhttp
SnuggleE
·
2024-01-25 17:59
nodejs 快速创建web应用
yarn
构建第一步:
yarn
init初始化工程会生成一个packson.json文件{"name":"sample-nodejs","version":"1.0.0","main":"index.js"
Pure_Eyes
·
2024-01-25 17:50
nodejs
前端
javascript
json
hadoop 问题集
1.org.apache.hadoop.
yarn
.exceptions.InvalidAuxServiceException:TheauxService:mapreduce_shuffledoesnotexist
yarn
Pure_Eyes
·
2024-01-25 17:18
hadoop
大数据
分布式
YARN
高可用架构涉及常用功能整理
YARN
高可用架构涉及常用功能整理1.
yarn
的高可用系统架构和相关组件2.
yarn
的核心参数2.1常规配置2.2队列配置3.
yarn
常用命令3.1常用基础命令3.2常用运维命令4.app任务开发4.1
李姓门徒
·
2024-01-25 16:31
大数据
Yarn
大数据
yarn
py
spark
排雷
问题执行计算时,抛出异常:...java.lang.IllegalArgumentException:Unsupportedclassfilemajorversion57...经过查询,发现时py
spark
jar
_Rango_
·
2024-01-25 16:05
antd-pro升级了,新增的UmiJs是个什么玩意儿??
使用create-umi创建项目1、按照下列命令执行$mkdirmyapp&&cdmyapp$
yarn
createumi2、然后,选择需要的功能,要选择的按空格即可,我选择的是antddva选
石菖蒲_xl
·
2024-01-25 16:19
vue使用vite工具编译,一个极不好友好的错误提示
yarn
build时提示如下错识errorduringbuild:Error:[vite]:Rollupfailedtoresolveimport"..."
youwen21
·
2024-01-25 16:35
vue.js
javascript
前端
Flink1.17总结
1.Flink介绍1.Flink和
Spark
Streaming区别2.Flink分层API3.WordCount案例需求:写一个文本,统计出单词的个数1.使用flink批处理查看WordCountBatchDemo
asxyyjh
·
2024-01-25 14:29
大数据
flink
java
2020-04-27 解决Nodejs使用
yarn
安装vue-cli提示'vue' 不是内部或外部命令
查看指定的global目录中只有npm和
yarn
的执行文件,没有vue的执行文件,并且多了一个bin目录。查看bin目录中有vue.cmd文件尝试将该bin目录也加入到path下。
追寻1989
·
2024-01-25 13:34
深入 JavaScript 高级语法
JavaScript高级语法点击28.深拷贝、事件总线27.防抖和节流26.BOM、DOM、浏览器事件25.Cookie24.IndexedDB23.JSON、Storage22.包管理工具:npm、
yarn
卡列尼娜翠花
·
2024-01-25 13:07
JavaScript
javascript
前端
npm
json
es6
hadoop
集群部署
hadoop简介Hadoop是一个由Apache基金会所开发的分布式系统基础架构,是一个存储系统+计算框架的软件框架,主要解决海量数据存储与计算的问题,是大数据技术中的基石。Hadoop以一种可靠、高效、可伸缩的方式进行数据处理,用户可以在不了解分布式底层细节的情况下,开发分布式程序,用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。Hadoop的框架最核心的设计就是:HDFS和Ma
Cat God 007
·
2024-01-25 12:45
笔记
大数据
大数据
hdfs
hadoop集群规划部署
hadoop102hadoop103hadoop104HDFSNameNodeDataNodeDataNodeSecondaryNameNodeDataNode
YARN
NodeManagerResourceManagerNodeManagerNodeM
Snower_2022
·
2024-01-25 12:43
hadoop
hadoop
java
大数据
Vue对axios的封装及使用
中引用3、创建文件夹`http`,再创建文件`index.js`进行封装4、对封装的axios的接口的统一管理5、代码种对接口的调用概要封装axios让调用接口变得轻量、简单先安装axios通过npm或者
yarn
Jacob程序员
·
2024-01-25 11:44
大前端进阶
vue.js
前端
javascript
【node】关于npm、
yarn
、npx的区别与使用
文章目录npm(NodePackageManager):安装依赖运行脚本npx:执行项目依赖中的命令
yarn
:安装依赖eg.使用npx
yarn
install的作用npm(NodePackageManager
简单Janeee
·
2024-01-25 11:12
node.js
npm
前端
node.js
【hudi学习笔记】hudi基础教程-hudi表设计
一.hudi表设计在较高的层次上,用于写Hudi表的组件使用了一种受支持的方式嵌入到Apache
Spark
作业中,它会在支持DFS的存储上生成代表Hudi表的一组文件。
菜鸟老胡~
·
2024-01-25 09:13
技术学习
big
data
数据仓库
大数据
Hudi学习笔记4 - Hudi配置之
Spark
配置
Spark
DatasourceConfigs读配置配置项是否必须默认值配置说明as.of.instantYN/A0.9.0版本新增,时间旅行查询从哪儿开始,有两种格式的值:yyyyMMddHHmmss和
一见
·
2024-01-25 09:40
hudi
spark
spark
学习
笔记
上一页
20
21
22
23
24
25
26
27
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他