E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
RDD
查看 Robot Framework Library 的用户手册
查看RobotFrameworkLibrary的用户手册一、[PyPI官网](https://pypi.org)搜索目标库二、点击Introduction下的GitHub链接三、点击Keywo
rdD
ocumentation
Sally_xy
·
2024-01-14 00:06
RobotFramework
自动化测试
spark中
Rdd
依赖和SparkSQL介绍--学习笔记
1,
RDD
的依赖1.1概念
rdd
的特性之一相邻
rdd
之间存在依赖关系(因果关系)窄依赖每个父
RDD
的一个Partition最多被子
RDD
的一个Partition所使用父
rdd
和子
rdd
的分区是一对一(多对一
祈愿lucky
·
2024-01-13 23:17
大数据
spark
学习
笔记
uniapp 长按复制文字
{{text}}exportdefault{data(){return{text:'这是要被复制的文本'}},methods:{onLongPress(){uni.setClipboa
rdD
ata({data
qq_42431718
·
2024-01-13 22:09
开发语言
leetcode 动态规划(单词拆分)
139.单词拆分力扣题目链接(opensnewwindow)给定一个非空字符串s和一个包含非空单词的列表wo
rdD
ict,判定s是否可以被空格拆分为一个或多个在字典中出现的单词。
mingchen_peng
·
2024-01-13 22:53
动态规划
leetcode
leetcode
动态规划
算法
前端重置密码报错记录
后端接口也没有问题但后端收到的数据为空随后我又用postman测试了一下,把字段名改了一下发现了同样的错误,后端显示第一个字段为空,后两个有值这时在看一下前端数据发现了问题所在,就是后端的Passwo
rdD
to
mendianyu
·
2024-01-13 19:50
vue
MIS系统
算法训练营第四十六天|139.单词拆分 多重背包
classSolution{public:boolwordBreak(strings,vector&wo
rdD
ict){unordered_setwordS(wo
rdD
ict.begin(),wo
rdD
ict.end
啊就赵得柱
·
2024-01-13 15:56
算法
Spark原理——逻辑执行图
逻辑执行图明确逻辑计划的边界在Action调用之前,会生成一系列的
RDD
,这些
RDD
之间的关系,其实就是整个逻辑计划valconf=newSparkConf().setMaster("local[6]"
我像影子一样
·
2024-01-13 09:17
Spark
大数据
spark
大数据
Spark原理——物理执行图
物理图解决的其实就是
RDD
流程生成以后,如何计算和运行的问题,也就是如何把
RDD
放在集群中执行的问题问题二:如果要确定如何运行的问题,则需要先确定集群中有什么组件首先集群中物理元件就是一台一台的机器其次这些机器上跑的守护进程有两种
我像影子一样
·
2024-01-13 09:17
Spark
大数据
spark
大数据
Spark原理——总体介绍
newSparkConf().setMaster("local[6]").setAppName("wordCount_source")valsc=newSparkContext(conf)//2.创建数据集valtext
RDD
我像影子一样
·
2024-01-13 09:17
Spark
大数据
spark
大数据
RDD
算子——转换操作(Transformations )【map、flatMap、reduceByKey】
#spark-shellsc.parallelize(Seq(1,2,3)).map(num=>num*10).collect()#IDEA@TestdefmapTest():Unit={//1.创建
RDD
val
rdd
1
我像影子一样
·
2024-01-13 09:47
Spark
大数据
spark
大数据
Spark原理——运行过程
运行过程逻辑图是什么怎么生成具体怎么生成valtext
RDD
=sc.parallelize(Seq("HadoopSpark","HadoopFlume","SparkSqoop"))valsplit
RDD
我像影子一样
·
2024-01-13 09:44
Spark
大数据
spark
大数据
Spark---
RDD
持久化
文章目录1.
RDD
持久化1.1
RDD
Cache缓存1.2
RDD
CheckPoint检查点1.3缓存和检查点区别1.
RDD
持久化在Spark中,持久化是将
RDD
存储在内存中,以便在多次计算之间重复使用。
肥大毛
·
2024-01-13 07:40
scala
spark
大数据
spark
ajax
大数据
Spark---
RDD
依赖关系
文章目录1.1
RDD
依赖关系1.2血缘关系1.3依赖关系分类1.3.1窄依赖1.3.2宽依赖1.4
RDD
阶段划分和任务划分1.4.1
RDD
阶段划分1.4.2
RDD
任务划分1.1
RDD
依赖关系在Spark
肥大毛
·
2024-01-13 07:09
大数据
scala
spark
spark
ajax
javascript
Spark-
RDD
详解
SPARK–
RDD
1、
RDD
的介绍
RDD
弹性分布式数据集合是Spark中的一种数据类型,管理spark的内存数据[1,2,3,4]spark中还有dataframe,dataset类型拓展:开发中可以通过类的形式自定以数据类型同时还提供各种计算方法弹性可以对海量数据根据需求分成多份
中长跑路上crush
·
2024-01-13 07:09
Spark阶段
spark
大数据
分布式
Spark的内核调度
目录概述
RDD
的依赖DAG和StageDAG执行流程图形成和Stage划分Stage内部流程SparkShuffleSpark中shuffle的发展历程优化前的Hashshuffle经过优化后的HashshuffleSortshuffleSortshuffle
Sisi525693
·
2024-01-13 07:56
spark
大数据
分布式
力扣 | 139. 单词拆分
所以就要先选择目标字串,再选择wo
rdD
ictpublicbooleanwordBreak(Strings,Listwo
rdD
ict){//dp[i]:表示前i个字符组成的子串是否可以被wo
rdD
ict
molecule_jp
·
2024-01-13 02:02
算法学习
计算机基础
编程语言
leetcode
算法
数据结构
Spark中
Rdd
算子和Action算子--学习笔记
RDD
算子filter"""
rdd
.filter(f):根据f函数中的判断条件对
rdd
追踪的数据进行过滤保留条件为True对应的
rdd
数据"""frompysparkimportSparkContextsc
祈愿lucky
·
2024-01-12 23:24
大数据
spark
学习
笔记
Issue 762874: Security: off by one in TurboFan range optimization for String.indexOf
gitreset--ha
rdd
2da19c78005c75e0f658be23c28b473dd76b93bgclientsync-ftools/dev/v8gen.pyx64.release编辑out.gn
cnitlrt
·
2024-01-12 22:24
Leetcode 414.第三大的数
原题链接:Leetcode414.ThirdMaximumNumberGivenanintegerarraynums,returnthethi
rdd
istinctmaximumnumberinthisarray.Ifthethirdmaximumdoesnotexist
cwtnice
·
2024-01-12 22:22
每日一题
leetcode
算法
ssh使用的一些问题
receivepacket:type51debug1:Authenticationsthatcancontinue:publickey,gssapi-keyex,gssapi-with-mic,passwo
rdd
ebug1
CStart
·
2024-01-12 12:41
Spark避坑系列(三)(Spark Core-
RDD
依赖关系&持久化&共享变量)
大家想了解更多大数据相关内容请移驾我的课堂:大数据相关课程剖析及实践企业级大数据数据架构规划设计大厂架构师知识梳理:剖析及实践数据建模PySpark入坑系列第三篇,该篇章主要介绍spark的编程核心
RDD
garagong
·
2024-01-12 09:13
大数据
spark
大数据
hadoop
分布式
数据处理
Spark指令参数,
RDD
--学习笔记
1,Spark的指令参数参数对spark所有指令都有效Spark指令参数#表示引用运行的模式,要么是本地local要么是集群(Standalone、YARN、Mesos)了--masterMASTER_URL#本地模式∶local[2]数字表示可以使用到本地的cpu核心数,loacl[*]*表示自动判断#Standalone集群∶spark∶//xxx∶7077,yyy∶7077#YARN集群∶y
祈愿lucky
·
2024-01-12 07:05
大数据
大数据
spark
python
TortoiseSVN·文件锁定与清理
安装TortoiseSVN的时候,选择svn命令可用,选择willbeintalledonlocalha
rdd
rive。在锁定的文件夹内cmd进入终端,输入find.
让我安静会
·
2024-01-12 00:44
配置与安装
svn
TortoiseSVN
Spark---
RDD
序列化
文章目录1什么是序列化2.
RDD
中的闭包检查3.Kryo序列化框架1什么是序列化序列化是指将对象的状态信息转换为可以存储或传输的形式的过程。在序列化期间,对象将其当前状态写入到临时或持久性存储区。
肥大毛
·
2024-01-11 07:33
scala
大数据
spark
spark
大数据
分布式
Spark---行动算子
RDD
文章目录1.行动算子1.1reduce1.2collect1.3first1.4count1.5take1.6takeOrdered1.7aggregate1.8fold1.9countByKey1.10countByValue1.11save相关算子1.12foreach1.行动算子Spark的行动算子是触发作业执行的方法,它们会直接触发计算并返回结果。行动算子可以分为两类:数据运算类和数据存储
肥大毛
·
2024-01-11 07:03
大数据
spark
scala
spark
大数据
分布式
Spark八:Spark性能优化
Spark性能调优Spark调优的方法,包括
RDD
使用、文件读取,partition学习资料:https://mp.weixin.qq.com/s/caCk3mM5iXy0FaXCLkDwYQ一、Spark
eight_Jessen
·
2024-01-11 07:29
scala
spark
spark
性能优化
用邮件及时获取变更的公网IP--------python爬虫+打包成exe文件
第一步:在设置中找到账户,找到POP3/IMAP/SMTP/Exchange/Ca
rdD
AV/CalDAV服务,点击获取授权码。第二步:选择其他方式验证-手机接收验证码验证。
UCASXS
·
2024-01-11 05:43
笔记
tcp/ip
python
爬虫
2019-03-31Tire字典树和简单匹配模式(. == 所有单词)
Snipaste_2019-03-31_22-29-16.pngpackagetrie;importjava.util.TreeMap;publicclassWo
rdD
ictionary{privateclassNode
Aluha_f289
·
2024-01-11 03:21
RDD
特性——
RDD
的分区和 Shuffle
目标
RDD
的分区操作Shuffle的原理分区的作用
RDD
使用分区来分布式并行处理数据,并且要做到尽量少的在不同的Executor之间使用网络交换数据,所以当使用
RDD
读取数据的时候,会尽量的在物理上靠近数据源
我像影子一样
·
2024-01-10 16:14
Spark
大数据
spark
大数据
RDD
算子——Action 操作
reducereduce和reduceByKey有什么区别:reduce是一个Action算子,reduceByKey是一个转换算子假设一个
RDD
里面有一万条数据,大部分Key是相同的,有十个不同的Key
我像影子一样
·
2024-01-10 16:44
Spark
大数据
spark
大数据
RDD
算子——概念及部分操作
RDD
的算子分类特点Spark中所有的Transformations是Lazy(惰性)的,它们不会立即执行获得结果,相反,它们只会记录在数据集上要应用的操作.只有当需要返回结果给Driver时,才会执行这些操作
我像影子一样
·
2024-01-10 15:06
Spark
大数据
spark
大数据
Spark Core--加强
RDD
的持久化
RDD
缓存当
RDD
被重复使用,或者计算该
RDD
比较容易出错,而且需要消耗比较多的资源和时间的时候,我们就可以将该
RDD
缓存起来。
小希 fighting
·
2024-01-10 14:06
spark
大数据
分布式
Windows中处理PySpark报错:SparkException: Python worker failed to connect back
PySpark报错:SparkException:Pythonworkerfailedtoconnectback这个问题可能是发送在windows10以上的版本,使用datafram的方法是没问题,但是使用
rdd
就是喜欢看不惯你又干不掉你的样子
·
2024-01-10 08:55
spark
python
Spark避坑系列二(Spark Core-
RDD
编程)
大家想了解更多大数据相关内容请移驾我的课堂:大数据相关课程剖析及实践企业级大数据数据架构规划设计大厂架构师知识梳理:剖析及实践数据建模PySpark避坑系列第二篇,该篇章主要介绍spark的编程核心
RDD
garagong
·
2024-01-10 08:19
大数据
spark
大数据
分布式
HCIA-Datacom题库(自己整理分类的)_15_VRP平台多选【9道题】
用户视图接口视图协议视图系统视图2.以下哪些存储介质是华为路由器常用的存储介质SDRAMNVRAMFlashHa
rdD
iskSDCard解析:Ha
rdD
isk是硬盘,一般网络设备没有。
小红红的学习笔记
·
2024-01-10 04:17
HCIA-Datacom题库
HCIA-Datacom
图片复制上传,拖拽输入框上传,el-upload自定义上传方法(上传和备注框强关联)
1.效果图:2.复制图片使用的方法:1.通过监听paste方法,获取复制内容2.获取复制内容中的clipboa
rdD
ata3.获取file文件进行上传handlePaste(value){letfiles
寒墨茗殇
·
2024-01-09 22:04
javascript
vue.js
elementui
黑猴子的家:Spark SQL
RDD
vs DataFrames vs DataSet
他们和
RDD
有什么区别呢?
黑猴子的家
·
2024-01-09 18:28
lc 140. 单词拆分 II
回溯算法查询匹配单词classSolution{public:unordered_mapword_map;voidmapping(vector&wo
rdD
ict){for(auto&a:wo
rdD
ict
honortech
·
2024-01-09 17:43
算法
Spark---
RDD
(Key-Value类型转换算子)
文章目录1.
RDD
Key-Value类型1.1partitionBy1.2reduceByKey1.3groupByKeyreduceByKey和groupByKey的区别分区间和分区内1.4aggregateByKey
肥大毛
·
2024-01-09 15:23
大数据
scala
spark
spark
python
大数据
大数据之PySpark的
RDD
介绍
文章目录前言一、
RDD
简介二、
RDD
的特性三、
RDD
的特点总结前言之前的文章主要介绍Spark基础知识,例如集群角色、Spark集群运行流程等,接下来会进一步讨论Spark相对核心的知识,让我们拭目以待
敲键盘的杰克
·
2024-01-09 07:11
Spark
大数据
spark
pyspark mysql
rdd
_PySpark之
RDD
操作
一、什么是
RDD
AResilientDistributedDataset(
RDD
),thebasicabstractioninSpark.Representsanimmutable,partitionedcollectionofelementsthatcanbeoperatedoninparallel
辉月有话说
·
2024-01-09 07:40
pyspark
mysql
rdd
PySpark之Spark
RDD
的持久化
一、为什么使用缓存提升应用程序性能容错二、缓存函数一、cache()二、persist三、缓存级别四、释放缓存五、什么时候缓存数据当某个
RDD
被使用多次的时候,建议缓存此
RDD
数据当某个
RDD
来之不易,
飞Link
·
2024-01-09 07:07
Spark计算引擎
spark
缓存
大数据
PySpark-Spark SQL基本介绍
SparkSQL特点SparkSQL与Hive的异同SparkSQL的数据结构SparkSQL的入门创建SparkSession对象DataFrame详解DataFrame基本介绍DataFrame的构建方式
RDD
Sisi525693
·
2024-01-09 07:37
spark
大数据
分布式
2024.1.8 Day04_SparkCore_homeWork
3.代码题浏览器Nginx案例先进行数据清洗,做后续需求用1、需求一:点击最多的前10个网站域名2、需求二:用户最喜欢点击的页面排序TOP103、需求三:统计每分钟用户搜索次数学生系统案例4.
RDD
依赖的分类
白白的wj
·
2024-01-09 07:37
spark
大数据
分布式
python
hadoop
big
data
DataFrame相关的API
目录DataFrame的操作方案SQL相关的API创建一个视图/表DSL相关的APIDSL的传递方式SQL的函数库SparkSQL的综合应用直接基于DataFrame来处理SQL方式DSL方式基于
RDD
Sisi525693
·
2024-01-09 07:06
python
大数据
人工智能
Spark---
RDD
(双值类型转换算子)
文章目录1.
RDD
双值类型算子1.1intersection1.2union1.3subtract1.4zip1.
RDD
双值类型算子
RDD
双Value算子就是对两个
RDD
进行操作或行动,生成一个新的
RDD
肥大毛
·
2024-01-09 07:32
大数据
spark
scala
spark
服务器
大数据
PySpark的
RDD
持久化
RDD
迭代链条中只有最新的
RDD
,旧
RDD
会销毁,节省内存空间追溯旧
RDD
是依照血缘关系,使用持久化技术->1.
RDD
缓存,把某个
RDD
保留,
rdd
.cache()缓存到内存,
rdd
.persist(StorageLevel.DISK_ONLY
February13
·
2024-01-09 07:32
java
开发语言
Spark Core------算子介绍
RDD
基本介绍什么是
RDD
RDD
:英文全称ResilientDistributedDataset,叫做弹性分布式数据集,是Spark中最基本的数据抽象,代表一个不可变、可分区、里面的元素可并行计算的集合
小希 fighting
·
2024-01-09 07:01
spark
大数据
分布式
PySpark之
RDD
的持久化
RDD
的持久化
RDD
的缓存当
RDD
被重复使用,或者计算该
RDD
比较容易出错,而且需要消耗比较多的资源和时间的时候,我们就可以将该
RDD
缓存起来。
Sisi525693
·
2024-01-09 07:30
python
spark
《儿童的人格教育》
Thi
rdd
ay第五章:如何阻止儿童产生自卑情结孩子与生俱来的潜能并不十分重要,成年人对孩子处境的判断也不重要,重要的是我们要以儿童的视角来看待他的处境,以他的错误判断来理解他的处境。
SallyYao
·
2024-01-09 05:25
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他