E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark知识笔记
DataFrame的基本使用--学习笔记
方法其中包括的方法有:select(),selectExpr(),groupby()/groupBy()where,orderBy(),sort(),limit(),withColumn(),frompy
spark
.sqlimport
Spark
Session
祈愿lucky
·
2024-01-23 14:59
大数据
学习
笔记
NVIDIA与
Spark
fun 的合作伙伴在 Hackster.io 上发起了人工智能创新挑战赛,喊你来参加!
NVIDIA与
Spark
fun的合作伙伴在Hackster.io上发起了人工智能创新挑战赛,喊你来参加!
扫地的小何尚
·
2024-01-23 14:28
人工智能
Stuuctured Streaming基础--学习笔记
Structuredstreaming介绍
spark
进行实时数据流计算时有两个工具:
Spark
Streaming:编写rdd代码处理数据流,可以解决非结构化的流式数据StructuredStreaming
祈愿lucky
·
2024-01-23 14:58
大数据
学习
笔记
kafka
五分钟了解常见的黑客设备
2.Digi
spark
:Attiny85Digi
spark
开发板可以模拟成日常使用的USB键盘进行模拟输入。利用Win系统,按下WIN+R打开并锁定到CMD的
网安攻城狮-小李
·
2024-01-23 13:50
web安全
安全
网络安全
黑客
黑客攻击
黑客技术
Py
spark
文章目录一、
Spark
Core1.
Spark
Context:2.
Spark
Session3.RDD4.Broadcast、Accumulator:5.
Spark
conf6.
Spark
Files7.StorageLevel
李明朔
·
2024-01-23 12:24
机器学习
spark-ml
Spark
(三十四)troubleshooting之解决yarn-cluster模式的JVM内存溢出无法执行问题
一、背景实践经验,碰到的yarn-cluster的问题:1、有的时候,运行一些包含了
spark
sql的
spark
作业,可能会碰到yarn-client模式下,可以正常提交运行;yarn-cluster模式下
文子轩
·
2024-01-23 12:06
鸿蒙开发-OpenHarmony轻量系统之获取当地时间
环境OpenHarmony3.1润和hi
spark
_pegasusHi3861开发板DevEcoDeviceTool串口调试助手SNTP
移动开发技术栈
·
2024-01-23 11:21
鸿蒙开发
harmonyos
华为
程序员
鸿蒙开发
开发语言
鸿蒙系统
鸿蒙next
大数据开发之
Spark
(入门)
第1章:
Spark
概述1.1什么是
spark
回顾:hadoop主要解决,海量数据的存储和海量数据的分析计算。
spark
是一种基于内存的快速、通用、可扩展的大数据分析计算引擎。
Key-Key
·
2024-01-23 09:45
大数据
spark
分布式
Spark
解析JSON文件,写入hdfs
一、用
Spark
context读入文件,map逐行用Gson解析,输出转成一个caseclass类,填充各字段,输出。解析JSON这里没有什么问题。
gegeyanxin
·
2024-01-23 09:42
spark
json
hdfs
Gson
rdd转Dataframe
Spark
UI中 Shuffle Exchange 和 BroadcastExchange 中的 dataSize 值为什么不一样
背景
Spark
3.5最近在看
Spark
UI上的一些指标看到一个很有意思的东西,相邻的ShuffleExechange和BroadcastExechange中的datasize居然不一样,前者为765KB
鸿乃江边鸟
·
2024-01-23 09:07
spark
ui
大数据
kafka的基本使用--学习笔记
catalyst引擎作用:将
Spark
Sql转换成
spark
rdd任务提交进行计算解析器将
spark
sql代码解析成语法树(未解析的逻辑查询计划)分析器将语法树解析成解析后的逻辑查询计划对逻辑查询计划进行属性和关系关联检验优化器将解析后的逻辑查询计划进行优化
祈愿lucky
·
2024-01-23 08:32
大数据
kafka
学习
笔记
map与flatmap区别
Spark
中map函数会对每一条输入进行指定的操作,然后为每一条输入返回一个对象;-而flatMap函数则是两个操作的集合——正是“先映射后扁平化”:操作1:同map函数一样:对每一条输入进行指定的
不加班程序员
·
2024-01-23 06:25
spark
map
Hadoop相关
spark
map
用graphx实现Bronkerbosch计算极大团
请结合Bronkerbosch算法描述查看,该方法是在朴素的Bronkerbosch算法上进行改进,属于 带轴的Bron_Kerbosch算法importorg.apache.
spark
.graphx
不加班程序员
·
2024-01-23 06:25
spark
算法
Hadoop相关
graphx
Bron_Kerbosch
cliques
完全图
Spark
中字符串和json、map格式相互转化
Spark
中字符串和json格式相互转化字符串转为mapimportorg.json4s.DefaultFormatsimportorg.json4s.jackson.JsonMethods.parsevalad
不加班程序员
·
2024-01-23 06:54
Hadoop相关
spark
scala
spark
json
map
zeppelin部署文档
后台支持接入多种数据处理引擎,如
spark
,hive等。
不加班程序员
·
2024-01-23 06:54
Hadoop相关
elasticsearch
spark
spark
大数据
开发工具
hbase
通过
Spark
向Kafka写入数据
1、·将KafkaProducer利用lazyval的方式进行包装packagecn.com.m.utilimportjava.util.concurrent.Futureimportorg.apache.kafka.clients.producer.{KafkaProducer,ProducerRecord,RecordMetadata}classKafkaSink[K,V](createPro
不加班程序员
·
2024-01-23 06:24
Hadoop相关
kafka
spark
kafka
spark
Spark
运行流程
参考博文:https://blog.csdn.net/qq_17677907/article/details/88685705Apache
Spark
是专为大规模数据处理而设计的快速通用的计算引擎。
Cool_Pepsi
·
2024-01-23 02:12
大数据
spark
数据操作——无类型的转换算子
无类型的转换算子以下算子有@Test的前置条件//1.创建
Spark
Sessionval
spark
=
Spark
Session.builder().appName("trans_test").master
我像影子一样
·
2024-01-23 02:36
Spark
大数据
spark
大数据
scala
sql
数据操作——Column 对象
对每条数据都生成一个值2.Column对象如何创建’单引号’在Scala中是一个特殊的符号,通过’会生成一个Symbol对象,Symbol对象可以理解为是一个字符串的变种,但是比字符串的效率高很多,在
Spark
我像影子一样
·
2024-01-23 02:34
Spark
大数据
spark
大数据
mysql
hive
scala
评《避风港》
今天要说的这本小说名字叫《避风港》,作者是尼古拉斯•斯帕克思(Nicholas
Spark
s)尼古拉斯•斯帕克思(Nicholas
Spark
s),美国超级畅销小说作家,美国纯爱小说天王,被称为“全世界最擅长说故事的人
是斑大人呀
·
2024-01-22 21:01
(转)
Spark
Streaming遇到问题分析
parkStreaming遇到问题分析1、
Spark
2.0之后搞了个StructuredStreaming还没仔细了解,可参考:https://github.com/lw-lin/Coo...2、
Spark
达微
·
2024-01-22 20:06
大数据学习之 Flink
目录一:简介二:为什么选择Flink三:哪些行业需要四:Flink的特点五:与
spark
Streaming的区别六:初步开发七:Flink配置说明八:环境九:运行组件一:简介Flink是一个框架和分布式得计算引擎
会编程的海贼王
·
2024-01-22 19:58
Flink
大数据
Flink
大数据之Flink的看了就可入门
2Flink对比
Spark
Spark
是一种基于内存的
大数据的江湖
·
2024-01-22 19:56
大数据
#
Flink
flink
大数据学习之Flink,10分钟带你初步了解Flink
流式数据处理的发展和演变1.流处理和批处理2.传统事务处理2.1传统事务处理架构编辑3.有状态的流处理4.Lambda架构5.新一代流处理器七、Flink的特性总结1.Flink的核心特性2.分层API八、FlinkVS
Spark
1
十二点的泡面
·
2024-01-22 19:23
大数据
Flink
大数据
学习
flink
Spark
消费Kafka的两种方式
原理如何保证数据不丢失但是会导致数据重复问题优点缺点Direct(NoReceiver)方式code特点优点缺点介绍kafka版本,kafka0.8支持Receiver和DirectKafka版本大于等于0.10.0,且
Spark
这个程序猿可太秀了
·
2024-01-22 17:57
#
spark
#
kafka
spark内核
kafka
spark
AQE优化和源码
介绍AQE全称是AdaptiveQueryExecution,官网介绍如下PerformanceTuning-
Spark
3.5.0DocumentationAQE做了什么AQE是
Spark
SQL的一种动态优化机制
这个程序猿可太秀了
·
2024-01-22 17:56
spark内核
spark
AQE
Spark源码
Spark优化
Spark
简介
1、什么是
Spark
Spark
是大数据的调度,监控和分配引擎。
shinelord明
·
2024-01-22 17:17
大数据
引擎
spark
大数据
hadoop
spark
web框架--play framework 安装与运行
目前网上关于playframework框架的安装配置都是低版本的,现就高版本问题进行编写:1、下载https://www.playframework.com/(1)play2.3之前的版本都是压缩包zip,解压后,命令行运行play旧版本,即早于2.2的Play版本打包在zip文件中。提供了play创建新应用程序、运行测试和运行应用程序的命令。(2)playframework高版本配置高版本的Pl
huazi99
·
2024-01-22 13:37
大数据
java
spark
scala
30、
Spark
内核源码深度剖析之
Spark
内核架构深度剖析
Spark
内核架构深度剖析.png就上面这幅图,详细解释一下自己编写的Application,就是我们自己写的程序,拷贝到用来提交
spark
应用的机器,使用
spark
-submit提交这个Application
ZFH__ZJ
·
2024-01-22 12:43
48、
Spark
性能优化之性能优化概览
Spark
性能优化概览由于
Spark
的计算本质是基于内存的,所以
Spark
性能程序的性能可能因为集群中的任何因素出现瓶颈:CPU、网络带宽、或者是内存。
ZFH__ZJ
·
2024-01-22 11:31
Spark
- 升级版数据源JDBC2
>在
spark
的数据源中,只支持Append,Overwrite,ErrorIfExists,Ignore,这几种模式,但是我们在线上的业务几乎全是需要upsert功能的,就是已存在的数据肯定不能覆盖,
kikiki5
·
2024-01-22 10:41
Spark
groupByKey和reduceByKey
我们通过简单的WC看看两者的区别groupByKey实现WCscala>valrdd=sc.parallelize(List(1,1,2,2,3,3)).map((_,1))rdd:org.apache.
spark
.rdd.RDD
喵星人ZC
·
2024-01-22 09:23
史上最全深度解析Flink内存管理--大数据技术
目前,大数据计算引擎主要使用Java或基于JVM的编程语言实现的,例如ApacheHadoop,Apache
Spark
,ApacheDrill,ApacheFlink等。
大数据学习僧
·
2024-01-22 08:50
Flink
大数据
flink
C++ 类和对象
知识笔记
C++类和对象
知识笔记
1、类和对象C++面向对象的三大特征为:封装、继承、多态C++认为万事万物都皆为对象,对象上有其属性和行为例如人可以作为对象,属性有姓名、年龄、身高、体重…,行为有走、跳、跑、吃饭
西瓜籽@
·
2024-01-22 08:46
日常问题汇总
c++
笔记
Flink是如何管理内存的
在讲Flink管理内存之前要了解下Flink为什么要自己实现内存管理一、Flink为什么要自己实现内存管理在大数据领域,大多数数据相关的开源框架(Hadoop、
Spark
、Storm)都是基于JVM运行的
Relian哈哈
·
2024-01-22 08:13
Flink
Spark
写入kafka(批数据和流式)
Spark
写入(批数据和流式处理)
Spark
写入kafka批处理写入kafka基础#
spark
写入数据到kafkafrompy
spark
.sqlimport
Spark
Session,functionsasFss
中长跑路上crush
·
2024-01-22 07:02
Spark阶段
spark
kafka
linq
spark
入门教程
一、安装scala环境官网下载地址Download|TheScalaProgrammingLanguage,本次使用版本为sacla2.11.12,将压缩包解压至指定目录,配置好环境变量,控制台验证是否安环境是否可用:二、添加pom依赖创建一个maven项目1、添加scala的sdk依赖2.11.12org.scala-langscala-library${scala.version}org.sc
fengchengwu2012
·
2024-01-22 07:02
BigData
spark
大数据
分布式
Lan的ScalersTalk第四轮新概念朗读持续力训练Day 29 20181105
练习材料:任务配置:L0+L1+L4
知识笔记
:2.音标(L1)复习后元音:[ɑː][ɔː][ɒ][uː][ʊ]课中的单词:[ɑː]carpark[ɔː]boughtsmallcalledPorterwater
孙岚_9ff8
·
2024-01-22 03:36
django基于
spark
的电影推荐系统(程序+开题)
因此,基于
Spark
的电影推荐系统的研究具有重
liu10665
·
2024-01-21 21:35
django
python
后端
Spark
读取Hbase内容
不啰嗦直接看代码//初始化Hbase的基本配置valhbaseConf=HBaseConfiguration.create()hbaseConf.set("hbase.zookeeper.quorum","地址")valscan=newScan();scan.addFamily(Bytes.toBytes("c"))//要读取的列簇scan.setTimeStamp(timeStamp)//指定一
小湘西
·
2024-01-21 20:11
Spark
Hbase
spark
hbase
大数据
Spark
读取ElasticSearch
不啰嗦先上代码/***初始化
spark
*/val
spark
Name="Read_ES"val
spark
Conf=new
Spark
Conf().setAppName(
spark
Name).set("
spark
.serializer
小湘西
·
2024-01-21 20:11
Spark
Elasticsearch
spark
elasticsearch
大数据
卖萌的ScalersTalk第四轮新概念朗读持续力训练Day73 20181219
练习材料:Lesson73Therecord-holder录音时长:1m26s(1m24s)任务配置:L0+L1+L4
知识笔记
:音标:/ʌ/1)嘴巴张开一半左百,牙齿分开,下嘴唇略向下。
在卖萌哦
·
2024-01-21 20:52
知识笔记
(九十一)———vue实现base64格式转换为图片
找了很多,但是都不太好用,打算自己总结一个保姆级教学,无需动脑,电脑有电就能实现在HTML部分,我们需要一个标签来放置图片其次,我们需要引入refimport{ref}from'vue';exportdefault{setup(){constbase64Data=ref('把我换成base64数据!!!');//替换成你的base64图像数据constimageSrc=ref('');constc
瑞崽崽崽
·
2024-01-21 18:07
笔记
vue.js
前端
知识笔记
(九十二)———vue实现图片上传
在Vue3中进行图片上传可以使用第三方库或者自定义组件来完成。如果想要使用现有的第三方库,比如element-plus、vant等UI库提供的上传组件,需要先安装对应的包并按照文档说明配置相关参数。然后根据官方示例编写代码即可。:show-file-list="false">//main.jsimport{createApp}from'vue';importElementPlusfrom'elem
瑞崽崽崽
·
2024-01-21 18:07
笔记
知识笔记
(八十九)———链式语句中partition和strict用法
partition方法用于是数据库水平分表partition($data,$field,$rule);//$data分表字段的数据//$field分表字段的名称//$rule分表规则注意:不要使用任何SQL语句中会出现的关键字当表名、字段名,例如order等。会导致数据模型拼装SQL语句语法错误。partition方法用法如下://用于写入$data=['user_id'=>110,'user_n
瑞崽崽崽
·
2024-01-21 18:36
笔记
oracle
数据库
spark
on yarn安装部署
spark
onyarn安装部署使用的三台主机名称分别为bigdata1,bigdata2,bigdata3。
佛系爱学习
·
2024-01-21 17:11
spark
大数据
分布式
H2O
Spark
ling Water
什么是H2O
Spark
lingWater
Spark
lingWater允许用户将快速,可扩展的H2O机器学习算法与
Spark
的功能相结合。
Liam_ml
·
2024-01-21 16:03
【
Spark
】
Spark
运行架构--YARN-Cluster
YARN-Cluster模式启动类图YARN-Cluster实现原理YARN-Cluster作业运行调用图一、YARN-Cluster工作流程图image二、YARN-Cluster工作流程客户端通过
spark
-submit
w1992wishes
·
2024-01-21 14:34
py
spark
中实现scala的contains函数
scala:lines.filter(line=>line.contains("Python"))py
spark
:lines.filter(lambdax:x.find("Python")!
tianchen627
·
2024-01-21 12:25
94.144.145 二叉树的前序遍历、中序遍历、后序遍历
spark
打酱油输入:root=[1,null,2,3]输出:[1,2,3]示例2:输入:root=[]输出:[]示例3:输入:root=[1]输出:[1]提示:树中节点数目在范围[0,100]内-100
spark打酱油
·
2024-01-21 11:58
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他