E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大数据技术-spark
Spark
运行流程
参考博文:https://blog.csdn.net/qq_17677907/article/details/88685705Apache
Spark
是专为大规模数据处理而设计的快速通用的计算引擎。
Cool_Pepsi
·
2024-01-23 02:12
大数据
spark
数据操作——无类型的转换算子
无类型的转换算子以下算子有@Test的前置条件//1.创建
Spark
Sessionval
spark
=
Spark
Session.builder().appName("trans_test").master
我像影子一样
·
2024-01-23 02:36
Spark
大数据
spark
大数据
scala
sql
数据操作——Column 对象
对每条数据都生成一个值2.Column对象如何创建’单引号’在Scala中是一个特殊的符号,通过’会生成一个Symbol对象,Symbol对象可以理解为是一个字符串的变种,但是比字符串的效率高很多,在
Spark
我像影子一样
·
2024-01-23 02:34
Spark
大数据
spark
大数据
mysql
hive
scala
评《避风港》
今天要说的这本小说名字叫《避风港》,作者是尼古拉斯•斯帕克思(Nicholas
Spark
s)尼古拉斯•斯帕克思(Nicholas
Spark
s),美国超级畅销小说作家,美国纯爱小说天王,被称为“全世界最擅长说故事的人
是斑大人呀
·
2024-01-22 21:01
(转)
Spark
Streaming遇到问题分析
parkStreaming遇到问题分析1、
Spark
2.0之后搞了个StructuredStreaming还没仔细了解,可参考:https://github.com/lw-lin/Coo...2、
Spark
达微
·
2024-01-22 20:06
3.
大数据技术
之Flink(基础篇)
文章目录1、Flink简介1.1Flink的引入1.2什么是Flink2、Flink架构体系2.1Flink中的重要角⾊JobManager处理器:TaskManager处理器:2.2无界数据流与有界数据流无界数据流:有界数据流:3、Flink集群操作4、DataSetAPI开发4.1案例4.1.1Flink批处理程序的一般流程4.1.2JAVA示例5、DataStreamAPI开发5.1案例5.
数据带你飞
·
2024-01-22 19:28
大数据基础篇
大数据
flink
hadoop
大数据学习之 Flink
目录一:简介二:为什么选择Flink三:哪些行业需要四:Flink的特点五:与
spark
Streaming的区别六:初步开发七:Flink配置说明八:环境九:运行组件一:简介Flink是一个框架和分布式得计算引擎
会编程的海贼王
·
2024-01-22 19:58
Flink
大数据
Flink
大数据之Flink的看了就可入门
2Flink对比
Spark
Spark
是一种基于内存的
大数据的江湖
·
2024-01-22 19:56
大数据
#
Flink
flink
大数据学习之Flink,10分钟带你初步了解Flink
流式数据处理的发展和演变1.流处理和批处理2.传统事务处理2.1传统事务处理架构编辑3.有状态的流处理4.Lambda架构5.新一代流处理器七、Flink的特性总结1.Flink的核心特性2.分层API八、FlinkVS
Spark
1
十二点的泡面
·
2024-01-22 19:23
大数据
Flink
大数据
学习
flink
Spark
消费Kafka的两种方式
原理如何保证数据不丢失但是会导致数据重复问题优点缺点Direct(NoReceiver)方式code特点优点缺点介绍kafka版本,kafka0.8支持Receiver和DirectKafka版本大于等于0.10.0,且
Spark
这个程序猿可太秀了
·
2024-01-22 17:57
#
spark
#
kafka
spark内核
kafka
spark
AQE优化和源码
介绍AQE全称是AdaptiveQueryExecution,官网介绍如下PerformanceTuning-
Spark
3.5.0DocumentationAQE做了什么AQE是
Spark
SQL的一种动态优化机制
这个程序猿可太秀了
·
2024-01-22 17:56
spark内核
spark
AQE
Spark源码
Spark优化
Spark
简介
1、什么是
Spark
Spark
是大数据的调度,监控和分配引擎。
shinelord明
·
2024-01-22 17:17
大数据
引擎
spark
大数据
hadoop
spark
web框架--play framework 安装与运行
目前网上关于playframework框架的安装配置都是低版本的,现就高版本问题进行编写:1、下载https://www.playframework.com/(1)play2.3之前的版本都是压缩包zip,解压后,命令行运行play旧版本,即早于2.2的Play版本打包在zip文件中。提供了play创建新应用程序、运行测试和运行应用程序的命令。(2)playframework高版本配置高版本的Pl
huazi99
·
2024-01-22 13:37
大数据
java
spark
scala
30、
Spark
内核源码深度剖析之
Spark
内核架构深度剖析
Spark
内核架构深度剖析.png就上面这幅图,详细解释一下自己编写的Application,就是我们自己写的程序,拷贝到用来提交
spark
应用的机器,使用
spark
-submit提交这个Application
ZFH__ZJ
·
2024-01-22 12:43
48、
Spark
性能优化之性能优化概览
Spark
性能优化概览由于
Spark
的计算本质是基于内存的,所以
Spark
性能程序的性能可能因为集群中的任何因素出现瓶颈:CPU、网络带宽、或者是内存。
ZFH__ZJ
·
2024-01-22 11:31
Spark
- 升级版数据源JDBC2
>在
spark
的数据源中,只支持Append,Overwrite,ErrorIfExists,Ignore,这几种模式,但是我们在线上的业务几乎全是需要upsert功能的,就是已存在的数据肯定不能覆盖,
kikiki5
·
2024-01-22 10:41
Spark
groupByKey和reduceByKey
我们通过简单的WC看看两者的区别groupByKey实现WCscala>valrdd=sc.parallelize(List(1,1,2,2,3,3)).map((_,1))rdd:org.apache.
spark
.rdd.RDD
喵星人ZC
·
2024-01-22 09:23
大数据技术
原理及应用课实验3 :熟悉常用的HBase操作
目录实验3熟悉常用的HBase操作一、实验目的二、实验平台三、实验步骤(每个步骤下均需有运行截图)(一)编程实现以下指定功能,并用Hadoop提供的HBaseShell命令完成相同任务:1.列出HBase所有的表的相关信息,例如表名;2.在终端打印出指定的表的所有记录数据;3.向已经创建好的表添加和删除指定的列族或列;4.统计表的行数。(二)HBase数据库操作1.现有以下关系型数据库中的表和数据
Blossom i
·
2024-01-22 08:08
大数据编程
大数据
hbase
数据库
大数据技术
原理及应用课实验4: NoSQL和关系数据库的操作比较
目录实验4NoSQL和关系数据库的操作比较一、实验目的二、实验平台三、实验步骤(每个步骤下均需有运行截图)(一)MySQL数据库操作1.根据上面给出的Student表,在MySQL数据库中完成如下操作:(1)在MySQL中创建Student表,并录入数据;(3)查询zhangsan的Computer成绩;(4)修改lisi的Math成绩,改为95。2.根据上面已经设计出的Student表,使用My
Blossom i
·
2024-01-22 08:04
大数据编程
大数据
nosql
数据库
Hadoop基本概论
Hadoop概述1.Hadoop定义2.Hadoop发展历史3.Hadoop发行版本4.Hadoop优势5.Hadoop1.x/2.x/3.x6.HDFS架构7.Yarn架构8.MapReduce架构9.
大数据技术
生态体系一
LzYuY
·
2024-01-22 08:25
Hadoop
hadoop
大数据
分布式
史上最全深度解析Flink内存管理--
大数据技术
目前,大数据计算引擎主要使用Java或基于JVM的编程语言实现的,例如ApacheHadoop,Apache
Spark
,ApacheDrill,ApacheFlink等。
大数据学习僧
·
2024-01-22 08:50
Flink
大数据
flink
Flink是如何管理内存的
在讲Flink管理内存之前要了解下Flink为什么要自己实现内存管理一、Flink为什么要自己实现内存管理在大数据领域,大多数数据相关的开源框架(Hadoop、
Spark
、Storm)都是基于JVM运行的
Relian哈哈
·
2024-01-22 08:13
Flink
Spark
写入kafka(批数据和流式)
Spark
写入(批数据和流式处理)
Spark
写入kafka批处理写入kafka基础#
spark
写入数据到kafkafrompy
spark
.sqlimport
Spark
Session,functionsasFss
中长跑路上crush
·
2024-01-22 07:02
Spark阶段
spark
kafka
linq
spark
入门教程
一、安装scala环境官网下载地址Download|TheScalaProgrammingLanguage,本次使用版本为sacla2.11.12,将压缩包解压至指定目录,配置好环境变量,控制台验证是否安环境是否可用:二、添加pom依赖创建一个maven项目1、添加scala的sdk依赖2.11.12org.scala-langscala-library${scala.version}org.sc
fengchengwu2012
·
2024-01-22 07:02
BigData
spark
大数据
分布式
深度学习和
大数据技术
推动自然语言处理迈向新高度
引言近年来,深度学习和
大数据技术
的不断进步,使得自然语言处理(NaturalLanguageProcessing,NLP)取得了显著的成果。
能力工场小马哥
·
2024-01-22 07:03
AI
人工智能
深度学习
大数据
自然语言处理
自然语言处理的发展
自然语言处理技术的发展自然语言处理(NLP)作为人工智能领域的重要分支,在深度学习和
大数据技术
的推动下取得了显著的进步。
Java之弟
·
2024-01-22 05:27
自然语言处理
自然语言处理
人工智能
深度融合:金融科技时代的蜕变进行曲
文/孟永辉金融科技成为替代互联网金融的呼声越来越高,而以智能科技、
大数据技术
在金融行业当中的应用所带来的改变则更加让这种趋势变得明显。
孟永辉
·
2024-01-22 01:04
django基于
spark
的电影推荐系统(程序+开题)
本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取系统程序文件列表开题报告内容研究背景:随着互联网的普及和
大数据技术
的发展,人们对于个性化推荐的需求越来越高。
liu10665
·
2024-01-21 21:35
django
python
后端
Spark
读取Hbase内容
不啰嗦直接看代码//初始化Hbase的基本配置valhbaseConf=HBaseConfiguration.create()hbaseConf.set("hbase.zookeeper.quorum","地址")valscan=newScan();scan.addFamily(Bytes.toBytes("c"))//要读取的列簇scan.setTimeStamp(timeStamp)//指定一
小湘西
·
2024-01-21 20:11
Spark
Hbase
spark
hbase
大数据
Spark
读取ElasticSearch
不啰嗦先上代码/***初始化
spark
*/val
spark
Name="Read_ES"val
spark
Conf=new
Spark
Conf().setAppName(
spark
Name).set("
spark
.serializer
小湘西
·
2024-01-21 20:11
Spark
Elasticsearch
spark
elasticsearch
大数据
spark
on yarn安装部署
spark
onyarn安装部署使用的三台主机名称分别为bigdata1,bigdata2,bigdata3。
佛系爱学习
·
2024-01-21 17:11
spark
大数据
分布式
H2O
Spark
ling Water
什么是H2O
Spark
lingWater
Spark
lingWater允许用户将快速,可扩展的H2O机器学习算法与
Spark
的功能相结合。
Liam_ml
·
2024-01-21 16:03
django基于Hadoop平台的电影推荐系统(程序+开题报告)
本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取系统程序文件列表开题报告内容研究背景:随着互联网的普及和
大数据技术
的发展,人们对于个性化推荐的需求越来越高。
liu10662
·
2024-01-21 15:51
django
python
后端
4W字全面解读数据中台、数据仓库和数据湖
随着
大数据技术
的不断更新和迭代,数据管理工具得到了飞速的发展,相关概念如雨后春笋一般应运而生,如从最初决
无精疯
·
2024-01-21 15:59
数据仓库
sqlite
lamp
scipy
zk
【
Spark
】
Spark
运行架构--YARN-Cluster
YARN-Cluster模式启动类图YARN-Cluster实现原理YARN-Cluster作业运行调用图一、YARN-Cluster工作流程图image二、YARN-Cluster工作流程客户端通过
spark
-submit
w1992wishes
·
2024-01-21 14:34
深度学习与
大数据技术
:推动自然语言处理的新篇章
深度学习与
大数据技术
:推动自然语言处理的新篇章随着科技的进步,我们的生活正在被各种智能设备所改变。这些设备能理解我们的语言,甚至能生成人类语言进行交流。
M乔木
·
2024-01-21 13:00
热点讨论
深度学习
大数据
自然语言处理
【日常聊聊】自然语言处理的发展
通过深度学习和
大数据技术
的不断进步,计算机在理解、处理和生成人类语言方面取得了前所未有的成就。本文将探讨NLP领域的关键技术、应用场景、面临的挑战与前景,以及技术发展对伦理和社会的
还在路上的秃头
·
2024-01-21 12:57
日常聊聊
开发语言
java
面试
笔记
生活
py
spark
中实现scala的contains函数
scala:lines.filter(line=>line.contains("Python"))py
spark
:lines.filter(lambdax:x.find("Python")!
tianchen627
·
2024-01-21 12:25
94.144.145 二叉树的前序遍历、中序遍历、后序遍历
spark
打酱油输入:root=[1,null,2,3]输出:[1,2,3]示例2:输入:root=[]输出:[]示例3:输入:root=[1]输出:[1]提示:树中节点数目在范围[0,100]内-100
spark打酱油
·
2024-01-21 11:58
02-黑马程序员大数据开发:分布式计算和分布式资源调度
分布式计算模式:分散->汇总模式(MapReduce)和中心调度->步骤执行模式(Apache
Spark
,Flink;比较复杂,中间会有数据交换的过程);2.MapReduce概述MapReduce是Hadoop
S1406793
·
2024-01-21 08:52
大数据开发
大数据
分布式
Clickhouse VS Doris 导入-并发-查询对比
clickhouse导入数据直接导入的是本地磁盘,对于分布式表,clickhouse和doris相比,clickhouse就没有本地表导入的优势,借助clickhouse进行数据排序,而doris中有
spark
Load
IT贫道
·
2024-01-21 08:21
随笔
clickhouse
doris
大数据之
spark
运行模式
Apache
Spark
提供了多种运行模式,主要包括以下几种:本地模式(Local):
Spark
在本地单机上运行,主要用于开发测试阶段。
转身成为了码农
·
2024-01-21 07:11
大数据
spark
分布式
大数据之
Spark
常用的端口号
Spark
常用的端口号包括:DriverWebUI端口:4040,这是
Spark
应用程序(Driver)运行时绑定的端口,用于展示任务运行状态、执行进度、任务细节等监控信息。
转身成为了码农
·
2024-01-21 07:11
大数据
spark
分布式
大数据之
Spark
架构设计与工作流程
Apache
Spark
架构设计是其高效、分布式处理能力的基础。
转身成为了码农
·
2024-01-21 07:41
大数据
spark
分布式
大数据技术
汇总
HadoopHadoop入门概述Hadoop运行模式介绍HadoopHDFS的运行流程HadoopMapReduce的运行流程Hadoopyarn的运行流程Hadoop内HDFS、MapReduce和YARN交互过程HadoopHDFS常用命令HadoopYARN常用命令Hive大数据工具Hive介绍大数据工具Hive架构设计原理大数据之Hive常用命令大数据之Hive常用聚合函数大数据之Hive
转身成为了码农
·
2024-01-21 07:41
大数据
hadoop
hive
spark
数据仓库
Spark
学习(8)-
Spark
SQL的运行流程,
Spark
On Hive
1.
Spark
SQL的运行流程1.1
Spark
RDD的执行流程回顾1.2
Spark
SQL的自动优化RDD的运行会完全按照开发者的代码执行,如果开发者水平有限,RDD的执行效率也会受到影响。
技术闲聊DD
·
2024-01-21 06:50
大数据
hive
spark
学习
Hive on
Spark
和
Spark
sql on Hive,你能分的清楚么
Hiveon
Spark
和
Spark
sqlonHive,你能分的清楚么结构上HiveOn
Spark
和
Spark
SQL都是一个翻译层,把一个SQL翻译成分布式可执行的
Spark
程序。
捞起月亮的渔民丁
·
2024-01-21 06:18
hive
spark
大数据
Spark
:
Spark
SQL与Hive on
Spark
(Shark)的比较
简要介绍了
Spark
SQL与Hiveon
Spark
的区别与联系一、关于
Spark
简介在Hadoop的整个生态系统中,
Spark
和MapReduce在同一个层级,即主要解决分布式计算框架的问题。
花和尚也有春天
·
2024-01-21 06:17
sparkSQL
SparkSQL
Hive
on
Spark
拾肆:
Spark
with Hive和Hive on
Spark
在Hive与
Spark
这对“万金油”组合中,Hive擅长元数据管理,而
Spark
的专长是高效的分布式计算,二者的结合可谓是“强强联合”。
for your wish
·
2024-01-21 06:47
hive
spark
big
data
基于kubernetes构建
spark
-thriftserver集群(Deployment模式)
继续上一篇《基于kubernetes构建
spark
集群(RC模式)》,沿用上一篇rbac配置,以及PV、PVC配置,本篇将采用Deployment方式进行部署
spark
集群,以及增加thriftserver
Moutai码哥
·
2024-01-21 06:46
大数据
云计算
企业架构
spark
thriftserver
spark
hive
上一页
14
15
16
17
18
19
20
21
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他