E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
——Spark
大数据实战手册-开发篇之
spark
实战案例:实时日志分析
2.6
spark
实战案例:实时日志分析2.6.1交互流程图2.6.2客户端监听器(java)@SuppressWarnings("static-access")privatevoidhandleSocket
Y1551880
·
2023-10-23 05:25
大数据
数据库
python
共享变量(广播变量、累加器)
一、广播变量产生背景:在
Spark
中,每次任务执行时,都需要将变量从驱动程序发送到每个执行器。如果变量很大,这将导致网络传输和内存开销的增加,从而影响任务的性能。
菜鸟一千零八十六号
·
2023-10-23 05:55
spark
spark
案例分析-搜索引擎日志分析案例
1.业务分析2.数据截图3.代码实现:main.py:#cording:utf8frompy
spark
import
Spark
Conf,
Spark
Contextfrompy
spark
.storagelevelimportStorageLevelfromdefsimportcontent_jieba
菜鸟一千零八十六号
·
2023-10-23 05:54
spark
c#
大数据
java大数据之flume
(3)Flume/Kafka用来进行数据收集的,
Spark
,Storm用来实时处理数据,impala用来实时查询(4)Flume是Cloudera提供的一个高
这一刻_776b
·
2023-10-23 05:31
机器学习(一)
Spark
机器学习基础
文章目录1.
Spark
机器学习基础1.0机器学习和大数据的区别和联系1.1机器学习引入1.2机器学习三次浪潮1.3人工智能领域基础概念区别1.3.1人工智能、机器学习、深度学习关系1.3.2数据分析、数据挖掘基本概念区别
大模型Maynor
·
2023-10-23 03:22
#
机器学习
机器学习
spark
人工智能
[博学谷学习记录] 超强总结,用心分享|Python语法练习_函数式编程
Python语法练习Python语法练习注:大家觉得博客好的话,别忘了点赞收藏呀,本人每周都会更新关于人工智能和大数据相关的内容,内容多为原创,PythonJavaScalaSQL代码,CVNLP推荐系统等,
Spark
FlinkKafkaHbaseHiveFlume
陈万君Allen
·
2023-10-23 02:12
Python基础语法练习
python
开发语言
2万字硬核
spark
源码精讲手册
本期为大家带来
spark
源码精讲系列,我将结合自身的理解深入浅出的剖析
spark
内核。全文内容很肝,希望能够给大家提供帮助。
大数据兵工厂
·
2023-10-23 01:06
大数据
spark
大数据
01 在CentOS7当中安装Storm
Spark
Streaming属于微批处理,并非真正意义上的实时处理。本节将介绍一个真正意义上的流处理框架Storm,本文将阐述Storm的安装。
张力的程序园
·
2023-10-23 01:27
Spark
简介
文章目录一、简介二、安装1、简介2、本地部署(Local模式)2.1安装2.2官方WordCount实例3、Standlong模式3.1简介2.2安装集群2.3官方测试案例4、Yarn模式3.1安装3.2配置历史服务器3.3配置查看历史日志5、Mesos模式6、几种模式对比7、常用端口三、Yarn模式详解1、简介2、Client模式3、Cluster模式一、简介1)官网地址:http://spar
ha_lydms
·
2023-10-22 23:26
大数据
spark
大数据
分布式
AI创作系统ChatGPT网站源码+详细图文搭建部署教程+支持GPT4.0+支持ai绘画(Midjourney)/支持OpenAI GPT全模型+国内AI全模型
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统+AI绘画系统,支持OpenAIGPT全模型+国内AI全模型。
白云如幻
·
2023-10-22 23:27
人工智能
软件源码
ChatGPT
chatgpt
人工智能
AI作画
midjourney
gpt
scala 语法深析
scala是一种基于JVM的编程语言,
spark
框架是使用scala语言编写的,要阅读源码就必须掌握scala,虽然
spark
可以采用java和python进行开发,但是最快速的支持方式任然是scala
Tim在路上
·
2023-10-22 22:18
Spark
--经典SQL50题
目录连接数据库准备工作1、查询"01"课程比"02"课程成绩高的学生的信息及课程分数2、查询"01"课程比"02"课程成绩低的学生的信息及课程分数3、查询平均成绩大于等于60分的同学的学生编号和学生姓名和平均成绩4、查询平均成绩小于60分的同学的学生编号和学生姓名和平均成绩5、查询所有同学的学生编号、学生姓名、选课总数、所有课程的总成绩6、查询"李"姓老师的数量7、查询学过"李四"老师授课的同学的
不吃香菜lw
·
2023-10-22 20:50
数据库
sql
java
Spark
大数据分析与实战笔记(第一章 Scala语言基础-5)
文章目录每日一句正能量章节概要1.5Scala的模式匹配与样例类1.5.1模式匹配字符匹配匹配字符串守卫匹配类型匹配数组、元组、集合1.5.2样例类课外补充偏函数每日一句正能量“成功的秘诀,在于对目标的执着追求。”——爱迪生无论是在工作、学习、还是生活中,只有对目标有着真正的执着追求,才有可能取得成功。爱迪生是个成功的发明家,也是一个努力不懈、坚持不断的实践者。他曾说过:“没有人能够一次成功,成功
想你依然心痛
·
2023-10-22 20:09
#
Spark大数据分析与实战
spark
数据分析
笔记
scala
项目实战
三种大数据应用架构介绍
本文主要介绍大数据的三类应用架构MapReduce、Hadoop、
Spark
,进行数据处理。
梯度科技
·
2023-10-22 17:14
hadoop
大数据
spark
DelayQueue 实现单机延迟任务处理
@Componentpublicclas
sPark
i
筏镜
·
2023-10-22 16:20
工具类
DelayQueue
延迟任务
How to set up a
spark
lyr cluster in 5 minutes
如果您曾经想要使用
Spark
lyr软件包在R群集中使用
Spark
集群来处理大数据集,但还没有开始,因为设置
Spark
集群太难了,好吧......很容易。
Liam_ml
·
2023-10-22 16:59
spark
读取jar中txt文件报错文件找不到
spark
任务中使用Source.fromFile(filename)报错,而使用getClass.getClassLoader.getResourceAsStream(filename)读取文件没有报错答
DSJ_ kohler
·
2023-10-22 13:53
大数据
spark
Hudi集成
Spark
之并发控制-并行写入
原文:Hudi(10):Hudi集成
Spark
之并发控制-CSDN博客目录0.相关文章链接1.Hudi支持的并发控制1.1.MVCC1.2.OPTIMISTICCONCURRENCY2.使用并发写方式3
hzp666
·
2023-10-22 11:39
Hudi
spark
hudi
spark
并发
并行写入
python和py
spark
_Python-Py
Spark
入门介绍
Apache
Spark
是处理和处理大数据时使用最广泛的框架之一,Python是用于数据分析、机器学习等的最广泛的编程语言之一。所以,为什么不一起使用呢?
weixin_39631767
·
2023-10-22 10:29
python和pyspark
大数据——Py
Spark
入口架构及Jupyter Notebook集成环境搭建
Py
Spark
入口架构及JupyterNotebook集成环境搭建在Linux上安装Anaconda集成Py
Spark
-Installation集成Py
Spark
-Configuration集成Py
Spark
Py
Spark
蜂蜜柚子加苦茶
·
2023-10-22 10:25
python
大数据
spark
Python Py
Spark
大数据的瑞士军刀
Spark
的核心概念:掌握
Spark
的基本概念和架构。
Spark
基本操作:了解
Spark
的几种常见操作。SQLin
Spark
概述:了解
Spark
相关数据统计可以用SQL来操作。
S_zhangmin
·
2023-10-22 10:54
PySpark
big
data
spark
hadoop
大数据Kafka入门
Spark
和Kafka是高度相关的。一、Kafka是采用消息队列的异步处理。
宋老板的笔记
·
2023-10-22 10:49
大数据初识
大数据
kafka
linux
队列
快速搞懂kafka是什么?
在流式计算中,Kafka一般用来缓存数据,
Spark
通过消费Kafka的数据进行计算。1)ApacheKafka是一个开源消息系统,由Scala写成。
Ocean.k
·
2023-10-22 10:17
大数据
kafka
大数据
分布式
队列
黑猴子的家:什么是
Spark
RDD ?
RDD(ResilientDistributedDataset)叫做分布式数据集,是
Spark
中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行计算的集合。
黑猴子的家
·
2023-10-22 06:16
到底什么才是大数据开发?
大数据开发其实分两种,第一类是编写一些Hadoop、
Spark
的应用程序,第二类是对大数据处理系统本身进行开发。第一类工作感觉更适用于dataanalyst这种职位吧,而
金光闪闪耶
·
2023-10-22 04:47
MOOC 大数据Note
MOOC大数据Note
Spark
Spark
一个软件栈满足不同交互场景Lineage血缘关系创建转换动作ShuffleMapStage
Spark
的部署和应用方式RDD操作分为转换(Transformation
CTGU_daffodil
·
2023-10-22 00:05
计算机科学与技术
大数据
spark
scala
linux服务器 conda + jdk+ scala+
spark
环境搭建
1.安装anaconda并新建conda环境,注意和windows中不一样的是启动环境命令是condacreate-n
spark
sourceactivate
spark
2.安装并查看java8版本,我这里
戈季
·
2023-10-21 23:49
leetcode-并查集
MaYingColdPlay的博客-CSDN博客python实现一个简单的并查集-SegmentFault思否并查集板子看找出知道秘密的所有专家并查集python实现各种常用算法之数据结构(7)-Hadoop_
Spark
朝阳章北海
·
2023-10-21 20:42
leetcode
深度学习
机器学习
java
Push failed src\main\scala\com\
spark
: failed with error: unable to read askpass response from 'C:
编写Scala代码后,本地仓库中的代码git到gitee时报Pushfailedsrc\main\scala\com\
spark
:failedwitherror:unabletoreadaskpassresponsefrom
做一个努力的猪
·
2023-10-21 19:28
Scala编译和运行
如果在scala命令行想调用自己在ide写好的类时(大多数情况下你的类会用到外部包,比如
spark
之类的),怎么办呢?
Mattina
·
2023-10-21 15:36
编译与运行Standalone
我选择的源码的版本是
Spark
2.4.0-SNAPSHOT这一个版本。编译的方法很简单,只需要在
Spark
的源码目录下,运行下面的命令就好了:.
AlstonWilliams
·
2023-10-21 15:27
scala语言入门
由于学习
spark
的时候,接触到scala语言,scala语言是一门多范式编程语言,可以进行面向对象编程也可以函数式编程,运行在java虚拟机上,相对于python、java、c语言,scala语言要求比较高
zhouxiaowu_bigdata
·
2023-10-21 13:56
scala学习
scala语言入门-安装及语言简介
在
spark
中采用了scala语言设计,提供更优雅的API设计,并且基于JVM(jav
叶子不落
·
2023-10-21 13:15
linux
scala
大数据
scala
Spark
Streaming入门
为了初始化
Spark
Streaming程序,一个StreamingContext对象必需被创建,它是
Spark
Streaming所有流操作的主要入口。
向阳争渡
·
2023-10-21 11:09
大数据/Spark
Spark
Streaming
spark
Streaming入门
1、
Spark
Streaming简介
Spark
Streaming是核心
Spark
API的扩展,可实现可扩展、高吞吐量、可容错的实时数据流处理。
panxuej_shenx
·
2023-10-21 11:39
Spark
Streaming入门实验
目录一、准备工作二、任务分析三、官网案例四、开发NetWordCount一、准备工作实验环境:netcat安装nc:yuminstall-ync二、任务分析将nc作为服务器端,用户产生数据;启动
spark
streaming
墨染盛夏呀
·
2023-10-21 11:03
spark
spark
大数据
分布式
RDD的持久化和广播变量
rdd.cache():缓存数据DAG有向无环图会增加一个绿点rdd.toDebugTostring()可以查看缓存的具体信息只有在shuffle后进行缓存才有意义目前来说,
spark
的缓存位置和级别非常优秀
十七✧ᐦ̤
·
2023-10-21 11:02
spark
Spark
Streaming入门完整案例
packagecom.zx.daoimportorg.apache.
spark
.
Spark
Confimportorg.apache.
spark
.rdd.RDDimportorg.apache.
spark
.sql.
Spark
Sessionimportorg.apache.
spark
.streaming
无恋-zx
·
2023-10-21 11:31
spark
scala
java
大数据学习15之
spark
streaming入门
文章目录一、概述二、应用场景三、集成
Spark
生态系统的使用四、发展史五、从词频统计功能着手入门1.
spark
-submit执行2.
spark
-shell执行(测试时使用)六、工作原理一、概述
spark
米泽玄師
·
2023-10-21 11:30
大数据
学习笔记
spark
big
data
学习
大数据
Spark
Streaming入门
2.3Streaming应用监控3Streaming工作原理3.1创建StreamingContext3.2接收器接收数据3.3汇报接收Block报告3.4Streaming工作原理总述1官方案例运行
Spark
Streaming
赵广陆
·
2023-10-21 11:28
spark
spark
big
data
Spark
Streaming入门
概述实时/离线实时:
Spark
是每个3秒或者5秒更新一下处理后的数据,这个是按照时间切分的伪实时。真正的实时是根据事件触发的数据计算,处理精度达到ms级别。
十七✧ᐦ̤
·
2023-10-21 11:21
sparkstreaming
spark
java
大数据测试 - 数仓测试
前言对于数据仓库的测试来说底层的系统会有很多有自建的集群使用
spark
或者flink测试,也有很多直接使用云厂商的产品比如datworks等等,再这里我想分享下抛开环境,只对数据仓库测试的一些小心得。
测试界的飘柔
·
2023-10-21 10:11
软件测试
职场经验
IT
数据仓库
大数据
数据挖掘
程序人生
自动化测试
软件测试
面试
mapPartitions 使用
Spark
中的map函数是将每个rdd都进行自定义函数处理mapPartitions则是将多个rdd进行分区,对每个分区内部的rdd进行自定义函数的处理mapPartitions常用于需要多次加载外部文件的情况下
枫隐_5f5f
·
2023-10-21 08:52
Hive | 笔记总结20220708v3
笔记总结20220708v3Hive模式区分场景应用:Hive本地模式与
Spark
模式的区分使用:小结unionall的应用场景:多表数据合并到同一张表:优化场景:小结多级分区表,分区字段比较多的情况,
Klingx
·
2023-10-21 08:03
Hive
hive
spark
大数据
Spark
-GraphFrames入门使用示例
Spark
-GraphFrames入门使用示例GraphFrames简介GraphFrames库的优势使用GraphFrames库使用图例创建GraphFrame实例视图和图操作GraphFrame提供四种视图
Klingx
·
2023-10-21 08:03
Spark
spark
大数据
python
Spark
第一课
从数据处理的方式角度:流式:一条数据一条数据的处理微批量:一小批一小批的处理批量:一批数据一批数据的处理(
Spark
)从数据处理的延迟角度离线:数据处理的延迟是以小时,天为单位准(近)实时:以秒为单位实时
叫我莫言鸭
·
2023-10-21 07:52
spark
大数据
分布式
认识大数据
大数据开发需要了解的几种语言Hadoop
Spark
Storm大数据平台应用六大知识点一、大数据中的数据仓库和Mpp数据库如何选型?
三思而后行,慎承诺
·
2023-10-21 07:42
架构
大数据
Spark
内核
Shuffle功能:打散重分区特点:无论MR和
Spark
,Shuffle都需要落盘。其中的区别是MR每次都落盘,
十七✧ᐦ̤
·
2023-10-21 07:10
spark
大数据
分布式
Spark
SQL入门
概述两种模式
Spark
onHive:语法是
Spark
SQL语法,实际上是在IDEA上编写java叠加SQL的代码。Hiveon
Spark
:只是替换了Hadoop的MR,改为了
Spark
的计算引擎。
十七✧ᐦ̤
·
2023-10-21 07:40
sparksql
spark
sql
spark
获取hadoop服务token
spark
作业一直卡在accepted问题现象问题排查1.查看yarnapp日志2.问题分析与原因问题现象通过yarn-cluster模式提交
spark
作业,客户端日志一直卡在submitapp,没有运行问题排查
zincooo
·
2023-10-21 07:35
线上问题
spark
hadoop
大数据
上一页
58
59
60
61
62
63
64
65
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他