E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark技术篇
Day68 Kafka 快速实战 核心原理
Storm/
Spark
流式处理引擎web/nginx,访问日志消息服务开放统一接口给consumerhadoop,hbase等.装载到hadoop,数仓etl做离线分析和数据挖掘.ScreenShot2022
小周爱吃瓜
·
2023-11-25 21:31
spark
资源动态释放
通过
spark
-submit会固定占用一占的资源,有什么办法,在任务不运作的时候将资源释放,让其它任务使用呢,yarn新版本默认已经支持了,我们使用的是HDP。
kikiki2
·
2023-11-25 19:37
基于centos7的hadoop2.7、zookeeper3.5、hbase1.3、
spark
2.3、scala2.11、kafka2.11、hive3.1、flume1.8、sqoop1.4组件部署
部署前准备修改主机名1、修改主机名(6台机器都要操作,以Master为举例)hostnamectlset-hostnameMaster(永久修改主机名)reboot(重启系统)修改hosts将第一行127.0.0.1xxxx注释掉,加上:195.168.2.127master195.168.2.128slave1195.168.2.129slave2确认网卡信息vi/etc/sysconfig/n
luoz_python
·
2023-11-25 19:42
大数据平台运维
hadoop
大数据
spark
flume
kafka
Scala深海奇遇记-当case class遇到了
Spark
的聚集函数
自从知道有caseclass这个东西以后,一直都比较常用这个东西。但是,最近在测试的时候,突然发现,其实这个东西并不简单,它导致了一个看起来很无厘头的错误,并且花了我两天的时间来调试。在这篇文章里,我会详细记录调试的过程,以及结论。致谢在调试的过程中,得到了我们Hadoop组老大,项目组老大,以及其他同事的深度支持与帮助,非常感谢他们。结论先说结论。如果有朋友不感兴趣,不想深究原理,只是想知道怎么
AlstonWilliams
·
2023-11-25 18:58
在dss中运行scala任务报java.lang.NullPointerException: null
版本信息:dss:1.1.1linkis1.1.1hadoop:3.1.3hive:3.1.2
spark
:3.0.0修改文件:
Spark
ScalaExecutor.scala修改文件内容如下:上图红色标记内容
heheha_zj
·
2023-11-25 18:18
dss
or
linkis
Kafka系列 - Kafka一篇入门
很多分布式处理系统,例如
Spark
,Flink等都支持与Kafka集成。Kafka使用场景消息系统:Kafka实现了消息顺序性保证和回溯消费。
胡桃姓胡,蝴蝶也姓胡
·
2023-11-25 17:01
Kafka庖丁解牛
kafka
分布式
HBase探索篇 _ OpenJdk15编译并部署CDH版HBase
javax.annotation不存在3.4maven-shade-plugin升级版本3.5程序包javax.xml.ws.http不存在3.6SomeEnforcerruleshavefailed.3.7hbase-
spark
大猿小猿向前冲
·
2023-11-25 14:20
HBase专题
hbase
Hadoop发行版 Cloudera CDH 6.3.2及CM 安装包下载(阿里云盘 不限速)
全称Cloudera’sDistribution,includingApacheHadoop)是由Cloudera公司构建的Hadoop稳定发行版,不仅含有ApacheHadoop,还整合了Hive、
Spark
风情客家__
·
2023-11-25 14:11
大数据框架
CDH
6.3.2
告别百度网盘,搭建自己的专属网盘 ——Cloudreve,不限制下载速度!
支持多家云存储驱动的公有云文件系统.演示站•讨论社区•文档•下载•Telegram群组•许可证:
spark
les:特性:cloud:支持本机、从机、七牛、阿里云OSS、腾讯云COS、又拍云、OneDrive
顺哥博客
·
2023-11-25 13:51
宝塔面板
服务器
nginx
Spark
项目报错。SLF4J: Class path contains multiple SLF4J bindings.
此问题出现是因为有依赖包冲突,解决方案是将org/apache/logging/log4j/log4j-slf4j-impl/2.4.1依赖包删除。在本地Maven仓库找到相应的目录,删除,重新运行项目就可以了。1、删除包2、正常运行
Enjoy404
·
2023-11-25 11:05
报错合集
大数据
spark
Sql, dataframe, Dataset 和 Streaming编程指南
四:
spark
Sql,dataframe,Dataset4.1:
Spark
SQL的用法之一是执行SQL查询,它也可以从现有的Hive中读取数据
Spark
Session:
Spark
中所有功能的入口是
Spark
Session
醉舞经阁半卷书A
·
2023-11-25 10:57
spark
资源动态释放
通过
spark
-submit会固定占用一占的资源,有什么办法,在任务不运作的时候将资源释放,让其它任务使用呢,yarn新版本默认已经支持了,我们使用的是HDP。
kikiki2
·
2023-11-25 09:13
玩转人工智能(11)使用Py
spark
上手机器学习
文件系统HDFSHadoopDistributedFileSystem,简称HDFS,是一个分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。GlusterFS是一个集群的文件系统,支持PB级的数据量。GlusterFS通过RDMA和TCP/IP方式将分布到不同服务器上的存储空间汇集成一个大的网络化并行文件系统。
Moscar_M
·
2023-11-25 07:10
(二)大数据---Hadoop组件介绍,区别
文章目录文件系统数据存储内存技术数据搜集消息系统数据处理查询引擎分析和报告工具调度与管理服务机器学习开发平台Hive,Impala,pig区别HDFS:分布式文件系统YARN:分布式资源管理MapReduce、
Spark
(─__─)
·
2023-11-25 07:37
Hadoop
hadoop
big
data
大数据
Spark
SQL 时间格式处理
初始化
Spark
Sqlpackagepbcp_2023.clear_dataimportorg.apache.
spark
.
Spark
Confimportorg.apache.
spark
.sql.
Spark
Sessionimportorg.apache.
spark
.sql.functions
小辉懂编程
·
2023-11-25 05:29
hive等)
spark
sql
大数据
最新Midjourney绘画提示词Prompt教程无需魔法
最新Midjourney绘画提示词Prompt教程无需魔法使用一、AI绘画工具
Spark
Ai【无需魔法使用】:
Spark
Ai是目前国内一款的ChatGPT对接OpenAI软件系统。
白云如幻
·
2023-11-25 05:27
人工智能
教程
chatgpt
midjourney
AIGC
人工智能
AI作画
prompt
最新AIGC创作系统ChatGPT网站源码,Midjourney绘画系统,支持GPT-4图片对话能力(上传图片并识图理解对话),支持DALL-E3文生图
一、AI创作系统
Spark
Ai创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2023-11-25 05:21
人工智能
AIGC
软件源码
chatgpt
人工智能
AIGC
midjourney
云计算实验4 面向行业背景的大数据分析与处理综合实验
一、实验目的掌握分布式数据库接口
Spark
SQL基本操作,以及训练综合能力,包括:数据预处理、向量处理、大数据算法、预测和可视化等综合工程能力二、实验环境Linux的虚拟机环境和实验指导手册三、实验任务完成
MrNeoJeep
·
2023-11-25 04:06
#
云计算
云计算
数据分析
大数据
大数据分析与应用实验任务八
大数据分析与应用实验任务八实验目的进一步熟悉py
spark
程序运行方式;熟练掌握pysaprkRDD基本操作相关的方法、函数。
陈希瑞
·
2023-11-25 04:05
spark
大数据分析与应用实验任务九
大数据分析与应用实验任务九实验目的进一步熟悉py
spark
程序运行方式;熟练掌握pysaprkRDD基本操作相关的方法、函数,解决基本问题。
陈希瑞
·
2023-11-25 04:31
数据分析
数据挖掘
spark
(建模
技术篇
)
针对这段时间大家比较好奇的3D人像摄影馆火热现状,我们在上一篇文章中讲述了目前3D打印技术已经成熟的状态,也介绍了制作真人模型之前的步骤,也就是数据获取的过程。今天我们继续挖掘这个生意的下一个环节:如何制作真人3D模型。真人建模技术在获取了真人影像之后就要做建模,对这件事有过调研的朋友会知道,只要肯学习,借助一台能够带动复杂算法的计算机,使用专业软件就能制作三维模型,软件里包含对整个一组真人影像进
博雅弘拓科技
·
2023-11-25 03:23
3d
flink中Task、SubTask的理解
Task对照
Spark
中的Stage阶段;SubTask对照
Spark
中的task
xuning_et
·
2023-11-25 01:34
flink
大数据
Spark
---
Spark
Core(一)
一、术语与宽窄依赖1、术语解释1、Master(standalone):资源管理的主节点(进程)2、ClusterManager:在集群上获取资源的外部服务(例如:standalone,Mesos,Yarn)3、WorkerNode(standalone):资源管理的从节点(进程)或者说管理本机资源的进程4、DriverProgram:用于连接工作进程(Worker)的程序5、Executor:是
30岁老阿姨
·
2023-11-25 01:20
Spark
spark
大数据
分布式
Spark
---补充算子
一、
Spark
补充Transformation算子1、join,leftOuterJoin,rightOuterJoin,fullOuterJoin作用在K,V格式的RDD上。
30岁老阿姨
·
2023-11-25 01:50
Spark
spark
大数据
分布式
spark
任务提交方式yarn-client和yarn-cluster对比
spark
中yarn模式有两种任务提交方式,分别是yarn-client模式和yarn-cluster模式,其区别如下:一、yarn-client任务提交方式1、yarn-client模式提交任务后,会在客户端启动
伊一cherry大数据
·
2023-11-25 01:18
spark
大数据
hadoop
Spark
-----第 2 章
Spark
部署模式
Spark
支持多种集群管理器(ClusterManager),分别为:Standalone:独立模式,
Spark
原生的简单集群管理器,自带完整的服务,可单独部署到一个集群中,无需依赖任何其他资源管理系统
Wzideng
·
2023-11-25 01:18
#
spark
spark
大数据
分布式
spark
yarn 提交_
Spark
系列--提交任务流程
1.
Spark
基于StandaLone的任务提交模式StandaLone提交任务有两种模式,一种是基于客户端Client提交任务,另一种是集群cluster提交任务。
谷俊丽
·
2023-11-25 01:18
spark
yarn
提交
Spark
on YARN运行过程,YARN-Client和YARN-Cluster
Spark
onYARN运行过程YARN是一种统一资源管理机制,在其上面可以运行多套计算框架。
高个子男孩
·
2023-11-25 01:17
Spark
spark
大数据
hadoop
Spark
on yarn——
Spark
提交任务到yarn集群源码分析
目录一、入口类——
Spark
Submit二、
Spark
Application启动——JavaMainApplication、YarnClusterApplication三、
Spark
Context初始化四
编程小王子啊
·
2023-11-25 01:17
CSDN大数据专栏
spark
大数据
hdfs
java
架构
实战py
spark
基于yarn模式提交任务成功踩坑
1.背景最近的项目使用yarn提交py
spark
的任务,遇到了不少坑,目前已经成功地跑通了基于client和cluster两种模式的任务提交。特此记录一下。
euler1983
·
2023-11-25 01:16
pyspark
spark
大数据
hadoop
spark
submit——yarn模式参数调优
spark
官网上的参数默认值设置:https://
spark
.apache.org/docs/latest/configuration.html#
spark
-streaming此处记录一下最近整理的
spark
凌寒独自开
·
2023-11-25 01:16
大数据
spark
yarn
大数据
Spark
on Yarn提交任务过程
这篇文章将从源码的角度向大家展示
Spark
是如何提交任务到Yarn上执行的,如有错误,还请各位指出。
枫_Maple
·
2023-11-25 01:46
大数据
spark
yarn
大数据
什么是
spark
,
spark
运行模式,local模式,使用
spark
-shell,Standalone模式,Yarn模式,案例实操WordCount程序
目录第1部分
Spark
基础第1章
Spark
概述1.1什么是
Spark
1.2.1快速1.2.2易用1.3.1集群管理器(ClusterManager)第2章
Spark
运行模式2.1Local模式2.1.1
长岛山没有雪
·
2023-11-25 01:45
spark
yarn
大数据
分布式
开源
数据分析
spark
-yarn-cluster任务提交方式Logs出现Fails且无法访问
/
spark
-submit--masteryarn--deploy-modecluster--classorg.apache.
spark
.examples.
Spark
Pi..
CoreDao
·
2023-11-25 01:45
Spark
java
spark
scala
分布式
大数据
1.
spark
源码分析(基于yarn cluster模式)-任务提交
首先声明,这个系列研究的源码基于
spark
-2.4.6我们在使用
spark
-shell提交任务的时候,一般采用如下模式提交任务:park-submit--classxxxxx--name'test_xxxx
Leo Han
·
2023-11-25 01:45
大数据
spark
scala
big
data
yarn
Spark
---基于Yarn模式提交任务
/
spark
-submit--masteryarn--classorg.apache.
spark
.examples.
Spark
Pi..
30岁老阿姨
·
2023-11-25 01:14
Spark
spark
大数据
分布式
Spark
是什么?以及它有哪些应用场景呢?
首先说说
Spark
的起源:
Spark
是UCBerkeleyAMPlab所开源的类HadoopMapReduce的通用的并行计算框架,
Spark
基于mapreduce算法实现的分布式计算,拥有HadoopMapReduce
陈影鸿在进步
·
2023-11-25 01:07
大数据处理
WhatsApp技术
容器
Apache Linkis 修复多个漏洞
编译:代码卫士ApacheLinkis是一款热门的计算中间件,用于弥合上层应用程序和底层引擎之间的差距,从而能够无缝访问多个引擎如MySQL、
Spark
、Hive、Presto和Flink。
奇安信代码卫士
·
2023-11-24 23:31
apache
大数据
hive
hadoop
数据仓库
最新AI创作系统ChatGPT系统运营源码,支持GPT-4图片对话能力,上传图片并识图理解对话,支持DALL-E3文生图
一、AI创作系统
Spark
Ai是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署AI创作ChatGPT?小编这里写一个详细图文教程吧!
只恨天高
·
2023-11-24 22:17
人工智能
系统源码
chatgpt
chatgpt
人工智能
源码软件
AI写作
AI作画
机器学习 之分类
spark
.mllib支持两种线性分类方法:线性支持向量机(SVM)和逻辑回归。线性SVM仅支持二进制分类,而逻辑回归支持二进制和多类分类问题。
辣椒种子
·
2023-11-24 22:01
机器学习
机器学习
分类
人工智能
机器学习之基本的统计工具
除此之外,
spark
.mllib库也提供了一些其他的基本的统计分析工具,包括相关性、分层抽样、假设检验,随机数生成等。
辣椒种子
·
2023-11-24 22:30
机器学习
机器学习
人工智能
docker安装部署Apache Griffin
1)下载docker镜像dockerpullapachegriffin/griffin_
spark
2:0.3.0dockerpullapachegriffin/elasticsearchdockerpullapachegriffin
柒柒钏
·
2023-11-24 21:35
安装教程
docker
apache
Griffin
ARTS-第八周第九周
Tips/Technology一、Kerberos与hadoop生态相关配置与操作HDFS使用kerberosYARN、
Spark
、Hive使用kerberoskerberos+LDA
梧上擎天
·
2023-11-24 17:02
Serverless 在数据处理场景下的最佳应用
我们知道传统的数据处理无外乎涉及Kafka、Logstash、FileBeats、
Spark
、Flink、CLS、COS等组件。
Serverless
·
2023-11-24 17:49
Serverless
serverless
云计算
spark
源码分析之三 -- LiveListenerBus介绍
LiveListenerBus官方说明如下:Asynchronouslypasses
Spark
ListenerEventstoregistered
Spark
Listeners.即它的功能是异步地将
Spark
ListenerEvent
weixin_30457465
·
2023-11-24 16:08
大数据
Spark
重要源码解读
Spark
Conf类/***Configurationfora
Spark
application.Usedtosetvarious
Spark
parametersaskey-valuepairs.
Winyar Wen
·
2023-11-24 16:08
大数据
spark源码
Spark
一级资源调度Shedule机制及SpreadOut模式源码深入剖析
本套系列博客从真实商业环境抽取案例进行总结和分享,并给出
Spark
源码解读及商业实战指导,请持续关注本套博客。版权声明:本套
Spark
源码解读及商业实战归作者(秦凯新)所有,禁止转载,欢迎学习。
weixin_34210740
·
2023-11-24 16:38
大数据
Spark
事件监听总线流程分析-
Spark
商业环境实战
本套系列博客从真实商业环境抽取案例进行总结和分享,并给出
Spark
源码解读及商业实战指导,请持续关注本套博客。版权声明:本套
Spark
源码解读及商业实战归作者(秦凯新)所有,禁止转载,欢迎学习。
weixin_34268753
·
2023-11-24 16:38
大数据
ui
spark
源码:
Spark
Context初始化需要启动的组件
spark
源码分析之
Spark
Context1.
Spark
Context简介2初始化
Spark
Context需要启动的组件2.0
Spark
Context私有的可变成员变量2.1SpaekEnv2.2LiveListenerBus2.3
Spark
UI2.4
Spark
StatusTracker2.5ConsoleProgressBar2.6DAGScheduler2.7TaskScheduler2.8
weixin_38842855
·
2023-11-24 16:38
spark
spark
streaming2.4.0 任务启动源码剖析
官方案例首先以官方启动入手object
Spark
StreamingTest{defmain(args:Array[String]):Unit={valconf=new
Spark
Conf().setAppName
乾坤瞬间
·
2023-11-24 16:07
spark
大数据
spark
streaming
上一页
39
40
41
42
43
44
45
46
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他