E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark安装部署
Keepalived 实现 Kibana 的高可用
目录一、Keepalived
安装部署
1.1准备工作1.2下载安装包并解压1.3编译1.4创建服务文件夹1.5创建服务文件1.6创建检测脚本二、启动keepalived三、检测是否安装成功3.1查看服务状态
季风泯灭的季节
·
2024-01-12 09:02
ELK技术栈
linux
运维
keepalived
高可用
kibana
Spark
避坑系列(三)(
Spark
Core-RDD 依赖关系&持久化&共享变量)
大家想了解更多大数据相关内容请移驾我的课堂:大数据相关课程剖析及实践企业级大数据数据架构规划设计大厂架构师知识梳理:剖析及实践数据建模Py
Spark
入坑系列第三篇,该篇章主要介绍
spark
的编程核心RDD
garagong
·
2024-01-12 09:13
大数据
spark
大数据
hadoop
分布式
数据处理
分布式任务调度平台XXL-JOB
安装部署
分布式任务调度平台XXL-JOB相关教程:使用教程分布式任务调度平台XXL-JOB使用教程_foxofwind的博客-CSDN博客分布式任务调度平台XXL-JOB使用教程https://blog.csdn.net/foxofwind/article/details/120783695集成CAS单点登录调度平台XXL-JOB集成CAS单点登录_foxofwind的博客-CSDN博客本文用最简单的方法
菜鸟老胡~
·
2024-01-12 08:43
技术学习
分布式
实时大数据
大数据
数据仓库
定时任务
Spark
- 直接操作数据源 MySQL
答案就是使用
spark
的计算能力的,我们可以将mysql数据源接入到
spark
中。
kikiki2
·
2024-01-12 07:49
Spark
指令参数,RDD--学习笔记
1,
Spark
的指令参数参数对
spark
所有指令都有效
Spark
指令参数#表示引用运行的模式,要么是本地local要么是集群(Standalone、YARN、Mesos)了--masterMASTER_URL
祈愿lucky
·
2024-01-12 07:05
大数据
大数据
spark
python
Spark
基础
Spark
基础建库一定要指定字符集,错了好多次了pip卸载某个模块pipuninstallpandas--下载其它的改掉pandas即可pipinstall-ihttps://pypi.tuna.tsinghua.edu.cn
中长跑路上crush
·
2024-01-12 07:33
Spark阶段
spark
大数据
分布式
Spark
on Hive及
Spark
SQL的运行机制
Spark
onHive集成原理HiveServer2的主要作用:接收SQL语句,进行语法检查;解析SQL语句;优化;将SQL转变成MapReduce程序,提交到Yarn集群上运行
Spark
SQL与Hive
小希 fighting
·
2024-01-12 07:56
spark
hive
sql
Spark
SQL基础
Spark
SQL基本介绍什么是
Spark
SQL
Spark
SQL是
Spark
多种组件中其中一个,主要是用于处理大规模的结构化数据什么是结构化数据:一份数据,每一行都有固定的列,每一列的类型都是一致的我们将这样的数据称为结构化的数据例如
小希 fighting
·
2024-01-12 07:55
spark
sql
大数据
Spark
六:
Spark
底层执行原理
Spark
Context、DAG、TaskScheduler
Spark
底层执行原理学习
Spark
运行流程学习链接:https://mp.weixin.qq.com/s/caCk3mM5iXy0FaXCLkDwYQ一、
Spark
运行流程流程:
Spark
Context
eight_Jessen
·
2024-01-12 07:19
scala
spark
spark
大数据
Spark
九:
Spark
调优之Shuffle调优
Spark
shuffle调优方法map端和reduce端缓存大小设置,reduce端重试次数和等待时间间隔,以及bypass设置学习资料:https://mp.weixin.qq.com/s/caCk3mM5iXy0FaXCLkDwYQ
eight_Jessen
·
2024-01-12 07:19
scala
spark
spark
大数据
py
spark
使用udf 进行预测,发现只起了一个计算节点
Py
Spark
UDF只使用一个计算节点的问题原因分析默认的并行度设置Py
Spark
在执行UDF(用户定义函数)时,默认可能不会利用所有可用的计算节点。
samoyan
·
2024-01-12 07:18
服务器
python
机器学习
Spark
: 检查数据倾斜的方法以及解决方法总结
1.使用
Spark
UI
Spark
UI提供了一个可视化的方式来监控和调试
Spark
作业。你可以通过检查各个Stage的任务执行时间和数据大小来判断是否存在数据倾斜。
samoyan
·
2024-01-12 07:18
python
spark
大数据
分布式
Spark
SQL进阶
DataFrame详解清洗相关API去重API删除空缺值的API替换缺失值的APIfrompy
spark
import
Spark
Conf,
Spark
Contextimportosfrompy
spark
.sqlimport
Spark
Session
小希 fighting
·
2024-01-12 07:44
spark
sql
大数据
Zookeeper+Hadoop+
Spark
+Flink+Kafka+Hbase+Hive
说明Zookeeper+Hadoop+
Spark
+Flink+Kafka+Hbase+Hive完全分布式高可用集群搭建下载https://archive.apache.org/dist/我最终选择Zookeeper3.7.1
nsa65223
·
2024-01-12 06:08
hadoop
zookeeper
spark
Structured Streaming 官方例子
packageohmysummerimportjava.sql.Timestampimportorg.apache.
spark
.sql.
Spark
Sessionimportorg.apache.
spark
.sql.streaming
焉知非鱼
·
2024-01-12 02:08
Spark
完全分布式集群搭建
环境准备服务器集群我用的CentOS-6.6版本的4个虚拟机,主机名为hadoop01、hadoop02、hadoop03、hadoop04,另外我会使用hadoop用户搭建集群(生产环境中root用户不是可以任意使用的)
spark
小猪Harry
·
2024-01-12 00:41
RabbitMQ 入门指南——安装
RabbitMQQuick(快速手册)RabbitMQ从入门到精通-CSDN专栏RabbitMQ入门教程ForJavaRabbitMQ原理介绍及
安装部署
RabbitM
weixin_33704234
·
2024-01-11 21:39
py
spark
config设置、增加配置、限制_success文件生成;
spark
-submit 集群提交参数
1、py
spark
增加config设置javaheap错误增加内存
spark
=(
Spark
Session.builder.config("
spark
.hadoop.hive.exec.dynamic.partition
loong_XL
·
2024-01-11 18:00
机器学习
python
数据挖掘
linux
运维
服务器
《Py
Spark
大数据分析实战》-27.数据可视化图表Pyecharts介绍
对大数据技术栈Hadoop、Hive、
Spark
、Kafka等有深入研究,对Data
wux_labs
·
2024-01-11 16:21
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
Docker
安装部署
Zabbix
一、Zabbix概述1、Zabbix简介Zabbix是一个企业级的分布式开源监控方案。Zabbix是一款能够监控各种网络参数以及服务器健康性和完整性的软件。Zabbix使用灵活的通知机制,允许用户为几乎任何事件配置基于邮件的告警。这样可以快速反馈服务器的问题。基于已存储的数据,Zabbix提供了出色的报告和数据可视化功能。这些功能使得Zabbix成为容量规划的理想方案。Zabbix支持主动轮询和被
wespten
·
2024-01-11 16:35
Docker
K8s
云原生
CICD
DevOps
docker
zabbix
运维
Prometheus
安装部署
官网安装包下载:https://prometheus.io/download/Prometheus组件:https://github.com/prometheus架构图1、下载并解压安装包下载位置[root@prometheus~]#wgethttps://github.com/prometheus/prometheus/releases/download/v2.18.1/prometheus-2
UStarGao
·
2024-01-11 15:20
What does `rpm -ivh` do?
rpm安装rpm-ivh--relocate/=/opt/gaimgaim-1.3.0-1.fc4.i386.rpm指定安装到/opt/gaim[Ref]rpm-uvh和-ivh有什么区别以及zabbix
安装部署
张紫娃
·
2024-01-11 13:08
LInux
linux
运维
服务器
完整的JAVA酒店管理系统源码带
安装部署
文档
完整的JAVA酒店管理系统源码带
安装部署
文档002.png(135.63KB,下载次数:0)下载附件设为封面半小时前上传
依星net188.com
·
2024-01-11 13:39
酒店管理系统
Linux Centos7.x下
安装部署
VNC的实操详述
1、获取当前系统启动模式[root@localhost~]#systemctlget-defaultmulti-user.target2、查看配置文件[root@localhost~]#cat/etc/inittab#inittabisnolongerusedwhenusingsystemd.##ADDINGCONFIGURATIONHEREWILLHAVENOEFFECTONYOURSYSTEM
Almeche
·
2024-01-11 11:16
工作
Ambari
安装部署
教程(手把手教学)【超级详细】
Ambari的
安装部署
这里有详细的Ambari的
安装部署
,快来围观,保证成功!
小伍_Five
·
2024-01-11 11:20
ambari
php
服务器
AI绘画Midjourney绘画提示词Prompt大全,各种风格大全
一、Midjourney绘画工具
Spark
Ai创作系统是基于ChatGPT进行开发的Ai智能问答系统和Midjourney绘画系统,支持OpenAI-GPT全模型+国内AI全模型。
白云如幻
·
2024-01-11 10:48
人工智能
AIGC
教程
人工智能
chatgpt
语音识别
midjourney
AI作画
prompt
全志V853 NPU开发之工具安装
经测试NPU工具支持下列Linux发行版:Ubuntu20.04其他部分Linux发行版理论上也可以支持
安装部署
,但此处未作验证。
DOT小文哥
·
2024-01-11 08:17
全志V853
全志-工具&测试
全志
NPU
人工智能
开发工具
V853
Spark
---RDD序列化
文章目录1什么是序列化2.RDD中的闭包检查3.Kryo序列化框架1什么是序列化序列化是指将对象的状态信息转换为可以存储或传输的形式的过程。在序列化期间,对象将其当前状态写入到临时或持久性存储区。以后,可以通过从存储区中读取或反序列化对象的状态,重新创建该对象。2.RDD中的闭包检查从计算的角度,算子以外的代码都是在Driver端执行,算子里面的代码都是在Executor端执行。那么在scala的
肥大毛
·
2024-01-11 07:33
scala
大数据
spark
spark
大数据
分布式
Spark
---行动算子RDD
1.1reduce1.2collect1.3first1.4count1.5take1.6takeOrdered1.7aggregate1.8fold1.9countByKey1.10countByValue1.11save相关算子1.12foreach1.行动算子
Spark
肥大毛
·
2024-01-11 07:03
大数据
spark
scala
spark
大数据
分布式
spark
相关
提示:以下是本篇文章正文内容,下面案例可供参考一、算子1.1sample在调用
spark
的samp
晴山ぺ
·
2024-01-11 07:29
java
spark
大数据
分布式
Spark
SQL基础
一.Pandas简介1、基本介绍Pandas是Python的一个第三方包,也是商业和工程领域最流行的结构化数据工具集,用于数据清洗、处理以及分析Pandas和
Spark
SQL中很多功能都类似,甚至使用方法都是相同的
MSJ3917
·
2024-01-11 07:29
spark
大数据
分布式
Spark
八:
Spark
性能优化
Spark
性能调优
Spark
调优的方法,包括RDD使用、文件读取,partition学习资料:https://mp.weixin.qq.com/s/caCk3mM5iXy0FaXCLkDwYQ一、
Spark
eight_Jessen
·
2024-01-11 07:29
scala
spark
spark
性能优化
spark
基础--学习笔记
1
spark
介绍1.1
spark
概念Apache
Spark
是专为大规模数据处理而设计的快速通用的分布式计算引擎,是开源的类HadoopMapReduce的通用分布式计算框架。
祈愿lucky
·
2024-01-11 07:58
大数据
spark
学习
笔记
Python 与 Py
Spark
数据分析实战指南:解锁数据洞见
Python和Py
Spark
作为强大的工具,提供了丰富的库和功能,使得数据分析变得更加高效和灵活。
海拥✘
·
2024-01-11 07:58
python
数据分析
信息可视化
hive sql 和
spark
sql的区别
HiveSQL和
Spark
SQL都是用于在大数据环境中处理结构化数据的工具,但它们有一些关键的区别:底层计算引擎:HiveSQL:Hive是建立在Hadoop生态系统之上的,使用MapReduce作为底层计算引擎
深度学习研究员
·
2024-01-11 07:08
hive
sql
spark
数据库
2024.1.10
Spark
SQL ,函数分类,
Spark
on HIVE,底层执行流程
目录一.开窗函数二.
Spark
SQL函数定义1.HIVE_SQL用户自定义函数2.
Spark
原生UDF3.pandasUDF4.pandasUDAF三.
Spark
onHIVE四.
Spark
SQL的执行流程一
白白的wj
·
2024-01-11 07:08
大数据
spark
sql
python
hive
hadoop
mapreduce
GBASE南大通用GBase 8a
安装部署
1.ssh连通性验证
[email protected]
@
[email protected]
.检查防火墙是否关闭systemctlstatusfirewalld.servicesystemctlstopfirewalldsystemctldisablefirewalld3.检查selinux是否禁用sestatus若系统提示以下信息说明selinu
GBASE数据库
·
2024-01-11 06:03
数据库
GBASE南大通用
GBASE
spark
分布式解压工具
spark
分布式解压工具文章目录
spark
分布式解压工具一、目标二、详细设计三、操作说明1.提交模式2.压缩输出路径支持2种方式3.操作命令及说明3.1操作命令3.2命令说明四、操作案例4.1案例1一、
侠客刀
·
2024-01-11 06:56
分布式
spark
eclipse
初探
Spark
SQL catalog缓存机制
先说结论:
Spark
SQLcatalog中对表结构的缓存一般不会自动更新。实验如下:在pg中新建一张表t1,其中只有一列c1int在
Spark
SQL中注册这张表,并从中查询数据.
archimekai
·
2024-01-11 06:54
spark
【Kafka-3.x-教程】-【六】Kafka 外部系统集成 【Flume、Flink、SpringBoot、
Spark
】
【Kafka-3.x-教程】专栏:【Kafka-3.x-教程】-【一】Kafka概述、Kafka快速入门【Kafka-3.x-教程】-【二】Kafka-生产者-Producer【Kafka-3.x-教程】-【三】Kafka-Broker、Kafka-Kraft【Kafka-3.x-教程】-【四】Kafka-消费者-Consumer【Kafka-3.x-教程】-【五】Kafka-监控-Eagle【K
bmyyyyyy
·
2024-01-11 06:50
Kafka
kafka
flume
flink
spark
#kafka集成外部系统
使用Springboot+websocket+kafka模拟实时数据传输
Springboot+websocket+kafka模拟实时数据传输环境准备数据源读取WebSocket服务器网页启动使用Springboot+websocket+kafka模拟实时数据传输环境准备环境:本地
Spark
叶梦璃愁
·
2024-01-11 06:36
websocket
springboot
kafka
spring
boot
websocket
【AI】AI入门之Nvidia Jetson平台(四)- Xavier NX软件开发环境
安装部署
.TensorFlow安装五.PyTorch安装六.DeepStream安装6.1安装依赖软件6.2安装DeepStreamSDK6.3运行DEMO七.MultimediaAPI安装八.VPI安装主要
安装部署
需要的
有意思科技
·
2024-01-11 03:15
Jetson
人工智能
Ubuntu
人工智能
pytorch
深度学习
Hadoop与
Spark
:大数据处理框架的比较与选择
Hadoop与
Spark
:大数据处理框架的比较与选择在大数据的时代背景下,数据处理和分析的需求日益增长。
乌龙饼干
·
2024-01-11 01:14
hadoop
spark
大数据
Phoenix基本使用
1.2Phoenix特点容易集成:如
Spark
,Hive,Pig,Flume和MapReduce。
有语忆语
·
2024-01-10 22:30
大数据之Hive
Phoenix
81、
Spark
Streaming之DStream以及基本工作原理
Spark
Streaming简介
Spark
Streaming是
Spark
CoreAPI的一种扩展,它可以用于进行大规模、高吞吐量、容错的实时数据流的处理。
ZFH__ZJ
·
2024-01-10 20:43
讯飞版大模型来了,现场发布四大行业应用成果
文章目录人工智能福利文章前言
Spark
Desk讯飞星火认知大模型简介语言理解知识问答逻辑推理数学题解答代码理解与编写亲自体验写在最后✍创作者:全栈弄潮儿个人主页:全栈弄潮儿的个人主页️个人社区,欢迎你的加入
全栈弄潮儿²⁰²⁴
·
2024-01-10 19:10
AI大模型
人工智能
机器学习
AI大模型
chatgpt
讯飞星火认知大模型
openGauss 5.0.0企业版一主一备
安装部署
目录一、环境准备1.华为云购买两台ECS1.1查看openEuler版本,操作系统版本及CPU的制式是基础1.2查看CPU模式1.3操作系统环境准备2.集群配置XML文件准备:2.1集群参数配置:2.2主机参数配置:2.3备机参数配置:二、预安装1.执行preinstall命令:2.提示输入omm用户的密码:3.再次输入omm用户的密码:4.一些安装过程由于粗心遇到的小问题,根据提示修改后重新执行
Gauss松鼠会
·
2024-01-10 19:26
openGauss经验总结
数据库
服务器
运维
gaussdb
SQL
数据安全
Jenkins安装与配置及汉化
其特点有:易于
安装部署
配置:可通过yum安装,或下载war包以及通过docker容器等快速实现
安装部署
,可方便web界面配置管理。消息通知及测试报告:集成
风雪留客
·
2024-01-10 17:59
Jenkins
二进制安装包安装Prometheus插件安装(mysql_exporter)
既可以用二进制
安装部署
,也可以通过容器形式部署,但为了数据收集的准确性,推荐二进制安装。
ζั͡山 ั͡有扶苏 ั͡✾
·
2024-01-10 17:45
Linux运维
DevOps运维
prometheus
mysql
数据库
运维
Spark
- 升级版数据源JDBC2
>在
spark
的数据源中,只支持Append,Overwrite,ErrorIfExists,Ignore,这几种模式,但是我们在线上的业务几乎全是需要upsert功能的,就是已存在的数据肯定不能覆盖,
kikiki5
·
2024-01-10 17:53
上一页
23
24
25
26
27
28
29
30
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他