E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark集群搭建
Hbase深入浅出
大家熟知的
Spark
、以及Hadoop的MapReduce,可以理解为一种计算框架。而HDFS,我们可以认为是为计算框架服务的存
天才之上
·
2025-02-18 03:13
数据存储
Hbase
大数据存储
深入浅出了解HBase及RDD编程
HBase为什么能存储海量数据创建一个HBase表配置
Spark
编写程序读取HBase数据编写程序向HBase写入数据关于搭建HBase高可用集群的图文教程,可参考我的另一篇博文——安装并配置HBase
山海王子
·
2025-02-18 03:11
大数据
hbase
MongoDB分片
集群搭建
及扩容
准备工作在CentOS7上安装MongoDB分片集群6Servers代表:6台服务器上都要操作.环境准备On6Servers给虚拟机设置静态IPvi/etc/sysconfig/network-scripts/ifcfg-enp0s3修改以下#BOOTPROTO=“dhcp”BOOTPROTO=“static”IPADDR=“.xx.xx.xx.xx”NETMASK=“255.255.255.0”
老虎大人
·
2025-02-18 02:29
ubuntu安装k8s
centos:centos:K8Sv1.28.2
集群搭建
-docker版-一毛丶丶-博客园centos:Kubernetes详细安装教程_kubernetes安装-CSDN博客准备工作:1、主机名解析:
qq_41369135
·
2025-02-17 06:15
ubuntu
kubernetes
linux
Spark
性能优化(四):Cache
在
Spark
中,缓存是一种将计算结果存储在内存中的方式,目的是加速后续操作。当你执行迭代算法或查询时,如果多次重复使用相同的数据集,缓存可以避免每次都重新计算相同的转换操作。
LevenBigData
·
2025-02-17 00:04
spark
性能调优
spark
性能优化
大数据
使用Docker搭建Flink集群
我们知道,像
spark
、flink这些计算框架都有多种运行模式:在本地使用多线程模拟集群真正的分布式集群如果直接在IDE(Intellj)里面编译和运行写好的程序,实际上是用的前一种运行模式;如果想尝试真正的生产环境中任务的提交和管
O_1CxH
·
2025-02-16 20:34
Flink大数据
Kafka大数据
docker
flink
容器
Elasticsearch-API命令行相关操作手册
系列文章目录第一章es
集群搭建
文章目录系列文章目录前言esApi操作总结前言通过第一章学习es
集群搭建
流程及es基本概念后,在本章内容中,我们主要对es的基本命令行操作进行一次基本学习,来源于工作中的整理
少儿频道
·
2025-02-16 12:05
elasticsearch
中间件
elasticsearch
运维
Spark
和 Flink
Spark
和Flink都是目前流行的大数据处理引擎,但它们在架构设计、应用场景、性能和生态方面有较大区别。
信徒_
·
2025-02-16 12:04
spark
flink
大数据
spark
任务运行
运行环境在这里插入代码片[root@hadoop000conf]#java-versionjavaversion"1.8.0_144"Java(TM)SERuntimeEnvironment(build1.8.0_144-b01)[root@hadoop000conf]#echo$JAVA_HOME/home/hadoop/app/jdk1.8.0_144[root@hadoop000conf]#
冰火同学
·
2025-02-16 11:56
Spark
spark
大数据
分布式
【Redis】golang操作Redis基础入门
【Redis】golang操作Redis基础入门大家好我是寸铁总结了一篇【Redis】golang操作Redis基础入门
spark
les:喜欢的小伙伴可以点点关注Redis的作用Redis(RemoteDictionaryServer
寸 铁
·
2025-02-16 07:24
go
数据库
Redis
redis
golang
数据库
CRUD
基本操作
分布式
键值对
hive
spark
读取hive hbase外表报错分析和解决
问题现象使用
Spark
shell操作hive关联Hbase的外表导致报错;hive使用tez引擎操作关联Hbase的外表时报错。
spring208208
·
2025-02-16 07:21
hive
hive
spark
hbase
spark
-广播变量
当本地数据极大的时候,可以使用广播变量,使得减少内存。本地集合对象和分布式集合对象(RDD)进行关联的时候,需要将本地集合对象广播变量。本地的数据传输到集群上,会发到每一个线程,每一个分区。每一个进程executor,有多个线程分区,进程内的线程数据共享因此,给每一个线程发送数据会导致数据占用,浪费资源。所有,出现了广播变量,使得只发送给进程代码使用:broadcast=sc.broadcast(
哈哈哈哈q
·
2025-02-16 05:12
+spark
hdfs
hadoop
大数据
spark
MySQL 运维篇 -- 主从
集群搭建
文章目录主从复制主从复制原理主从故障处理延时从库主从GTID复制主从GR复制*****搭建组复制观察组复制主从复制主从同步过程(1)主丛复制基于binlog来实现的(2)主库发生新的操作,都会记录binlog(3)从库取得主库的binlog进行回放(4)主从复制是异步的准备主从的初始MySQL环境(YUM安装)[root@master~]#hostnamemaster[root@master~]#
L小Ray想有腮
·
2025-02-15 20:35
MySQL
mysql
运维
数据库
探索数据云的无缝桥梁:Apache
Spark
与 Snowflake 的完美结合
探索数据云的无缝桥梁:Apache
Spark
与Snowflake的完美结合
spark
-snowflakeSnowflakeDataSourceforApache
Spark
.项目地址:https://gitcode.com
窦育培
·
2025-02-15 12:32
maven插件学习(maven-shade-plugin和maven-antrun-plugin插件)
整合
spark
3.3.x和hive2.1.1-cdh6.3.2碰到个问题,就是
spark
官方支持的hive是2.3.x,但是cdh中的hive确是2.1.x的,项目中又计划用
spark
-thrift-server
catcher92
·
2025-02-15 08:00
java
maven
maven
学习
大数据
使用
Spark
LLM实现智能聊天:技术原理与实战演示
在本篇文章中,我们将探讨如何使用iFlyTek的
Spark
LLM模型来实现智能聊天功能。我们将详细介绍
Spark
LLM的技术背景、核心原理,并通过实际代码展示如何进行实现。
shuoac
·
2025-02-15 06:41
java
ClickHouse
集群搭建
(CENTOS7环境)
ClickHouse
集群搭建
(CENTOS7环境)1.rpm包下载下载的rpm包版本-rw-r--r--1rootroot1342545月2817:07clickhouse-client-20.3.9.70
huaxia2002
·
2025-02-15 05:07
大数据常用框架
入门
Spark
性能优化 (三):RBO 与 CBO
1.RBO的核心概念在Apache
Spark
的查询优化过程中,规则优化(Rule-BasedOptimization,RBO)是Catalyst优化器的一个关键组成部分。
LevenBigData
·
2025-02-15 02:09
spark
性能调优
spark
性能优化
ajax
python 并行框架_基于python的高性能实时并行机器学习框架之Ray介绍
这种框架名为Ray,看起来有望取代
Spark
,业界认为
Spark
对于一些现实的人工智能应用而言速度太慢了;过不了一年,Ray应该会准备好用于生产环境。目前ray已经发布了0.3.0
weixin_39778582
·
2025-02-14 20:54
python
并行框架
java获取hive表所有字段,Hive Sql从表中动态获取空列计数
我正在使用datastax
spark
集成和
spark
SQLthrift服务器,它为我提供了一个HiveSQL接口来查询Cassandra中的表.我的数据库中的表是动态创建的,我想要做的是仅根据表名在表的每列中获取空值的计数
拾亿年
·
2025-02-14 16:23
java获取hive表所有字段
Py
Spark
查询Dataframe中包含乱码的数据记录的方法
首先,用Py
Spark
获取Dataframe中所有非ASCII字符,找到其中的非乱码字符。
weixin_30777913
·
2025-02-14 16:23
python
大数据
spark
从0到1带大家搭建spring cloud alibaba 微服务大型应用框架(九)文件服务篇(1):minio 单机与
集群搭建
为什么需分布式文件服务单机时代初创时期由于时间紧迫,在各种资源有限的情况下,通常就直接在项目目录下建立静态文件夹,用于用户存放项目中的文件资源。如果按不同类型再细分,可以在项目目录下再建立不同的子目录来区分。例如:resources\static\file、resources\static\image等。优点:这样做比较便利,项目直接引用就行,实现起来也简单,无需任何复杂技术,保存数据库记录和访问
峡谷电光马仔
·
2025-02-14 10:43
spring
cloud
minio
alibaba
分布式文件
spark
streaming基础操作
spark
streaming基础操作一、什么是
spark
streaming
Spark
Streaming用于流式数据的处理。
天选之子123
·
2025-02-14 09:33
大数据
spark
大数据
分布式
Sealos的k8s高可用
集群搭建
Sealos介绍](https://sealos.io/zh-Hans/docs/Intro)Sealos是一个Go语言开发的简单干净且轻量的Kubernetes集群部署工具,能很好的支持在生产环境中部署高可用的Kubernetes集群。Sealos特性与优势支持离线安装,工具与部署资源包分离,方便不同版本间快速升级。证书有效期默认延期至99年。工具使用非常简单。支持使用自定义配置文件,可灵活完成
da pai ge
·
2025-02-13 22:55
kubernetes
容器
云原生
flink实时集成利器 - apache seatunnel - 核心架构详解
它支持多种数据源和数据目标,并可以与ApacheFlink、
Spark
等计算引擎集成。
24k小善
·
2025-02-12 23:38
flink
apache
架构
DS缩写乱争:当小海豚撞上AI顶流,技术圈也逃不过“撞名”修罗场
这个2019年诞生的分布式任务调度系统,凭借可视化DAG界面、多租户支持和对Hadoop/
Spark
生态的深度集成,一度是大数据工程师的“梦中情工”。
·
2025-02-12 18:58
数据库
k8s第一章:kubeadm
集群搭建
开源容器应用自动化部署技术KubernetesKubernetes这个单词来自于希腊语,含义是舵手或领航员;生产环境级别的容器编排编排是什么意思:1.按照一定的目的依次排列;2.调配、安排;Kubernetes,也称为K8S,其中8是代表中间“ubernete”的8个字符,是Google在2014年开源的一个容器编排引擎,用于自动化容器化应用程序的部署、规划、扩展和管理,它将组成应用程序的容器分组
琴剑诗酒
·
2025-02-12 13:27
kubernetes
容器
云原生
如何在Java中实现高效的分布式计算框架:从Hadoop到
Spark
如何在Java中实现高效的分布式计算框架:从Hadoop到
Spark
大家好,我是微赚淘客系统3.0的小编,是个冬天不穿秋裤,天冷也要风度的程序猿!
省赚客app开发者
·
2025-02-12 07:12
java
hadoop
spark
Spark
源码分析
过程描述:1.通过Shell脚本启动Master,Master类继承Actor类,通过ActorySystem创建并启动。2.通过Shell脚本启动Worker,Worker类继承Actor类,通过ActorySystem创建并启动。3.Worker通过Akka或者Netty发送消息向Master注册并汇报自己的资源信息(内存以及CPU核数等),以后就是定时汇报,保持心跳。4.Master接受消息
数据年轮
·
2025-02-11 22:11
Spark
spark源码
spark
大数据
源码分析
Spark
源码 | 脚本分析总结
前言最初是想学习一下
Spark
提交流程的源码,比如
Spark
OnYarn、Standalone。
董可伦
·
2025-02-11 21:31
spark
源码
脚本
Spark
性能调优-----常规性能调优(一)最优资源配置
1.1.1常规性能调优一:最优资源配置
Spark
性能调优的第一步,就是为任务分配更多的资源,在一定范围内,增加资源的分配与性能的提升是成正比的,实现了最优的资源配置后,在此基础上再考虑进行后面论述的性能调优策略
weidajiangjiang
·
2025-02-11 01:01
spark
性能调优
常规资源配置
Spark
性能调优系列:
Spark
资源模型以及调优
Spark
资源模型
Spark
内存模型
Spark
在一个Executor中的内存分为三块,execution内存、storage内存、other内存。
Mr Cao
·
2025-02-11 01:29
大数据
spark
Spark性能调优
spark
性能调优 (一):执行计划
在
Spark
中,explain函数用于提供数据框(DataFrame)或SQL查询的逻辑计划和物理执行计划的详细解释。
LevenBigData
·
2025-02-11 01:26
spark
性能调优
spark
大数据
spark
技术基础知识
1.
Spark
的宽窄依赖划分Q:
Spark
中如何划分宽依赖和窄依赖?A:窄依赖:父RDD的每个分区最多被一个子RDD的分区依赖(如map、filter),不会触发shuffle。
24k小善
·
2025-02-10 15:16
spark
服务器
ELK系列(二)Kafka集群3.4.0搭建
ELK系列传送门ELK系列(一)ElasticSearch8.9.2
集群搭建
ELK系列(二)Kafka集群3.4.0搭建ELK数据流规划ELK接入nginx-acces日志数据流规划数据流向filebeat
诉光海
·
2025-02-10 15:40
ELK
elk
java
服务器
kafka
Elasticsearch 7
集群搭建
问题排查:常见故障解决方案与优化技巧
然而,在实际部署中,尤其是
集群搭建
阶段,许多用户都会遇到配置问题,导致集群无法成功建立。
程序员的开发手册
·
2025-02-10 14:36
运维
教程
Elasticsearch
elasticsearch
集群搭建
问题排查
常见故障
解决方案
Spark
图书数据分析系统 Springboot协同过滤-余弦函数推荐系统 爬虫1万+数据 大屏数据展示 + [手把手视频教程 和 开发文档]
Spark
图书数据分析系统Springboot协同过滤-余弦函数推荐系统爬虫1万+数据大屏数据展示+[手把手视频教程和开发文档]【亮点功能】1.Springboot+Vue+Element-UI+Mysql
QQ-1305637939
·
2025-02-10 05:10
毕业设计
大数据毕设
图书数据分析
spark
spring
boot
爬虫
计算机毕业设计hadoop+
spark
+hive新能源汽车数据分析可视化大屏 汽车推荐系统 新能源汽车推荐系统 汽车爬虫 汽车大数据 机器学习 大数据毕业设计 深度学习 知识图谱 人工智能
(1)设计目的本次设计一个基于Hive的新能源汽车数据仓管理系统。企业管理员登录系统后可以在汽车保养时,根据这些汽车内置传感器传回的数据分析其故障原因,以便维修人员更加及时准确处理相关的故障问题。或者对这些数据分析之后向车主进行预警提示车主注意保养汽车,以提高汽车行驶的安全系数。(2)设计要求利用Flume进行分布式的日志数据采集,Kafka实现高吞吐量的数据传输,DateX进行数据清洗、转换和整
qq+593186283
·
2025-02-09 21:35
hadoop
大数据
人工智能
【
spark
】【在YARN上运行
Spark
】【Running
Spark
on YARN】
目录Running
Spark
onYARN在YARN上运行
Spark
Security安全Launching
Spark
onYARN在YARN上启动
Spark
AddingOtherJARs添加其他JARPreparations
资源存储库
·
2025-02-09 17:42
spark
在Jupyter Notebook中进行大数据分析:集成Apache
Spark
在JupyterNotebook中进行大数据分析:集成Apache
Spark
介绍JupyterNotebook是一款广泛使用的数据科学工具,结合Apache
Spark
后,能够处理和分析大规模数据。
范范0825
·
2025-02-09 17:42
jupyter
数据分析
apache
知识图谱智能应用系统:数据分析与挖掘技术文档
本技术文档详细介绍了数据分析与挖掘模块中使用到的关键技术,包括
Spark
ML、StanfordNLP、JNA、Jena、Python调用以及定时调度。二、技术栈介绍(一)Spa
光芒再现0394
·
2025-02-09 09:47
知识图谱
数据分析
人工智能
spark
性能优化点(超详解!!!珍藏版!!!)
spark
性能优化点分配更多的资源1.1分配哪些资源1.2在哪里可以设置这些资源1.3参数调节到多大,算是最大分配更多的资源:它是性能优化调优的王道,就是增加和分配更多的资源,这对于性能和速度上的提升是显而易见的
深漠大侠
·
2025-02-09 08:10
spark
spark性能优化
spark
1.6.0分布式安装
1.概述本文是对
spark
1.6.0分布式集群的安装的一个详细说明,旨在帮助相关人员按照本说明能够快速搭建并使用
spark
集群。
问道9527
·
2025-02-09 08:33
spark
spark
分布式
集群
spark
安装与环境配置
1.安装
spark
官网http://
spark
.apache.org/downloads.html考虑到
spark
之后要结合hadoop一起使用,所以下载和已经安装hadoop版本均兼容的
spark
(首先安装好
Handoking
·
2025-02-09 08:03
大数据进阶中
spark
python
安装
3.5寸圈圈机移植阿木实验室P230旗舰款,纯视觉定位
1、使用3.5寸圈圈机架Bee352、使用淘宝微空家四合一电调、PX4飞控、MTF-01光流3、使用淘宝华虎家的数传4、使用阿木家的All
spark
1NX作为机载电脑,在Ubuntu18.04下运行ros
永不炸机
·
2025-02-09 01:42
无人机
prometheus
ROS
PX4
c++
spark
on yarn-cluster在生产环境 部署
spark
任务, 同时支持读取外部可配置化文件
Spark
Yarn-cluster在生产环境部署,同时支持参数可配置化方法在
Spark
中,有Yarn-Client和Yarn-Cluster两种模式可以运行在Yarn上,通常Yarn-cluster适用于生产环境
千里风雪
·
2025-02-08 20:40
spark
linux运维
spark
大数据
hadoop
spark
-py
spark
-standalone部署模式全过程
声明:1.参考视频b站黑马程序员视频,极力推荐这个视频,侵权删除https://www.bilibili.com/video/BV1Jq4y1z7VP/?spm_id_from=333.337.search-card.all.click&vd_source=3ae466b20a9e8eabdaa10e84c99758492.第一次配置,仅作为个人记录使用。3.参考黑马程序员standalone配置
哈哈哈哈q
·
2025-02-08 20:05
spark
大数据
分布式
大数据集群
Spark
-on-Yarn+Paddle深度学习模型部署
测试环境:
Spark
版本:2.4.0Python版本:2.6.XPaddlePaddle版本:2.4.2处理器:CPU过程记录:1.python运行环境准备本人使用Anaconda管理虚拟环境。
jqtree
·
2025-02-08 19:32
#
大数据开发
大数据
spark
paddle
类库与框架、在window(pycharm)搭建py
spark
库,连接Linux。
类库:一堆别人写好的代码,可以直接导入使用,pandas框架:可以独立运行,软件产品,如
spark
pandas用于:小规模数据集
spark
用于:大规模数据集py
spark
python的运行类库,内置了完全的
哈哈哈哈q
·
2025-02-08 18:23
+spark
spark
大数据
分布式
安装mysql的MGR集群
3、MGR
集群搭建
方便,master故障会自动进行切换,不影响业务正常访问。
秋天枫叶35
·
2025-02-08 12:44
安装中间件
mysql
数据库
MGR集群
运维
linux
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他