E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark集群
部署EFK
1.安装JDK,配置JAVA环境2.安装配置Tomcat3.Tomcat配置说明4.启动Tomcat5.优化Tomcat启动速度四、配置Elasticsearch环境五、安装elasticsearch
集群
m0_59430185
·
2024-09-07 10:35
EFK
EFK
Py
Spark
数据分析基础:Py
Spark
基础功能及DataFrame操作基础语法详解_py
spark
rdd
DataFrame.show()使用格式:df.show()df.show(1)+---+---+-------+----------+-------------------+|a|b|c|d|e|+---+---+-------+----------+-------------------+|1|2.0|string1|2000-01-01|2000-01-0112:00:00|+---+---
2401_84187537
·
2024-09-07 08:47
数据分析
数据挖掘
Py
Spark
数据分析基础:Py
Spark
基础功能及DataFrame操作基础语法详解_py
spark
rdd(1)
dfDataFrame[a:bigint,b:double,c:string,d:date,e:timestamp]####通过由元组列表组成的RDD创建rdd=
spark
.
spark
Context.parallelize
2401_84181368
·
2024-09-07 08:46
程序员
数据分析
数据挖掘
Py
Spark
数据分析基础:Py
Spark
基础功能及DataFrame操作基础语法详解_py
spark
rdd(2)
轻松切换到pandasAPI和Py
Spark
API上下文,无需任何开销。有一个既适用于pandas(测试,较小的数据集)又适用于
Spark
(分布式数据集)的代码库。
2401_84181403
·
2024-09-07 08:46
程序员
数据分析
数据挖掘
Py
spark
DataFrame常用操作函数和示例
针对类型:py
spark
.sql.dataframe.DataFrame目录1.打印前几行1.1show()函数1.2take()函数2.读取文件2.1
spark
.read.csv3.获取某行某列的值(
还是那个同伟伟
·
2024-09-07 08:15
Spark
人工智能
机器学习
pandas
pyspark
spark
大数据系列 | Kafka架构分析及应用
大数据系列|Kafka架构分析及应用1.消息系统介绍2.Kafka原理分析3.Kafka架构分析4.Kafka的安装与配置4.1.Zookeeper
集群
安装配置4.2.安装Kafka
集群
4.3.配置kafka
降世神童
·
2024-09-07 07:42
大数据技术专栏
大数据
kafka
架构
Python处理大数据,如何提高处理速度
一、利用大数据分析工具Dask:https://dask.org/Dask简介:Dask支持Pandas的DataFrame和NumpyArray的数据结构,并且既可在本地计算机上运行,也可以扩展到在
集群
上运行
RS&
·
2024-09-07 07:08
#
python
python
大数据
pandas
k8s|组件基本概念
kubernetes是一个可移植的,可扩展的开源平台,是Google开源的容器
集群
管理系统(谷歌内部:Borg),用于管理容器化的工作负载和服务,可促进声明式配置和自动化。
yygr
·
2024-09-07 05:55
容器化
kubernetes
docker
容器
Spark
概念知识笔记
最近总结了个人的各项能力,发现在大数据这方面几乎没有涉及,因此想补充这方面的知识,丰富自己的知识体系,大数据生态主要包含:Hadoop和
Spark
两个部分,
Spark
作用相当于MapReduceMapReduce
kuntoria
·
2024-09-07 05:21
3. ceph-mimic版本部署
环境规划2、系统基础环境准备2.1关闭防火墙、SELinux2.2确保所有主机时间同步2.3所有主机ssh免密2.4添加所有主机解析3、配置ceph软件仓库4、安装ceph-deploy工具5、ceph
集群
初始化
Martin_wjc
·
2024-09-07 03:11
7
存储
ceph
chrome
前端
mysql连接oceanbase数据库
集群
+租户
useUnicode=true&characterEncoding=UTF-8&serverTimezone=UTC//其他参数根据需求设置username:[用户名]@[租户名]#[
集群
名]password
AE_
·
2024-09-07 02:36
数据库
mysql
oceanbase
为什么需要分布式数据库
令人“头都大了”的分库分表中间件10多年前阿里因此原因不得不把淘宝后台系统从OracleRAC切换到数百个MySQL
集群
构成的分库分表
集群
,不过那时的淘宝仅仅使用一个分库分表中间件,名为tddl(又名:
KunlunBase 昆仑数据库
·
2024-09-06 21:08
KunlunBase
postgresql
数据库
mysql
分布式存储
数据库开发
如何搭建一个渲染农场
在影视特效、动画制作、建筑设计等领域,渲染农场作为高性能计算
集群
的应用,扮演着至关重要的角色。它通过将大量的渲染任务分配到多个计算节点上并行处理,极大地提升了渲染效率,缩短了项目周期。
炫云云渲染
·
2024-09-06 20:01
渲染农场
渲染解决方案
在Conda环境中高效使用Kubernetes:跨平台容器化实践指南
本文将探讨如何在Conda环境中使用Kubernetes,包括设置Conda环境、容器化应用程序以及在Kubernetes
集群
中部署和管理这些应用程序。
liuxin33445566
·
2024-09-06 20:59
conda
redis cluster
文章目录节点CLUSTERMEET命令的实现槽指派传播节点的槽指派信息复制与故障转移故障检测故障转移选举新的主节点节点一个Redis
集群
通常由多个节点(node)组成,在刚开始的时候,每个节点都是相互独立的
黑夜无路人
·
2024-09-06 20:27
redis
redis
数据库
缓存
Kubectl:Kubernetes 的强大命令行工具
它就像是一位全能的指挥官,让用户能够与Kubernetes
集群
进行高效而直接的交互。无论是管理容器化应用的部署、监控资源的使用情况,还是处理故障排查等任务,kubectl都发挥着不可或缺的作用。
编程点滴
·
2024-09-06 19:55
云原生
kubernetes
容器
云原生
大数据秋招面经之
spark
系列
文章目录前言
spark
高频面试题汇总1.
spark
介绍2.
spark
分组取TopN方案总结:方案2是最佳方案。
wq17629260466
·
2024-09-06 19:54
大数据
spark
第04课:基于 Redis 的分布式缓存实现及加固策略
本文将从Redis-Cluster搭建切入,详解
集群
的创建原理和加固策略。之后,分析
集群
所存在的几种可靠性问题并给出解决方案,最后,介绍一个
集群
运维软件的实现方案。
Jin_Kwok
·
2024-09-06 18:13
分布式中间件实践之路
架构
分布式
中间件
027、架构_资源_GTM
系统级GTM:默认的GTM,当创建分片
集群
时,如果不创建实例级GTM,则会用系统级GTM本章节主要介绍GTM
集群
的新增、删除、配置、绑定等管理操作。
数哥
·
2024-09-06 18:41
GoldenDB
goldendb
PolarDB for PostgreSQL 内核解读:HTAP架构介绍
存储计算分离的架构基础上我们研发了基于共享存储的MPP架构步具备了HTAP的能力,对一套TP的数据支持两套执行引擎:单机执行引擎用于处理高并发的OLTPMPP跨机分布式执行引擎用于复杂的OLAP查询,发挥
集群
多个
阿里云技术
·
2024-09-06 16:28
架构
postgresql
系统架构
81.MySQL-PXC高可用
集群
[OK]当前
集群
只有一个节点。my
戒掉贪嗔痴(薛双奇)
·
2024-09-06 15:58
数据库运维-MySQL
mysql
数据库
mysql8.0使用PXC实现高可用
使用PXC实现高可用1.概述官方文档:PerconaXtradbCluster8.0DocumentationPXC(PerconaXtraDBCluster)是一个开源的高可用性、高性能的MySQL
集群
解决方案
帽子运维笔记
·
2024-09-06 15:24
数据库
运维
mysql
数据库
k8s安装test
k8s
集群
部署准备工作三台centos7虚拟机(内存每个节点4G)[root@master~]#cat/etc/redhat-releaseCentOSLinuxrelease7.9.2009(Core
qBeautifulBoy
·
2024-09-06 15:23
kubernetes
容器
云原生
Kafka 如何保证数据不丢失?不重复
缺点:这样保证了高可用,但是这会导致
集群
的吞吐量不是很高,因为数据发送到broker之后,leader要将数据同步到fllower上,如果网
优秀后端工程师
·
2024-09-06 15:23
Java程序员
kafka
linq
分布式
MySQL 高可用--PXC
1.PXC(PerconaXtradbCluster)Percona:基于MySQL数据库已二次开发的数据库产品xtradb:存储引擎Cluster:
集群
1.1概念:PXC是属于一套比较完美的MySQL
行走的猫儿
·
2024-09-06 15:52
MySQL
每天一个数据分析题(五百一十四)- 决策树算法
D.叶结点(leafnode)数据分析认证考试介绍:点击进入题目来源于CDA模拟题库点击此处获取答案数据分析专项练习题库内容涵盖Python,SQL,统计学,数据分析理论,深度学习,可视化,机器学习,
Spark
跟着紫枫学姐学CDA
·
2024-09-06 15:20
数据分析题库
算法
数据分析
决策树
【
Spark
高级应用】使用
Spark
进行高级数据处理与分析
Spark
高级应用使用
Spark
进行高级数据处理与分析引言在大数据时代,快速处理和分析海量数据是每个企业面临的重大挑战。
爱技术的小伙子
·
2024-09-06 10:47
大数据
spark
ajax
大数据
spark
读取csv文件
测试
spark
读取本地和hdfs文件frompy
spark
.sqlimport
Spark
Session
spark
=
Spark
Session.builder\.appName("ExamplePy
Spark
Script
静听山水
·
2024-09-06 10:44
Spark
spark
Spark
Streaming业务逻辑处理的一些高级算子
packagecom.
spark
scala.streamingimportorg.apache.log4j.{Level,Logger}impor
看见我的小熊没
·
2024-09-06 09:43
sparkStreaming
scala
spark
big
data
scala
Spark
一些个人总结
文章目录前言一、
Spark
是什么二、
Spark
用来做什么三、
Spark
的优势是什么四、为什么用
Spark
五、
Spark
解决了什么问题总结前言随着大数据技术的发展,一些更加优秀的组件被提了出来,比如现在最常用的
易逑实战数据
·
2024-09-06 09:39
大数据
spark
big
data
scala
spark
任务优化参数整理
以下参数中有sql字眼的一般只有
spark
-sql模块生效,例外的时候会另行说明,此外由于总结这些参数是在不同时间段,当时使用的
spark
版本也不一样,因此要注意是否有效,如果本博主已经试过的会直接说明
尘世壹俗人
·
2024-09-06 09:08
大数据Spark技术
spark
大数据
分布式
Kafka-设计原理
ControllerLeader-PartitionRebalance消息发布机制HW与LEO日志分段ControllerKafka核心总控制器Controller:在Kafka
集群
中会有一个或者多个broker
姜希成
·
2024-09-06 07:59
Kafka
kafka
Spark
与Kafka进行连接
在Java中使用
Spark
与Kafka进行连接,你可以使用
Spark
Streaming来处理实时流数据。以下是一个简单的示例,展示了如何使用
Spark
Streaming从Kafka读取数据并进行处理。
傲雪凌霜,松柏长青
·
2024-09-06 07:27
后端
大数据
spark
kafka
芯擎SEC1000支持摄像头和屏幕的数量根据分辨率和帧率详细计算
1.CPU
集群
4×Cortex-A76和4×Cortex-A55:Cor
空间机器人
·
2024-09-06 06:53
自动驾驶
Spark
入门:KMeans聚类算法
聚类(Clustering)是机器学习中一类重要的方法。其主要思想使用样本的不同特征属性,根据某一给定的相似度度量方式(如欧式距离)找到相似的样本,并根据距离将样本划分成不同的组。聚类属于典型的无监督学习(UnsupervisedLearning)方法。与监督学习(如分类器)相比1,无监督学习的训练集没有人为标注的结果。在非监督式学习中,数据并不被特别标识,学习模型是为了推断出数据的一些内在结构。
17111_Chaochao1984a
·
2024-09-06 05:46
算法
spark
kmeans
Spark
MLlib模型训练—聚类算法 K-means
Spark
MLlib模型训练—聚类算法K-meansK-means是一种经典的聚类算法,广泛应用于数据挖掘、图像处理、推荐系统等领域。
不二人生
·
2024-09-06 04:14
Spark
ML
实战
算法
spark-ml
聚类
Spark
MLlib模型训练—聚类算法 Bisecting K-means
Spark
MLlib模型训练—聚类算法BisectingK-means由于传统的KMeans算法的聚类结果易受到初始聚类中心点选择的影响,因此在传统的KMeans算法的基础上进行算法改进,对初始中心点选取比较严格
不二人生
·
2024-09-06 04:14
Spark
ML
实战
算法
spark-ml
聚类
k8s pod container内存指标说明
一、问题描述我司平台研发的devops平台底层采用k8s实现,k8s自带cadvisor进行
集群
指标收集,根据官网,我们选用了container_memory_working_set_bytes(容器的工作集使用量
yifeiliu338
·
2024-09-06 04:43
k8s
kubernetes
容器
云原生
DAG (directed acyclic graph) 作为大数据执行引擎的优点
TL;DR-ConceptuallyDAGmodelisastrictgeneralizationofMapReducemodel.DAG-basedsystemslike
Spark
andTezthatareawareofthewholeDAGofoperationscandobetterglobaloptimizationsthansystemslikeHadoopMapReducewhicha
joeywen
·
2024-09-06 04:43
分布式计算
Storm
Spark
Storm
杂谈
Storm
spark
DAG
Spark
的Web界面
http://localhost:4040/jobs/在顶部导航栏上,可以点击以下选项来查看不同类型的
Spark
应用信息:Jobs-此视图将列出所有已提交的作业,并提供每个作业的详细信息,如作业ID、名称
静听山水
·
2024-09-06 04:40
Spark
spark
python分布式
集群
ray_GitHub - Leesire-Python/jd_spider: 两只蠢萌京东的分布式爬虫.
实现scrapy-redis对进行url的去重以及调度,利用redis的高效和易于扩展能够轻松实现高效率下载:当redis存储或者访问速度遇到瓶颈时,可以通过增大redis
集群
数和爬虫
集群
数量改善版本支持现在支持
weixin_39781930
·
2024-09-06 00:17
python分布式集群ray
云计算之云数据库
云数据库:架构在云端数据库
集群
上,通过云服务的方式让关系型数据库的可靠性更高,免去繁琐的维护工作,节约硬件成本,其具备以下特点:云数据库特点:1:管理方便:可以自动备份、弹性扩展。
weixin_34320724
·
2024-09-06 00:17
数据库
最全金融数据_Py
Spark
-3(2),大数据开发学习的三个终极问题及学习路线规划
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新需要这份系统化资料的朋友,可以戳这里获取frompy
spark
.ml.evaluationimportBinaryClassificationEv
2401_84185145
·
2024-09-05 23:38
大数据
面试
学习
文章汇总 | 2018
12月RIA便签学习法10月财富最好的定义
Spark
分布式原理及碰到的三个坑在不断解决问题(矛盾)的过程进步9月《韭菜的自我修养》-股票交易是零和游戏吗?
学习之术
·
2024-09-05 22:27
Ingest Pipeline & Painless Script
包含3个字段,tags用逗号间隔PUTtech_blogs/_doc/1{"title":"Introducingbigdata......","tags":"hadoop,elasticsearch,
spark
折纸虚桐
·
2024-09-05 22:03
ES学习笔记
elasticsearch
Spark
作业提交
一.作业提交1.1作业提交模式
spark
作业提交使用
spark
-submit命令,作业提交模式有cluster和client两种。
Tom无敌宇宙猫
·
2024-09-05 22:26
spark
大数据
分布式
Spark
基础
一.基础1.RDD机制 1.rdd分布式弹性数据集,简单的理解成⼀种数据结构,是
spark
框架上的通⽤货币。所有算⼦都是基于rdd来执⾏的,不同的场景会有不同的rdd实现类,但是都可以进⾏互相转换。
Tom无敌宇宙猫
·
2024-09-05 22:26
spark
大数据
分布式
字节跳动10万节点HDFS
集群
多机房架构演进之路(1)
如何高效运维如此超大规模的
集群
要回答这些问题需要HDFS从多个方向迭代优化,例如DanceNN的上线、运维平台的建设等,本文不会介绍字节跳动HDFS所有的演进方案,而是聚焦在HDFS多机房架构的演进策略上
2401_84122782
·
2024-09-05 21:23
程序员
hdfs
架构
hadoop
GBase 8c 分布式核心技术—CDC数据同步
作为一款分布式数据库,GBase8c可轻松实现例如两地三中心架构的
集群
异地灾备。GBase8c异地灾备
集群
间的不同节点采用各自对应的高可用部署方式,两地间采用同步或者异步复制的备份方式。
manhuai2022
·
2024-09-05 19:11
GBase
8c
数据库
服务器
java
TiDB备份与恢复简介
本文档介绍如何对Kubernetes上的TiDB
集群
进行数据备份和数据恢复。备份与恢复中所使用的工具有Dumpling、TiDBLightning和BR。
每天读点书学堂
·
2024-09-05 18:31
大数据
数据库架构
数据库
数据库开发
运维
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他