E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark安装部署
StreamPark + PiflowX 打造新一代大数据计算处理平台
什么是PiflowXPiFlow是一个基于分布式计算框架
Spark
开发的大数据流水线系统。该系统将数据的采集、清洗、计算、存储等各个环节封装成组件,以所见即所得方式进行流水线配置。简单易用,功能强大。
暗影八度
·
2024-01-06 05:47
大数据
spark
hadoop
flink
minor scratch, fortunately
ThetrafficwassobadthismorningandsoIwasrunninglateforwork.WhenIwa
spark
ingmycar,Ihitthewallwithsomeminorscratch.accidentsdohappen.Fortunately
是团儿呀
·
2024-01-06 03:25
【MLOps】使用Ray缩放AI
Ray正在人工智能工程领域崭露头角,对扩展LLM和RL至关重要
Spark
在数据工程中几乎是必不可少的。Ray正在人工智能工程领域崭露头角。雷是伦敦大学学院
Spark
的继任者。
架构师研究会
·
2024-01-06 01:59
MLOps
人工智能
IT运维
人工智能
Ray
MLops
1.大数据概述
安装结束概述先了解几个常用的网站apache官网hadoop官网hadoopgithubhttps://github.com/apache/xxx[https://github.com/apache/
spark
流月up
·
2024-01-05 23:00
大数据
hadoop
大数据
发行版
模块
搭建Py
Spark
大数据分析环境
担心自己遗忘,便做此纪录。普通的数据分析其实仅仅在PyCharm环境即可做相应的分析。但是如果数据较大,还是要在集群环境里跑会快一些,一下又两种方案:针对数据量不大(不是几十上百个G或者百万条级数据)的情况,为了方便可采用方案一:下图为需要使用到的文件:第一步,安装JDK(如果不确定自己的电脑之前是否装过jdk,可以前往设置——应用——应用和功能——搜索java即可查看是否有jdk,后面的查看自己
TraStar
·
2024-01-05 23:25
python
hadoop
ambari
大数据
spark
大数据全套虚拟机(直接拿来用)
故事背景因为有python的基础,我就跳着学,也就是直接来到了
spark
阶段这个时候被虚拟机难住了,卖家只有视频,给我发了几个虚拟机都不对,没有办法.。我自己去配,在有相关文档的情况下去配置。
中长跑路上crush
·
2024-01-05 23:02
大数据
hadoop
hive
分布式
Spark
学习之
Spark
Core
什么是
Spark
?(官网:http://
spark
.apache.org)https://www.cnblogs.com/lq0310/p/9841647.html
John Stones
·
2024-01-05 22:51
spark
big
data
scala
ClickHouse数据库详解和应用实践
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录概述1.适用场景2.不适用场景一、核心特性1.完备的DBMS功能2.列式存储与数据压缩二、
安装部署
1.在线安装2.离线安装三、jdbc
shandongwill
·
2024-01-05 20:53
大数据
数据库
clickhouse
数据库
Hotspot 垃圾回收之ConcurrentMarkSweepGeneration(二) 源码解析
目录一、ModUnionClosure/ModUnionClosurePar二、CMSIsAliveClosure/CM
SParK
eepAliveClosure三、CFLS_LAB1、构造方法和modify_initialization2
孙大圣666
·
2024-01-05 19:07
Hotspot和Linux内核
ModUnionClosure
CFLS_LAB
CMSCollector
spark
的任务提交方式及流程
本地模式local测试用,不多赘述分布式模式standalonestandalone集群是
spark
自带的一个资源调度集群,分为两个角色,master/worker,master负责接收任务请求、资源调度
qzWsong
·
2024-01-05 19:29
spark
spark
大数据
yarn
如何本地搭建DolphinScheduler并无公网ip远程访问管理界面
文章目录前言1.
安装部署
DolphinScheduler1.1启动服务2.登录DolphinScheduler界面3.安装内网穿透工具4.配置DolphinScheduler公网地址5.固定DolphinScheduler
T-rLN
·
2024-01-05 18:41
经验分享
tcp/ip
网络协议
网络
官答|初始化GreatSQL报错无法找到数据目录或初始化数据字典失败
内容涵盖数据库
安装部署
、配置优化、故障排查、性能测试等方面。在文章中,我们不仅提供解决方案,还会结合实例深入剖析问题的成因,提升读者对GreatSQL数据库的理解能力。
GreatSQL社区
·
2024-01-05 15:02
GreatSQL
MySQL
GreatSQL社区2023全年技术文章总结
这些文章涵盖了GreatSQL、MGR、源码解析、故障解析、SQL优化、
安装部署
、等众多数据库技术文章。1、新版本发布GreatSQL8.0.32-25今日发布MyS
GreatSQL社区
·
2024-01-05 15:00
GreatSQL
年终总结
Apache Doris (六十一):
Spark
Doris Connector - (1)-源码编译
博主个人B栈地址:豹哥教你学编程的个人空间-豹哥教你学编程个人主页-哔哩哔哩视频目录1.
Spark
DorisConnector2.
Spark
与Doris版本兼容
IT贫道
·
2024-01-05 14:40
大数据OLAP体系技术栈
apache
spark
大数据
doris
Iceberg: 列式读取Parquet数据
通过
Spark
读取Parquet文件的基本流程SQL==>
Spark
解析SQL生成逻辑计划树LogicalPlan==>
Spark
创建扫描表/读取数据的逻辑计划结点DataSourceV2ScanRelation
Dreammmming Time
·
2024-01-05 14:55
ICEBERG
spark
Vectorized
Parquet
《Py
Spark
大数据分析实战》-24.数据可视化图表介绍
对大数据技术栈Hadoop、Hive、
Spark
、Kafka等有深入研究,对Data
wux_labs
·
2024-01-05 13:02
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
大数据开发个人简历范本(2024最新版-附模板)
Hadoop大数据运维工程师背景,熟悉相关技术和工具具备良好的团队合作能力,善于沟通和协作具有快速学习新知识和解决问题的能力对于数据科学和分析充满热情,喜欢研究和探索新技术专业技能大数据熟悉Hadoop、
Spark
itLeeyw
·
2024-01-05 13:53
简历怎么写
大数据
简历
简历工具
个人简历
简历模板
Spark
OFF_HEAP
OFF_HEAP
Spark
中RDD提供了几种存储级别,不同的存储级别可以带来不同的容错性能,例如MEMORY_ONLY,MEMORY_ONLY_SER_2...其中,有一种特别的是OFF_HEAPoff_heap
尼小摩
·
2024-01-05 13:18
Spark
调优解析-GC调优3(七)
1GC调优
Spark
立足内存计算,常常需要在内存中存放大量数据,因此也更依赖JVM的垃圾回收机制。
有语忆语
·
2024-01-05 12:54
大数据之Spark
spark
大数据
分布式
Spark
调优解析-
spark
数据倾斜优化2(七)
1数据倾斜优化1.1为何要处理数据倾斜(DataSkew)什么是数据倾斜对
Spark
/Hadoop这样的大数据系统来讲,数据量大并不可怕,可怕的是数据倾斜。何谓数据倾斜?
有语忆语
·
2024-01-05 12:53
大数据之Spark
spark
大数据
分布式
Spark
调优解析-
spark
shuffle和程序开发优化2(七)
1Shuffle调优1.1调优概述大多数
Spark
作业的性能主要就是消耗在了shuffle环节,因为该环节包含了大量的磁盘IO、序列化、网络数据传输等操作。
有语忆语
·
2024-01-05 12:49
大数据之Spark
spark
大数据
分布式
python 并发、并行处理、分布式处理
定义协程阻塞代码->非阻塞ThreadPoolExecutor3.响应式编程被观察者运算符4.并行编程线程进程使用多个进程接口Executor,ProcessPoolExecutor5.锁6.分布式处理daskpy
spark
mpi4py
cjz0422
·
2024-01-05 12:18
分布式
Spark
SQL(六):JDBC数据源
Spark
SQL支持使用JDBC从关系型数据库(比如MySQL)中读取数据。读取的数据,依然由DataFrame表示,可以很方便地使用
Spark
Core提供的各种算子进行处理。
雪飘千里
·
2024-01-05 11:12
Spark
内核解析-部署模式解析8(六)
1、部署模式解析1.1部署模式概述
Spark
支持的主要的三种分布式部署方式分别是standalone、
spark
onmesos和
spark
onYARN。
有语忆语
·
2024-01-05 10:06
大数据之Spark
spark
大数据
分布式
Spark
内核解析-内存管理7(六)
1、
Spark
内存管理
Spark
作为一个基于内存的分布式计算引擎,其内存管理模块在整个系统中扮演着非常重要的角色。理解
Spark
内存管理的基本原理,有助于更好地开发
Spark
应用程序和进行性能调优。
有语忆语
·
2024-01-05 10:36
大数据之Spark
spark
ajax
javascript
Spark
调优解析-
spark
调优基本原则1(七)
1调优基本原则1.1基本概念和原则首先,要搞清楚
Spark
的几个基本概念和原则,否则系统的性能调优无从谈起:每一台host上面可以并行N个worker,每一个worker下面可以并行M个executor
有语忆语
·
2024-01-05 10:36
大数据之Spark
spark
javascript
java
Spark
内核解析-整体概述1(六)
1、
Spark
整体概述1.1整体概念Apache
Spark
是一个开源的通用集群计算系统,它提供了High-level编程API,支持Scala、Java和Python三种编程语言。
有语忆语
·
2024-01-05 10:35
大数据之Spark
spark
大数据
分布式
Spark
内核解析-
Spark
shuffle6(六)
1、
Spark
Shuffle过程1.1MapReduce的Shuffle过程介绍Shuffle的本义是洗牌、混洗,把一组有一定规则的数据尽量转换成一组无规则的数据,越随机越好。
有语忆语
·
2024-01-05 10:35
大数据之Spark
spark
java
大数据
Spark
Streaming基础解析(四)
1、
Spark
Streaming概述1.1
Spark
Streaming是什么
Spark
Streaming用于流式数据的处理。
有语忆语
·
2024-01-05 10:05
大数据之Spark
SparkStreaming
Spark
内核解析-脚本解析2(六)
2、脚本解析在看源码之前,我们一般会看相关脚本了解其初始化信息以及Bootstrap类,
Spark
也不例外,而
Spark
中相关的脚本如下:%
SPARK
_HOME%/sbin/start-master.sh
有语忆语
·
2024-01-05 10:05
大数据之Spark
spark
ajax
大数据
Spark
内核解析-数据存储5(六)
1、
Spark
的数据存储
Spark
计算速度远胜于Hadoop的原因之一就在于中间结果是缓存在内存而不是直接写入到disk,本文尝试分析
Spark
中存储子系统的构成,并以数据写入和数据读取为例,讲述清楚存储子系统中各部件的交互关系
有语忆语
·
2024-01-05 10:05
大数据之Spark
spark
microsoft
大数据
Spark
基础解析(一)
1、
Spark
概述1.1什么是
Spark
1.2
Spark
内置模块
Spark
Core:实现了
Spark
的基本功能,包含任务调度、内存管理、错误恢复、与存储系统交互等模块。
有语忆语
·
2024-01-05 10:04
大数据之Spark
spark
大数据
分布式
2024.1.4
Spark
Core ,RDD ,算子
的五大特点四.算子五.分区算子,重分区算子,聚合算子,关联算子分区算子:重分区算子聚合算子关联算子:一.RDD(弹性分布式数据集)Resilent弹性Distrbuted分布式Dataset数据集1.rdd是
Spark
白白的wj
·
2024-01-05 10:01
spark
大数据
分布式
python
Spark
Core基础解析(二)
1、RDD概述1.1什么是RDDRDD(ResilientDistributedDataset)叫做分布式数据集,是
Spark
中最基本的数据抽象。
有语忆语
·
2024-01-05 10:58
大数据之Spark
spark
Sparkcore
RDD
Spark
内核解析-节点启动4(六)
Master作为Endpoint的具体实例,下面我们介绍一下Master启动以及OnStart指令后的相关工作1.1脚本概览下面是一个举例:/opt/jdk1.7.0_79/bin/java-cp/opt/
spark
有语忆语
·
2024-01-05 10:12
大数据之Spark
spark
java
ajax
【
Spark
精讲】RDD共享变量:广播变量与累加器
在
Spark
中,提供了两种类型的共享变量:广播变量(broadcastvariable)与累加器(accumulator)广播变量:主要用于在节点间高效分发大对象。
话数Science
·
2024-01-05 10:42
大数据
Spark精讲
Spark
spark
大数据
【
Spark
精讲】
Spark
on Hive性能优化
yarn.nodemanager.resource.memory-mbyarn.nodemanager.resource.cpu-vcoresyarn.scheduler.maximum-allocation-mbyarn.scheduler.minimum-allocation-mb第三章
Spark
话数Science
·
2024-01-05 10:10
Spark精讲
Spark
大数据
spark
大数据
面试
【大数据】
Spark
学习笔记
初识
Spark
Spark
和HadoopHadoop
Spark
起源时间20052009起源地MapReduceUniversityofCaliforniaBerkeley数据处理引擎BatchBatch编程模型
pass night
·
2024-01-05 09:16
学习笔记
java
spark
大数据
sql
Spark
内核解析-通信架构3(六)
3、
Spark
通信架构
Spark
作为分布式计算框架,多个节点的设计与相互通信模式是其重要的组成部分。
Spark
一开始使用Akka作为内部通信部件。
有语忆语
·
2024-01-05 08:42
大数据之Spark
spark
架构
大数据
大数据学习方向
一、大数据运维之Linux基础打好Linux基础,以便更好地学习Hadoop,hbase,NoSQL,
Spark
,Storm,docker,openstack等。
乐姐
·
2024-01-05 08:18
大数据
大数据
大数据学习
大数据开发
大数据入门
人工智能
【
Spark
精讲】性能优化:并行度
Reduce端并行度RDD:参数:
spark
.default.parallelism手动:groupByKey(10),10即为并行度
Spark
SQL:参数:
spark
.sql.shuffle.partitionsHiveon
Spark
话数Science
·
2024-01-05 07:58
Spark
Spark精讲
大数据
spark
大数据
mac环境下
安装部署
mysql5.7
下载安装包进入官网下载MySQL5.7的安装包https://www.mysql.com/downloads/安装包下载完成后双击pkg文件进行安装,无脑点下一步即可,注意安装完成后记得保存最后弹出框的密码进入系统偏好设置,找到mysql,开启mysql服务,如图所示打开终端,输入“sudovim/etc/my.cnf”,在弹出的编辑器中按键盘的i键进入编辑模式,输入以下内容:#ExampleMy
挨踢~小先生
·
2024-01-05 07:55
macos
mysql
Unity UGUI开发,0GC更新视图
【U
Spark
le专栏】如果你深怀绝技,爱“搞点研究”,乐于分享也博采众长,我们期待你的加入,让智慧的火花碰撞交织,让知识的传递生生不息!
UWA
·
2024-01-05 06:43
U
Sparkle
精华来稿
unity
游戏引擎
UGUI
UWA
支付宝小程序源码系统:自由DIY+完整的
安装部署
教程
然而,市面上的支付宝小程序源码系统往往难以满足个性化需求,且
安装部署
过程复杂。今天来给大家分享一款支付宝小程序源码系统。
罗峰源码
·
2024-01-05 06:12
源码分享
支付宝小程序源码
支付宝小程序
支付宝小程序源码系统
小程序
华为欧拉
安装部署
:Oracle11g
一、环境准备1、下载安装低版本的libaio包;libaio版本太高,会造成编译错误查看libaio1库版本不能大于0.3.109[oracle@s3install]$rpm-qalibaiolibaio-0.3.110-12.el8.x86_64#查看欧拉操作系统版本[oracle@localhostbin]$cat/etc/os-releaseNAME="openEuler"VERSION="
weixin_51788950
·
2024-01-05 06:11
华为
字节跳动
Spark
支持万卡模型推理实践
摘要:本文整理自字节跳动基础架构工程师刘畅和字节跳动机器学习系统工程师张永强在本次CommunityOverCodeAsia2023中的《字节跳动
Spark
支持万卡模型推理实践》主题演讲。
字节跳动云原生计算
·
2024-01-05 06:09
spark
大数据
分布式
Python_Py
Spark
实战
1.Py
Spark
库的安装清华大学源:pipinstall-ihttps://pypi.tuna.tsinghua.edu.cn/simplepy
spark
2.构建Py
Spark
执行环境入口对象"""演示获取
Hooray11
·
2024-01-05 05:48
python自学
python
开发语言
linux增加用户
#linux创建账户并自动生成主目录和主目录下的文件useradd-d/home/
spark
-m
spark
#带有加入root组的创建方式useradd-d/home/
spark
-groot-m
spark
心在梦梦藏心
·
2024-01-05 05:47
思级有容数据库双主模式
安装部署
双主部署方案MD5值:a7ec27503d786f662afff5f6ae9e6433Glibc-2.17一环境准备entos7更换yum源wget-O/etc/yum.repos.d/CentOS-Base.repohttp://mirrors.aliyun.com/repo/Centos-7.repowget-O/etc/yum.repos.d/epel.repohttp://mirrors.
IT-民工21110
·
2024-01-05 02:01
数据库
系统
mysql
数据库
sql
耗时80小时!超详细的胎教级Stable Diffusion使用教程,看这一篇就够!
从手把手
安装部署
,到界面功能讲解,再到实战案例制作,到下载优质模型,每一步都有详细教程并且用一个又一个的例子展示,让大家不止是枯燥地看,而是看完立刻也能做出一样的图片出来同时,无论是安装包,大模型,lora
程序员笑武
·
2024-01-05 01:24
stable
diffusion
人工智能
ai绘画
AI绘画
AI技术
上一页
36
37
38
39
40
41
42
43
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他