E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark学习之路
如果MLlib 中没有所需要的模型,如何使用
Spark
进行分布式训练?
如果MLlib中没有你所需要的模型,并且不打算结合更强大的框架(如TensorFlowOn
Spark
或Horovod),仍然可以使用
Spark
进行分布式训练,但需要手动处理训练任务的分配、数据准备、模型训练
是纯一呀
·
2025-02-20 08:57
WSL
Docker
AI
spark
分布式
mllib
使用 Docker 部署 Apache
Spark
集群教程
简介Apache
Spark
是一个强大的统一分析引擎,用于大规模数据处理。
努力的小T
·
2025-02-19 20:48
docker
docker
spark
linux
运维
服务器
云计算
容器
笔记:DataSphere Studio安装部署流程
一、标准版部署标准版:有一定的安装难度,体现在Hadoop、Hive和
Spark
版本不同时,可能需要重新编译,可能会出现包冲突问题。适合于试用和生产使用,2~3小时即可部署起来。
右边com
·
2025-02-19 13:15
Java
大数据
HIVE-
SPARK
日常记录备忘Hive修改字段类型之后(varchar->string)Hive可以查到数据,Presto查询报错;分区字段数据类型和表结构字段类型不一样;
spark
-sql分区表和非分区表兼容问题,不能关联可以建临时表把分区数据导入
流川枫_
·
2025-02-19 13:14
20210706
hdfs
hive
spark
深入浅出:Go 语言的
学习之路
文章目录1.Go语言简介2.Go语言的安装与环境配置2.1安装Go2.2配置开发环境3.Go语言基础语法3.1变量与数据类型示例代码:定义变量3.2控制结构示例代码:条件语句示例代码:循环语句3.3函数与方法示例代码:定义函数示例代码:定义方法4.并发编程4.1Goroutines示例代码:使用Goroutines4.2Channels示例代码:使用Channels5.面向对象编程5.1结构体与方
软件架构师笔记
·
2025-02-19 11:29
golang
golang
学习
开发语言
spark
为什么比mapreduce快?
作者:京东零售吴化斌
spark
为什么比mapreduce快?
·
2025-02-19 11:55
程序员
spark
为什么比mapreduce快?
作者:京东零售吴化斌
spark
为什么比mapreduce快?
·
2025-02-19 11:22
程序员
Spark
中Dataset方法详解
一、数据清洗核心方法1.处理缺失值方法说明示例代码na().drop()删除包含空值的行Datasetcleaned=dataset.na().drop();na().fill(value)用指定值填充所有空值Datasetfilled=dataset.na().fill(0);na().fill(Map)按列填充不同值Mapfills=newHashMapunique=dataset.dropD
小巫程序Demo日记
·
2025-02-19 10:53
Spark+Hadoop学习
spark
ajax
java
分布式
探索大数据处理:利用 Apache
Spark
解锁数据价值
探索大数据处理:利用Apache
Spark
解锁数据价值大家好,我是你们熟悉的大数据领域自媒体创作者Echo_Wish。今天,我们来聊聊如何利用Apache
Spark
进行大规模数据处理。
Echo_Wish
·
2025-02-19 07:59
实战高阶大数据
apache
spark
大数据
最新Apache Hudi 1.0.1源码编译详细教程以及常见问题处理
1.最新ApacheHudi1.0.1源码编译2.Flink、
Spark
、Hive集成Hudi1.0.13.flinkstreaming写入hudi目录1.版本介绍2.安装maven2.1.下载maven2.2
Toroidals
·
2025-02-19 06:51
大数据组件安装部署教程
hudi1.0.1
源码编译
教程
最新
Python----数据结构----链表----双向链表
Python
学习之路
,点击有全套Python笔记双向链表一种更复杂的链表是“双向链表”或“双面链表”。
一盏偏灯
·
2025-02-19 00:00
Python学习
数据结构
链表
算法
python
使用Docker安装
Spark
集群(带有HDFS)
本实验在CentOS7中完成第一部分:安装Docker这一部分是安装Docker,如果机器中已经安装过Docker,可以直接跳过[root@VM-48-22-centos~]#systemctlstopfirewalld[root@VM-48-22-centos~]#systemctldisablefirewalld[root@VM-48-22-centos~]#systemctlstatusfi
Sicilly_琬姗
·
2025-02-18 10:52
云计算
大数据
docker
spark
hdfs
Oracle Alert 日志频繁告警 12170 TNS-12535/TNS-00505,我看看怎么个事儿?
大家好,这里是公众号DBA
学习之路
,致力于分享数据库领域相关知识。
Lucifer三思而后行
·
2025-02-18 10:47
DBA
实战系列
oracle
数据库
使用Docker部署
Spark
集群
使用Docker部署
Spark
集群克隆包含启动脚本的git仓库启动
Spark
0.8.0集群并切换至
Spark
Shell环境不带参数运行部署脚本*运行一些小的例子终止集群克隆包含启动脚本的git仓库*gitclone-bblogpostgit
小孩真笨
·
2025-02-18 10:17
工程开发技术
Cloud
Data
Docker
Spark
从0开始使用Docker搭建
Spark
集群
utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendation最近在学习大数据技术,朋友叫我直接学习
Spark
吃鱼的羊
·
2025-02-18 10:16
SPARK
Hadoop
Hbase深入浅出
大家熟知的
Spark
、以及Hadoop的MapReduce,可以理解为一种计算框架。而HDFS,我们可以认为是为计算框架服务的存
天才之上
·
2025-02-18 03:13
数据存储
Hbase
大数据存储
深入浅出了解HBase及RDD编程
HBase为什么能存储海量数据创建一个HBase表配置
Spark
编写程序读取HBase数据编写程序向HBase写入数据关于搭建HBase高可用集群的图文教程,可参考我的另一篇博文——安装并配置HBase
山海王子
·
2025-02-18 03:11
大数据
hbase
全面解析:AI大模型入门教程,让你的
学习之路
不再迷茫,这个大模型学习路线非常详细收藏这篇就够了!
前言AI大模型,作为当前人工智能领域的热点,凭借其强大的处理复杂数据和任务的能力,受到广泛的关注和应用。无论你是技术小白还是有一定基础的开发者,本教程都将带你从入门到实践,逐步掌握AI大模型的核心技术。基础知识大模型概述定义:AI大模型是一种拥有海量参数和强大计算能力的神经网络模型,能够处理复杂的数据和任务。应用:广泛应用于自然语言处理、图像识别、生成等领域。学习大模型的意义提升技术能力:掌握大模
AGI大模型老王
·
2025-02-17 11:03
人工智能
学习
大模型
AI大模型
大模型学习
大模型教程
大模型入门
Spark
性能优化(四):Cache
在
Spark
中,缓存是一种将计算结果存储在内存中的方式,目的是加速后续操作。当你执行迭代算法或查询时,如果多次重复使用相同的数据集,缓存可以避免每次都重新计算相同的转换操作。
LevenBigData
·
2025-02-17 00:04
spark
性能调优
spark
性能优化
大数据
使用Docker搭建Flink集群
我们知道,像
spark
、flink这些计算框架都有多种运行模式:在本地使用多线程模拟集群真正的分布式集群如果直接在IDE(Intellj)里面编译和运行写好的程序,实际上是用的前一种运行模式;如果想尝试真正的生产环境中任务的提交和管
O_1CxH
·
2025-02-16 20:34
Flink大数据
Kafka大数据
docker
flink
容器
Spark
和 Flink
Spark
和Flink都是目前流行的大数据处理引擎,但它们在架构设计、应用场景、性能和生态方面有较大区别。
信徒_
·
2025-02-16 12:04
spark
flink
大数据
spark
任务运行
运行环境在这里插入代码片[root@hadoop000conf]#java-versionjavaversion"1.8.0_144"Java(TM)SERuntimeEnvironment(build1.8.0_144-b01)[root@hadoop000conf]#echo$JAVA_HOME/home/hadoop/app/jdk1.8.0_144[root@hadoop000conf]#
冰火同学
·
2025-02-16 11:56
Spark
spark
大数据
分布式
【Redis】golang操作Redis基础入门
【Redis】golang操作Redis基础入门大家好我是寸铁总结了一篇【Redis】golang操作Redis基础入门
spark
les:喜欢的小伙伴可以点点关注Redis的作用Redis(RemoteDictionaryServer
寸 铁
·
2025-02-16 07:24
go
数据库
Redis
redis
golang
数据库
CRUD
基本操作
分布式
键值对
hive
spark
读取hive hbase外表报错分析和解决
问题现象使用
Spark
shell操作hive关联Hbase的外表导致报错;hive使用tez引擎操作关联Hbase的外表时报错。
spring208208
·
2025-02-16 07:21
hive
hive
spark
hbase
spark
-广播变量
当本地数据极大的时候,可以使用广播变量,使得减少内存。本地集合对象和分布式集合对象(RDD)进行关联的时候,需要将本地集合对象广播变量。本地的数据传输到集群上,会发到每一个线程,每一个分区。每一个进程executor,有多个线程分区,进程内的线程数据共享因此,给每一个线程发送数据会导致数据占用,浪费资源。所有,出现了广播变量,使得只发送给进程代码使用:broadcast=sc.broadcast(
哈哈哈哈q
·
2025-02-16 05:12
+spark
hdfs
hadoop
大数据
spark
探索数据云的无缝桥梁:Apache
Spark
与 Snowflake 的完美结合
探索数据云的无缝桥梁:Apache
Spark
与Snowflake的完美结合
spark
-snowflakeSnowflakeDataSourceforApache
Spark
.项目地址:https://gitcode.com
窦育培
·
2025-02-15 12:32
maven插件学习(maven-shade-plugin和maven-antrun-plugin插件)
整合
spark
3.3.x和hive2.1.1-cdh6.3.2碰到个问题,就是
spark
官方支持的hive是2.3.x,但是cdh中的hive确是2.1.x的,项目中又计划用
spark
-thrift-server
catcher92
·
2025-02-15 08:00
java
maven
maven
学习
大数据
使用
Spark
LLM实现智能聊天:技术原理与实战演示
在本篇文章中,我们将探讨如何使用iFlyTek的
Spark
LLM模型来实现智能聊天功能。我们将详细介绍
Spark
LLM的技术背景、核心原理,并通过实际代码展示如何进行实现。
shuoac
·
2025-02-15 06:41
java
Spark
性能优化 (三):RBO 与 CBO
1.RBO的核心概念在Apache
Spark
的查询优化过程中,规则优化(Rule-BasedOptimization,RBO)是Catalyst优化器的一个关键组成部分。
LevenBigData
·
2025-02-15 02:09
spark
性能调优
spark
性能优化
ajax
Pytorch
学习之路
(3)
一.机器学习任务的整体流程1.数据预处理:数据格式统一、异常数据消除、必要数据转换,划分训练集、验证集、测试集2.选择模型3.设定损失函数、优化方法、对应的超参数4.用模型拟合训练集数据,在验证集/测试集上计算模型表现二.数据读入pytorch数据读入通过Dataset+DataLoader的方式完成,Dataset定义好数据的格式和数据变换形式,DataLoader用iterative的方式不断
AAAx1anyu
·
2025-02-14 21:28
Pytorch学习之旅
学习
人工智能
pytorch
深度学习
笔记
python 并行框架_基于python的高性能实时并行机器学习框架之Ray介绍
这种框架名为Ray,看起来有望取代
Spark
,业界认为
Spark
对于一些现实的人工智能应用而言速度太慢了;过不了一年,Ray应该会准备好用于生产环境。目前ray已经发布了0.3.0
weixin_39778582
·
2025-02-14 20:54
python
并行框架
java获取hive表所有字段,Hive Sql从表中动态获取空列计数
我正在使用datastax
spark
集成和
spark
SQLthrift服务器,它为我提供了一个HiveSQL接口来查询Cassandra中的表.我的数据库中的表是动态创建的,我想要做的是仅根据表名在表的每列中获取空值的计数
拾亿年
·
2025-02-14 16:23
java获取hive表所有字段
Py
Spark
查询Dataframe中包含乱码的数据记录的方法
首先,用Py
Spark
获取Dataframe中所有非ASCII字符,找到其中的非乱码字符。
weixin_30777913
·
2025-02-14 16:23
python
大数据
spark
spark
streaming基础操作
spark
streaming基础操作一、什么是
spark
streaming
Spark
Streaming用于流式数据的处理。
天选之子123
·
2025-02-14 09:33
大数据
spark
大数据
分布式
手把手教你给 windows装个vmware虚拟机
附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全:书单导航页(点击右侧极客侠栈即可打开个人博客):极客侠栈①【Java】
学习之路
吐血整理技术书从入门到进阶最全
python算法小白
·
2025-02-13 23:30
DBA | Oracle 数据库体系结构简述!
从今天开始作者选择一门自己工作中常常使用的到的以及全球最流行的关系型数据库Oracle来进行学习,并记录学习过程,以供后续的自己复习回顾和帮助各位看友快速上手,从入门到高新,请各位看友一定要关注、订阅【#Oracle
学习之路
全栈工程师修炼指南
·
2025-02-13 10:33
企业IT运维实践
数据库
dba
oracle
Android 访问网络框架之——OkHttp框架的解析
越来越发现一些第三方的框架比Android原生大的API好用多了,而且android废弃掉了HttpClient,有必要学习一些访问网络的框架,于是踏上了一条框架
学习之路
,先前学习了Volley框架。
mr丶yang
·
2025-02-13 07:37
原创
Okhttp
框架
网络
【图像重建】基于matlab BP神经网络双基地SAR成像图像重建【含Matlab源码 1950期】
欢迎来到海神之光博客之家✅博主简介:热爱科研的Matlab仿真开发者,修心和技术同步精进;个人主页:海神之光代码获取方式:海神之光Matlab王者
学习之路
—代码获取方式(1)完整代码,已上传资源;需要的
海神之光
·
2025-02-13 07:03
matlab
flink实时集成利器 - apache seatunnel - 核心架构详解
它支持多种数据源和数据目标,并可以与ApacheFlink、
Spark
等计算引擎集成。
24k小善
·
2025-02-12 23:38
flink
apache
架构
C 语言
学习之路
:练习题实战记录(上)
C语言
学习之路
:练习题实战记录在C语言的学习过程中,练习是巩固知识、提升编程能力的关键。
Aphelios380
·
2025-02-12 20:39
C语言
c语言
算法
开发语言
DS缩写乱争:当小海豚撞上AI顶流,技术圈也逃不过“撞名”修罗场
这个2019年诞生的分布式任务调度系统,凭借可视化DAG界面、多租户支持和对Hadoop/
Spark
生态的深度集成,一度是大数据工程师的“梦中情工”。
·
2025-02-12 18:58
数据库
AI前端开发的自主
学习之路
:效率与深度并存
在飞速发展的AI时代,前端开发面临着巨大的挑战。技术更新迭代日新月异,知识体系庞大而复杂,如何高效地学习并掌握这些新技术,成为了每一位前端开发者必须面对的问题。而自主学习能力,则成为了决定开发者竞争力的关键因素。本文将探讨如何在AI工具的辅助下,构建高效的自主学习路径,实现效率与深度并存,最终成为一名优秀的AI时代前端开发者。我们将会重点介绍如何利用AI代码生成器等工具来提升学习效率。AI工具赋能
·
2025-02-12 14:47
前端
AI前端开发的自主
学习之路
:效率与深度并存
在飞速发展的AI时代,前端开发面临着巨大的挑战。技术更新迭代日新月异,知识体系庞大而复杂,如何高效地学习并掌握这些新技术,成为了每一位前端开发者必须面对的问题。而自主学习能力,则成为了决定开发者竞争力的关键因素。本文将探讨如何在AI工具的辅助下,构建高效的自主学习路径,实现效率与深度并存,最终成为一名优秀的AI时代前端开发者。我们将会重点介绍如何利用AI代码生成器等工具来提升学习效率。AI工具赋能
·
2025-02-12 13:43
前端
如何在Java中实现高效的分布式计算框架:从Hadoop到
Spark
如何在Java中实现高效的分布式计算框架:从Hadoop到
Spark
大家好,我是微赚淘客系统3.0的小编,是个冬天不穿秋裤,天冷也要风度的程序猿!
省赚客app开发者
·
2025-02-12 07:12
java
hadoop
spark
Spark
源码分析
过程描述:1.通过Shell脚本启动Master,Master类继承Actor类,通过ActorySystem创建并启动。2.通过Shell脚本启动Worker,Worker类继承Actor类,通过ActorySystem创建并启动。3.Worker通过Akka或者Netty发送消息向Master注册并汇报自己的资源信息(内存以及CPU核数等),以后就是定时汇报,保持心跳。4.Master接受消息
数据年轮
·
2025-02-11 22:11
Spark
spark源码
spark
大数据
源码分析
Spark
源码 | 脚本分析总结
前言最初是想学习一下
Spark
提交流程的源码,比如
Spark
OnYarn、Standalone。
董可伦
·
2025-02-11 21:31
spark
源码
脚本
Pytorch
学习之路
(2)
(PS:请先阅读Pytorch
学习之路
(1)开篇注释)【因为我也是小菜鸟】Pytorch基础知识1.张量(1)简介0维张量——标量(数字)1维张量——向量2维张量——矩阵3维张量——时间序列数据股价文本数据单张彩色图片
AAAx1anyu
·
2025-02-11 14:40
Pytorch学习之旅
pytorch
学习
人工智能
Spark
性能调优-----常规性能调优(一)最优资源配置
1.1.1常规性能调优一:最优资源配置
Spark
性能调优的第一步,就是为任务分配更多的资源,在一定范围内,增加资源的分配与性能的提升是成正比的,实现了最优的资源配置后,在此基础上再考虑进行后面论述的性能调优策略
weidajiangjiang
·
2025-02-11 01:01
spark
性能调优
常规资源配置
Spark
性能调优系列:
Spark
资源模型以及调优
Spark
资源模型
Spark
内存模型
Spark
在一个Executor中的内存分为三块,execution内存、storage内存、other内存。
Mr Cao
·
2025-02-11 01:29
大数据
spark
Spark性能调优
spark
性能调优 (一):执行计划
在
Spark
中,explain函数用于提供数据框(DataFrame)或SQL查询的逻辑计划和物理执行计划的详细解释。
LevenBigData
·
2025-02-11 01:26
spark
性能调优
spark
大数据
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他