E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Spark环境安装
Spark
从入门到熟悉(篇三)
本文介绍
Spark
的DataFrame、
Spark
SQL,并进行
Spark
SQL实战,加强对编程的理解,实现快速入手知识脉络包含如下7部分内容:RDD和DataFrame、
Spark
SQL的对比创建DataFrameDataFrame
小新学习屋
·
2025-07-03 01:15
数据分析
spark
大数据
分布式
大数据集群架构hadoop集群、Hbase集群、zookeeper、kafka、
spark
、flink、doris、dataeas(二)
zookeeper单节点部署wget-chttps://dlcdn.apache.org/zookeeper/zookeeper-3.8.4/apache-zookeeper-3.8.4-bin.tar.gz下载地址tarxfapache-zookeeper-3.8.4-bin.tar.gz-C/data/&&mv/data/apache-zookeeper-3.8.4-bin//data/zoo
争取不加班!
·
2025-07-03 00:05
hadoop
hbase
zookeeper
大数据
运维
Hadoop、
Spark
、Flink 三大大数据处理框架的能力与应用场景
技术能力与应用场景对比产品能力特点应用场景Hadoop-基于MapReduce的批处理框架-HDFS分布式存储-容错性强、适合离线分析-作业调度使用YARN-日志离线分析-数据仓库存储-T+1报表分析-海量数据处理
Spark
·
2025-07-02 13:45
鲲鹏CPU+麒麟操作系统arm
环境安装
MySQL
系统环境背景:CPU:鲲鹏920操作系统:Ky10SP3MySQL版本:8.4.2一、下载MySQL官网地址:https://downloads.mysql.com/archives/community/二:MySQL安装前准备2.1关闭防火墙[root@ky-b~]#systemctlstopfirewalld[root@ky-b~]#systemctldisablefirewalldRemov
运维小乔
·
2025-07-02 00:39
mysql
数据库
SeaTunnel 社区月报(5-6 月):全新功能上线、Bug 大扫除、Merge 之星是谁?
同时,近100个修复与优化PR合入,涵盖
Spark
引擎并行性修复、Paimon精度兼容性增强、Mongo-CDCExactlyOnce默认值优化、OracleDDL类型支持补全
·
2025-07-01 18:24
数据库
spark
数据处理练习题番外篇【上】
一.单选题(共23题,100分)1.(单选题)maven依赖应该加在哪个文件中?A.pom.xmlB.log4j.propertiesC.src/main/scala.resourceD.src/test/scala.resource正确答案:A:pom.xml;Maven依赖应该添加在pom.xml文件中,这是Maven项目的核心配置文件。解释:pom.xml(ProjectObjectMode
·
2025-07-01 17:48
windows11 环境下Mamba
环境安装
:causal-conv1d和mamba-ssm报错解决办法
Mamba
环境安装
:causal-conv1d和mamba-ssm报错解决办法在执行命令pipinstallcausal_conv1d和mamba_ssm出错note:Thiserrororiginatesfromasubprocess
lzdjlu
·
2025-06-30 19:27
深度学习
python
人工智能
pytorch
python
基于django+
Spark
+大数据+爬虫技术的国漫推荐与可视化平台设计和实现(源码+论文+部署讲解等)
博主介绍:✌全网粉丝50W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围:SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等
阿勇学长
·
2025-06-30 14:22
大数据项目实战案例
Java精品毕业设计实例
Python数据可视化项目案例
大数据
django
spark
国漫推荐与可视化平台
毕业设计
Java
spark
写入hive表问题
1、httpclient发送post请求,当返回的数据过大时,报错socketclosed这个原因是客户端主动将连接关闭,根本原因是将httpclient。execute的返回结果closeableResponse作为a方法的返回结果,在b方法中进行解析虽然在b方法中没有关闭closeableResponse,但是在a方法中返回closeableResponse后,会进行httppost.real
qq_42265026
·
2025-06-29 21:30
spark
hive
大数据
spark
解析压缩包数据,写入到hive表中
spark
解析xxxxx.tar.gz形式的压缩包。压缩包里面是一个个的json文件或者zip的文件,zip里面是json文件。
dbbigdata
·
2025-06-29 21:59
spark
大数据
hive
Windows系统部署YOLOv5 v6.1版本的训练与推理环境保姆级教程
文章目录一·概述二·依赖环境(`prerequisites`)2.1硬件环境2.2软件环境三·
环境安装
3.1创建并激活虚拟环境3.2安装`Pytorch`与`torchvision`3.3校验`Pytorch
lujx_1024
·
2025-06-29 12:57
windows
YOLO
【SequoiaDB】4 巨杉数据库SequoiaDB整体架构
数据库实例模块则作为协议与语法的适配层,用户可根据需要创建包括MySQL、PostgreSQL与
Spark
SQL在内的结构化数据实例;支持JSON语法的MongoD
Alen_Liu_SZ
·
2025-06-28 17:05
巨杉数据库
SequoiaDB架构
编目节点
协调节点
数据节点
巨杉数据库
App Store暗藏虚假抖音,内含间谍软件窃取照片和加密货币
卡巴斯基网络安全研究人员近日发现名为
Spark
Kitty的新型间谍软件活动,该恶意程序已感染苹果AppStore和谷歌Play官方商店的多个应用。
FreeBuf-
·
2025-06-27 22:29
TikTok
App
Store
iOS
Android
试试时序数据库 TDengine ×
Spark
的组合拳
现在,TDengine正式开放与Apache
Spark
的无缝集成通道。一个是高性能、低成本的时序数据库,一个是横扫大数据世界的分析
·
2025-06-27 11:21
Spark
Streaming 与 Flink 实时数据处理方案对比与选型指南
Spark
Streaming与Flink实时数据处理方案对比与选型指南实时数据处理在互联网、电商、物流、金融等领域均有大量应用,面对海量流式数据,
Spark
Streaming和Flink成为两大主流开源引擎
浅沫云归
·
2025-06-27 02:10
后端技术栈小结
spark-streaming
flink
real-time
Spark
教程3:
Spark
SQL最全介绍
文章目录
Spark
SQL最全介绍一、
Spark
SQL概述二、
Spark
Session:入口点三、DataFrame基础操作四、SQL查询五、
Spark
SQL函数六、与Hive集成七、数据源操作八、DataFrame
Cachel wood
·
2025-06-26 22:10
大数据开发
spark
大数据
分布式
计算机网络
AHP
需求分析
Spark
教程1:
Spark
基础介绍
文章目录一、
Spark
是什么?
Cachel wood
·
2025-06-26 21:37
大数据开发
spark
大数据
分布式
计算机网络
数据库
数据仓库
讯飞星火(iFlytek
Spark
):科大讯飞打造的国产AI大模型平台
1.产品概述讯飞星火(iFlytek
Spark
)是科大讯飞自主研发的认知大模型,定位于通用人工智能(AGI)平台,集成了文本生成、语言理解、知识问答、逻辑推理、数学计算、代码生成和多模态交互等核心能力。
明似水
·
2025-06-26 17:09
AI
人工智能
Ubuntu 22.04安装Docker(最全教程,无需科学上网)
安装
环境安装
该教程的Docker之前,请自行安装好Ubuntu22.04系统环境。
小凹兔
·
2025-06-26 15:25
Linux
ubuntu
docker
linux
基于Hadoop大数据分析应用场景与实战
目前主流的三大分布式计算系统分别为:Hadoop、
Spark
和Strom:Hadoop当前大数据管理标准之一,运用在当前很多商业应用系统。可以轻松地集成结构化、半结构化甚至非结构化数据集。
跨过山河大海
·
2025-06-26 12:38
深度剖析无感刷新Token:领码
SPARK
平台赋能微服务认证的智能实践
本文结合领码
SPARK
融合平台的iPaaS和aPaaS优势,深刻解析无感刷新Token的实现原理、典型场景、安全风险及AI赋能智能防护,系统阐述实现无感刷新Token的最佳实践。通过流程
领码科技
·
2025-06-26 09:16
低代码
实战篇
无感刷新Token
领码SPARK
微服务认证
AI安全
双Token机制
Spark
之 UT
AQEOFFpartitionpruninginbroadcasthashjoinswithaliases==OptimizedLogicalPlan==Project[date_id#5283,pid#5281,sid#5282]+-JoinInner,(si
zhixingheyi_tian
·
2025-06-26 07:36
spark
spark
大数据
分布式
Spark
eventlog 、Event、
Spark
Listener
Spark
ListenerSQLExecutionStartcaseclass
Spark
ListenerSQLExecutionStart(executionId:Long,//iftheexecutionisaroot
zhixingheyi_tian
·
2025-06-26 07:06
spark
spark
大数据
分布式
从
Spark
执行计划中获取数据血缘
从
Spark
执行计划中获取数据血缘->关注清哥聊技术公众号,了解更多技术文章因为数据处理任务会涉及到数据的转换和处理,所以从数据任务中解析血缘也是获取数据血缘的渠道之一,
Spark
是大数据中数据处理最常用的一个技术组件
张永清-老清
·
2025-06-26 07:02
大数据
spark
大数据
分布式
Spark
之 QueryPlan
sameResultsrc/main/scala/org/apache/
spark
/sql/catalyst/plans/QueryPlan.scala/***Returnstruewhenthegivenqueryplanwillreturnthesameresultsasthisqueryplan
zhixingheyi_tian
·
2025-06-26 06:30
spark
spark
大数据
分布式
Python与大数据:
Spark
和Py
Spark
实战教程
Apache
Spark
作为新一代大数据计算引擎,以其高性能、易用性和强大的生态系统,成为数据工程师和分析师的首选工具。
天天进步2015
·
2025-06-26 01:58
python
大数据
python
spark
现代数据湖架构全景解析:存储、表格式、计算引擎与元数据服务的协同生态
本文全面剖析现代数据湖架构的核心组件,深入探讨对象存储(OSS/S3)、表格式(Iceberg/Hudi/DeltaLake)、计算引擎(
Spark
/Flink/Presto)及元数据服务(HMS/Amoro
讲文明的喜羊羊拒绝pua
·
2025-06-26 00:46
大数据
架构
数据湖
Spark
Iceberg
Amoro
对象存储
通过CDH安装
Spark
的详细指南
通过CDH安装
Spark
的详细指南简介ClouderaDistributionofHadoop(CDH)是一个企业级的大数据平台,它集成了多个开源组件,包括Hadoop、
Spark
、Hive等。
暴躁哥
·
2025-06-25 20:48
大数据技术
spark
大数据
分布式
order、sort、distribute和cluster by(
Spark
/Hive)
1.abstractORDERBY:完整查询结果的全局行排序。与SORTBY、CLUSTERBY、DISTRIBUTEBY互斥,不能同时使用。示例SELECT*FROMtable_nameORDERBYcolumn_name;SORTBY:只在每个分区内排序,局部排序结果不是全局有序。与ORDERBY、CLUSTERBY互斥,不能同时指定。示例SELECT*FROMtable_nameSORTBY
有数的编程笔记
·
2025-06-25 15:07
Spark/Hive
spark
hive
大数据
合并小文件汇总(Hive/
Spark
)
合并小文件的原因:过多的小文件会导致HDFS上元数据负载增加。并且小文件也会导致计算性能下降。1.使用hive时1.1.使用hive.merge参数,开启文件合并--控制在map阶段结束后合并输出的小文件,默认值为trueSEThive.merge.mapfiles=true;--控制在reduce阶段结束后合并输出小文件,默认值为falseSEThive.merge.mapredfiles=tr
有数的编程笔记
·
2025-06-25 15:06
Spark/Hive
hive
spark
hadoop
基于py
spark
的北京历史天气数据分析及可视化_离线
基于py
spark
的北京历史天气数据分析及可视化项目概况[]点这里,查看所有项目[]数据类型北京历史天气数据开发环境centos7软件版本python3.8.18、hadoop3.2.0、
spark
3.1.2
大数据CLUB
·
2025-06-25 08:48
spark数据分析可视化
数据分析
数据挖掘
hadoop
大数据
spark
Spark
底层原理详细解析
Spark
简介Apache
Spark
是用于大规模数据处理的统一分析引擎,基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将
Spark
部署在大量硬件之上,形成集群
JavaShark
·
2025-06-25 02:39
spark
big
data
hadoop
Java EDW三剑客:如何让数据从“沼泽”变身“报告神器”?手把手教你玩转企业数据仓库!
今天我们就用JDBC+Apache
Spark
+Thymeleaf三剑客,教你如何让Java在EDW中将“数据沼泽”炼成“报告神器”!从“数
墨瑾轩
·
2025-06-24 20:50
Java乐园
java
数据仓库
开发语言
基于py
spark
的北京历史天气数据分析及可视化_实时
基于py
spark
的北京历史天气数据分析及可视化项目概况[]点这里,查看所有项目[]数据类型北京历史天气数据开发环境centos7软件版本python3.8.18、hadoop3.2.0、
spark
3.1.2
大数据CLUB
·
2025-06-24 12:54
spark数据分析可视化
数据分析
数据挖掘
spark
hadoop
大数据
MAC
环境安装
Appium+JAVA
安装注意事项:Appium、Xcode、Apple下载的版本需要对应,命令均使用cmd输入安装步骤:设置安装位置文件非root用户权限sudochmod–R777/usr/local使用brew–v命令检查是否安装brew如果未安装,则使用ruby–e”$(curl–fsSLhttps//raw.githubusercontent.com/Homebrew/install/mastaer/inst
程序员的世界你不懂
·
2025-06-24 05:07
macos
appium
深度学习Day-38:Pytorch文本分类入门
[365天深度学习训练营]中的学习记录博客原作者:[K同学啊|接辅导、项目定制]任务:了解文本分类的基本流程学习常用数据清洗方法学习如何使用jieba实现英文分词学习如何构建文本向量1.前期准备1.1
环境安装
Point__Nemo
·
2025-06-23 22:55
深度学习
自然语言处理
人工智能
从头搭建
环境安装
k8s遇到的问题
基本信息master节点IP:172.31.0.3node01节点IP:172.31.0.4node02节点IP:172.31.0.5子网掩码:255.255.0.0网关:172.31.0.2DNS:114.114.114.114安装前要检查的信息检查三台主机的mac地址是否重复:ipa检查三台主机的product_id是否重复:cat/sys/class/dmi/id/product_uuid配
彼将取而代之
·
2025-06-23 11:11
k8s
kubernetes
容器
云原生
利用ms-swift微调LLaVA-OneVision
利用ms-swift微调LLaVA-OneVision资料合集
环境安装
目录详情训练模型下载模型准备训练(train)数据和验证集(validation)数据提前改一些小bug脚本Merged-LoRA脚本
moTcream
·
2025-06-23 07:16
人工智能
AIGC
Py
spark
中的int
在Py
Spark
中,整数类型(int)与Python或Pandas中的int有所不同,因为它基于
Spark
SQL的数据类型系统。
闯闯桑
·
2025-06-23 00:27
python
spark
pandas
大数据
Python 工程师迈向大数据时代: Hadoop 与
Spark
框架深度解析与实战指南
Python工程师迈向大数据时代:Hadoop与
Spark
框架深度解析与实战指南引言亲爱的Python工程师们,欢迎来到大数据时代!
清水白石008
·
2025-06-22 14:52
python
Python题库
大数据
python
hadoop
实战
Spark
从入门到精通(五):
Spark
开发实操,先搞定
Spark
集群规划!
系列文章目录实战
Spark
从入门到精通(一):一文带你全面了解
Spark
大数据处理框架实战
Spark
从入门到精通(二):
Spark
急速上手,给小白的3分钟入门指南实战
Spark
从入门到精通(三):深入理解
元飞聊技术
·
2025-06-22 13:09
实战Spark从入门到精通
spark
大数据
分布式
linux
centos
【
Spark
征服之路-2.9-
Spark
-Core编程(五)】
RDD行动算子:行动算子就是会触发action的算子,触发action的含义就是真正的计算数据。1.reduce➢函数签名defreduce(f:(T,T)=>T):T➢函数说明聚集RDD中的所有元素,先聚合分区内数据,再聚合分区间数据valrdd:RDD[Int]=sc.makeRDD(List(1,2,3,4))valreduceResult:Int=rdd.reduce(_+_)printl
·
2025-06-22 12:36
Spark
Streaming 原理与代码实例讲解
Spark
Streaming原理与代码实例讲解1.背景介绍1.1实时流数据处理的重要性在当今大数据时代,海量的数据正以前所未有的速度不断产生。
AI智能应用
·
2025-06-22 12:35
AI大模型应用入门实战与进阶
Python入门实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
py
spark
底层浅析
py
spark
底层浅析py
spark
简介py
spark
是
Spark
官方提供的API接口,同时py
spark
也是
Spark
中的一个程序。
lo_single
·
2025-06-22 12:35
Spark
spark
python
方舟自建服务器物品叠加mod,10000倍物品叠加 -90%负重 V280
工艺资源(
Spark
大奇鸭
·
2025-06-22 11:27
方舟自建服务器物品叠加mod
Django丨REST framework
引入DjangoRESTframework1.Web应用模式2.RESTful3.使用Django开发REST接口示例4.序列化与反序列化5.DjangoRESTframework简介二、DRF工程搭建
环境安装
与配置三
·
2025-06-22 06:24
Python大数据处理中有哪些分布式计算框架?如何选择和使用?
二、Python大数据处理中的分布式计算框架Apache
Spark
Apache
Spark
代码小狂热者
·
2025-06-22 02:05
python
开发语言
前端vue js 使用插件
spark
-md5 计算文件MD5值并封装成Promise异步调用方法
1.依赖:需要安装
spark
-md5npminstall--save
spark
-md52.代码分析1.功能:该函数接收一个File对象,将其分块(每块2MB)读取,并使用
spark
-md5计算整个文件的
低级前端
·
2025-06-20 23:10
Vue学习
Vue3学习+实战
uniapp
javascript
前端
vue.js
spark
开发语言
java
spark
操作 mongo实践
java
spark
操作mongo实践按照官方文档配置https://docs.mongodb.com/
spark
-connector/master/java-api/需要说明一下,官方文档中要求引入的pom
哆啦A梦00
·
2025-06-20 23:10
spark
java
spark
Spark
学习【一】
Spark
基本概念MapReduce存在的缺陷编写难度大不能很好充分利用系统内存一个作业多个MR任务嵌套不友好(每一个task都是jvm进程级别创建销毁开销都很大、每一次都要涉及磁盘或dfs或db和网络的
·
2025-06-20 23:39
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他