E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark毕设
数据分析大数据面试题大杂烩01
处理大量非实时数据政府:健康码,扫码之后确诊,找出与确诊对象有关联的人订单订单表(除商品以外所有信息),商品详情表,通过搜集用户title进行定制化推荐点击流数据通过埋点进行用户点击行为分析FLINK一般用来做实时
SPARK
爱学习的菜鸟罢了
·
2025-03-15 09:19
大数据
flink
大数据
面试
hive
hadoop
kafka
doris:SQL 方言兼容
提示从2.1版本开始,Doris可以支持多种SQL方言,如Presto、Trino、Hive、PostgreSQL、
Spark
、Clickhouse等等。
向阳1218
·
2025-03-15 01:07
大数据
doris
25年大数据开发省赛样题第一套,离线数据处理答案
省赛样题一,数据抽取模块这一模块的作用是从mysql抽取数据到ods层进行指标计算,在题目中要求进行全量抽取,并新增etl-date字段进行分区,日期为比赛前一天importorg.apache.
spark
.sql.
Spark
Sessionimportjava.util.PropertiesobjectTask1
Tometor
·
2025-03-15 00:01
大数据
spark
scala
Electron+Python软件系统开发记录(一):基础环境搭建
Electron+Python软件系统开发记录(一):基础环境搭建1.问题说明最近开始做本科
毕设
,其中有一部分内容是搭建一个完整的软件系统。系统要求就是常见的客户端,服务器,数据库的整体架构。
多宝鱼1998
·
2025-03-14 10:02
环境配置遇到的坑
python
nodejs
thrift
2025
毕设
springboot大学目标规划与落地平台的设计与实现后台源码+论文
系统程序文件列表开题报告内容研究背景在当今社会,随着高等教育的普及和竞争的日益激烈,大学生对于个人成长与职业规划的需求愈发迫切。然而,许多学生在追求学业进步、技能提升及未来职业发展等方面缺乏有效的目标规划与跟踪工具。传统的目标管理方式往往依赖于纸质日记或简单的电子记录,难以提供系统化、个性化的目标设定与进度监控服务。因此,开发一款集目标规划、执行跟踪、反馈激励于一体的大学目标规划与落地平台显得尤为
皓宇学长-毕设
·
2025-03-13 19:52
课程设计
spring
boot
后端
spark
ML入门,通俗解释机器学习的框架和算法
一、机器学习的整体框架(类比烹饪)假设你要做一道菜,机器学习的过程可以类比为:步骤-->烹饪类比-->机器学习对应1.确定目标|想做什么菜(红烧肉/沙拉)|明确任务(分类/回归/聚类)2.准备食材|买菜、洗菜、切菜|数据收集与预处理3.设计食谱|决定烹饪步骤和调料|选择算法和模型设计4.试做并尝味道|调整火候和调味|模型训练与调参5.最终成品|端上桌的菜|模型部署与应用二、机器学习的核心流程1.数
Tometor
·
2025-03-13 11:53
spark-ml
机器学习
算法
回归
数据挖掘
人工智能
scala
基于微信小程序的文章管理系统的设计与开发(源码+lw+部署文档+讲解等)
微信小程序具体实现截图详细视频演示系统测试系统测试目的系统功能测试系统测试结论代码参考数据库参考源码获取前言博主介绍:✌新人博主,工作经验两年+、专注于Java、小程序技术领域和毕业项目实战✌文末获取源码+数据库感兴趣的可以先收藏起来,还有大家在
毕设
选题
#Takagi S#
·
2025-03-12 21:10
微信小程序
notepad++
小程序
大数据面试之路 (三) mysql
将
Spark
SQL加工后的数据存入MySQL通常基于以下几个关键原因:1.数据应用场景适配OLTP与OLAP分工:
Spark
SQL擅长处理大数据量的OLAP(分析型)任务,而MySQL作为OLTP(事务型
愿与狸花过一生
·
2025-03-12 16:38
大数据
面试
职场和发展
如何使用
Spark
LLM 进行自然语言处理
iFLYTEK开发的
Spark
LLM便是这样一个大规模认知模型。通过学习大量文本、代码和图像,
Spark
LLM能够理解和执行基于自然对话的任务。
shuoac
·
2025-03-12 04:36
python
RDD 行动算子
在Apache
Spark
中,RDD(弹性分布式数据集)是核心数据结构之一。行动算子会触发实际的计算并返回结果或执行某些操作。
阿强77
·
2025-03-12 03:02
RDD
Spark
我的2021年总结,从大专生到本科生。
一、下定决心升本,考本科学校二、实习工作三、
毕设
答辩四、被本科录取了五、本科生活六、与csdn的缘分七、2022年的目标在过去的一年,我还是一个即将为了大专毕业和工作而忙碌、以及对未来的迷茫、有过失眠。
程序员飞鸟
·
2025-03-11 22:18
程序人生
职场和发展
讲一下
Spark
的shuffle过程
首先
Spark
的shuffle是
Spark
分布式集群计算的核心。
Spark
的shuffle可以从shuffle的阶段划分,shuffle数据存储,shuffle的数据拉取三个方面进行讲解。
冰火同学
·
2025-03-11 20:29
Spark
spark
大数据
分布式
Spark
常见面试题目(1)
Spark
有哪几种部署的方式,谈谈方式都有哪些特点第一种是local本地部署,通常就是一台机器用于测试。
冰火同学
·
2025-03-11 20:58
Spark
spark
面试
大数据
Spark
数据倾斜的问题
Spark
数据倾斜业务背景
Spark
数据倾斜表现
Spark
的数据倾斜,包括
Spark
Streaming和
Spark
SQL,表现主要有下面几种:1、Excutorlost,OOM,Shuffle过程出错2
冰火同学
·
2025-03-11 20:58
Spark
spark
大数据
分布式
Py
Spark
实现导出两个包含多个Parquet数据文件的S3目录里的对应值的差异值分析
编写Py
Spark
代码实现从一个包含多个Parquet数据文件的AmazonS3目录的dataframe数据里取两个维度字段,一个度量字段的数据,根据这两个维度字段的数据分组统计,计算度量字段的数据的分组总计值
weixin_30777913
·
2025-03-11 19:55
python
spark
数据分析
云计算
Hadoop、
Spark
和 Hive 的详细关系
Hadoop、
Spark
和Hive的详细关系1.ApacheHadoopHadoop是一个开源框架,用于分布式存储和处理大规模数据集。
夜行容忍
·
2025-03-11 18:46
hadoop
spark
hive
大数据技术生态圈:Hadoop、Hive、
Spark
的区别和关系
大数据技术生态圈:Hadoop、Hive、
Spark
的区别和关系在大数据领域中,Hadoop、Hive和
Spark
是三个常用的开源技术,它们在大数据处理和分析方面发挥着重要作用。
雨中徜徉的思绪漫溢
·
2025-03-11 17:07
大数据
hadoop
hive
大数据面试之路 (一) 数据倾斜
Spark
/MapReduce作业卡在某个阶段(如reduce阶段),日志显示少数Task处理大量数据。资源利用率不均衡(如CPU、内存集中在某些节点)。
愿与狸花过一生
·
2025-03-11 17:34
大数据
面试
职场和发展
web前端期末大作业:婚纱网页主题网站设计——唯一旅拍婚纱公司网站HTML+CSS+JavaScript
精彩专栏推荐【作者主页——获取更多优质源码】【web前端期末大作业——
毕设
项目精品实战案例(1
IT-司马青衫
·
2025-03-11 14:11
前端
课程设计
html
scala针对复杂数据源导入与分隔符乱码处理
和如何导入各种数据源文件一、非标准分隔符处理当数据源的分隔符混乱或不统一时(如,、|、\t混合使用),可采用以下方法:1.1动态检测分隔符//示例:自动检测前100行的常用分隔符valsampleLines=
spark
.read.text
Tometor
·
2025-03-11 11:45
scala
javascript
后端
java
数据结构
计算机
毕设
答辩高分技巧,让你脱颖而出
计算机
毕设
答辩高分技巧,让你脱颖而出一、答辩前的充分准备:技术与内容的“双向打磨”1.吃透项目,技术实现了然于胸计算机
毕设
的核心在于技术逻辑与系统设计的合理性。
源码姑娘
·
2025-03-10 16:52
毕业设计
Spark
-TTS:基于大模型的文本语音合成工具
GitHub:https://github.com/
Spark
Audio/
Spark
-TTS
Spark
-TTS是一个先进的文本到语音系统,它利用大型语言模型(LLM)的强大功能进行高度准确和自然的语音合成
CITY_OF_MO_GY
·
2025-03-10 13:35
魅力语音
语音识别
深度学习
人工智能
数据湖架构与实时数仓实践:Hudi、Iceberg、Kafka + Flink +
Spark
1.引言:数据湖与数据仓库的融合趋势在大数据时代,传统的数据仓库(DataWarehouse,DW)因其强一致性和高效查询能力,一直是企业数据分析的核心。然而,随着数据量和数据类型的爆炸式增长,传统数据仓库的存储成本和数据管理难度逐渐增加。为了解决这些问题,数据湖(DataLake)概念应运而生。数据湖能够存储原始数据,支持半结构化和非结构化数据,提供更灵活的计算框架,但其缺乏事务管理和数据一致性
晴天彩虹雨
·
2025-03-10 03:22
架构
kafka
flink
数据仓库
2025年
毕设
ssm网上超市论文+源码
本系统(程序+源码)带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容选题背景关于网上超市系统的研究,现有研究主要集中在电子商务平台的设计与开发、供应链管理、以及用户行为分析等领域。尽管这些研究已经取得了一定的成果,但专门针对基于SSM(Spring、SpringMVC、MyBatis)框架的网上超市系统的研究仍相对较少。随着电子商务的蓬勃发展,网上超市
SSM毕设程序源码JAVA
·
2025-03-10 03:21
课程设计
毕业设计怎样选题?500道Python毕业设计题目推荐,附源码
文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全:1000个热门选题推荐✅Java项目精品实战案例《100套》Java微信小程序项目实战《100套》感兴趣的可以先收藏起来,还有大家在
毕设
选
IT徐师兄
·
2025-03-10 02:16
Python大学生实战项目
课程设计
python
notepad++
毕业设计
Python毕业设计题目推荐
Python毕业设计
毕业设计题目
大数据实战:
Spark
+ Hive 逐笔计算用户盈亏
简介本文将通过使用
Spark
+Hive实现逐笔计算区块链上用户交易数据的盈亏需求。
WuJiWeb3
·
2025-03-10 00:56
区块链链上数据分析
从0到1搭建区块链大数据平台
spark
hive
大数据
web3
区块链
hadoop
分布式计算入门(Py
Spark
处理NASA服务器日志)
目录分布式计算入门(Py
Spark
处理NASA服务器日志)1.引言2.分布式计算概述2.1分布式计算的基本概念2.2Apache
Spark
与Py
Spark
3.NASA服务器日志数据集介绍3.1数据背景3.2
闲人编程
·
2025-03-09 19:16
Python数据分析实战精要
服务器
运维
统计分析
日志
NASA服务器
分布式计算
PySpark
Apache
Spark
: 大数据处理的利器对比与应用实例
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学,从基础到精通不断进阶深入,后续还有实战项目,轻松应对面试,专栏订阅地址:https://blog.csdn.net/mrdeam/category_12647587.html优点:订阅限时19.9付费专栏,私信博主还可进入全栈VIP答疑群,作者优先解答机会(代码指导、远程服务),群里大佬众多可以
步入烟尘
·
2025-03-09 19:45
Python超入门指南全册
apache
spark
大数据
spark
yum配置
yum配置Yum是一个linux工具,用来从网络上下载安装软件到CentOS操作系统中。先要确保虚拟机的网络是通畅的。(1)查看源yum中的源是指它从哪里去下载软件。把yum想象成你自己开的一家商场,那么yum的源就是你的供货商。通过yumrepolist命令可以去查看当前的供货商信息。(如果显示源信息是mirrorlist.centos.org(默认源),那就不能使用了。这个源已经失效了,就是你
Amu_Yalo
·
2025-03-09 19:42
spark
【开题报告】springboot基于B_S架构的视频监控系统的设计与实现4jbbp计算机
毕设
本项目包含程序+源码+数据库+LW+调试部署环境,文末可获取一份本项目的java源码和数据库参考。开题报告研究背景:随着社会的发展和科技的进步,视频监控系统在各个领域得到了广泛应用。传统的视频监控系统往往采用集中式架构,存在着诸多问题,如单点故障、带宽消耗大、实时性差等。为了解决这些问题,基于B/S架构的视频监控系统应运而生。研究意义:基于B/S架构的视频监控系统具有分布式部署、易于维护、资源共享
卓越计算机毕设
·
2025-03-09 15:35
spring
boot
架构
课程设计
Hadoop、
Spark
、Flink Shuffle对比
一、Hadoop的shuffle前置知识:Map任务的数量由Hadoop框架自动计算,等于分片数量,等于输入文件总大小/分片大小,分片大小为HDFS默认值128M,可调Reduce任务数由用户在作业提交时通过Job.setNumReduceTasks(int)设置数据分配到Reduce任务的时间点,在Map任务执行期间,通过Partitioner(分区器)确定每个键值对的目标Reduce分区。默认
逆袭的小学生
·
2025-03-09 10:55
hadoop
spark
flink
Scala_
Spark
_RDD_parttwo
只做记录不展示结果(部分结果放在了代码的注释中):package
spark
_rddimportorg.apache.
spark
.sql.
Spark
Sessionobjectrdd_fiveextendsApp
Gadaite
·
2025-03-09 07:53
Spark基础
scala
spark
big
data
Spark
scala api(一)RDD编程
基础初始化
spark
valconf=new
Spark
Conf().setAppName("wordcount")valsc=new
Spark
Context(conf)转化操作和行动操作的区别在于
spark
weixin_42521881
·
2025-03-09 07:50
spark学习
Scala 中生成一个RDD的方法
在Scala中,生成RDD(弹性分布式数据集)的主要方法是通过
Spark
Context(或
Spark
Session)提供的API。
闯闯桑
·
2025-03-09 06:35
scala
开发语言
大数据
大数据Flink(六十四):Flink运行时架构介绍_flink中涉及到的大数据组件
从以Greenplum为代表的MPP(MassivelyParallelProcessing,大规模并行处理)架构,到Hadoop、
Spark
为代表的批处理架构,再到Storm、Flink为代表的流处理架构
2401_84181942
·
2025-03-09 03:39
程序员
大数据
flink
架构
大数据运维实战指南:零基础入门与核心技术解析(第一篇)
)系列文章目录第一篇:大数据运维概述与核心技能体系第二篇:Hadoop生态体系与集群部署实战第三篇:分布式存储系统运维与优化第四篇:资源调度框架YARN/K8s深度解析第五篇:实时计算框架Flink/
Spark
emmm形成中
·
2025-03-09 01:19
大数据
运维
Mark Github上的一个项目,VLM-R1。GRPO为什么促使MLLM在部分垂域比SFT更好的表现
项目地址:GitHub-om-ai-lab/VLM-R1:SolveVisualUnderstandingwithReinforcedVLMs最近做
毕设
,看到VLM-R1项目,一个有趣的现象:在Grounding
朱韬韬
·
2025-03-08 16:40
github
GRPO
SFT
spark
集群,kafka集群和zookeeper的docker集群快速搭建
准备操作安装docker(宿主机)yuminstalldocker(宿主机时centos用yum管理包)systemctldaemon-reload(重加载deamon服务,是docker的核心)systemctlrestartdocker.service(重启docker服务)docker常用命令dockerps-a查看所有容器dockersearchUbuntu寻找Ubuntu的镜像docke
醉与浮
·
2025-03-08 15:05
tools
docker
spark
kafka
大数据计算框架深入:
Spark
SQL、DataFrame、RDD 性能优化
1.引言Apache
Spark
是当前最流行的大数据计算框架之一,其中
Spark
SQL、DataFrame和RDD(ResilientDistributedDataset)是数据处理的三大核心API。
晴天彩虹雨
·
2025-03-08 10:48
大数据
spark
big
data
探索高性能AI识别和边缘计算 | NVIDIA Jetson Orin Nano 8GB 开发套件测评总结
隔壁桌用树莓派做
毕设
的大学生小张探头一看,默默把刚买的Ras
Loving_enjoy
·
2025-03-08 08:06
实用技巧
人工智能
边缘计算
JAVA
毕设
项目-基于SSM框架的百色学院创新实践学分认定系统源码+设计文档
文末获取源码+数据库+文档感兴趣的可以先收藏,有
毕设
问题,项目以及论文撰写等问题都可以和博主沟通,尽最大努力帮助更多的人!
AICurator
·
2025-03-06 22:46
毕业设计
java
课程设计
开发语言
Spark
单机伪分布式环境搭建、完全分布式环境搭建、
Spark
-on-yarn模式搭建
搭建
Spark
需要先配置好scala环境。三种
Spark
环境搭建互不关联,都是从零开始搭建。如果将文章中的配置文件修改内容复制粘贴的话,所有配置文件添加的内容后面的注释记得删除,可能会报错。
遇安.YuAn
·
2025-03-06 17:06
Spark
大数据平台组件搭建
hadoop
大数据
Spark
scala
环境搭建
软件工程/计算机科学与技术专业毕业设计选题
博主介绍:✌全网粉丝30W+,CSDN全栈领域优质创作者,博客之星、掘金/华为云/阿里云等平台优质作者,计算机
毕设
实战导师。
计算机毕设选手
·
2025-03-06 13:28
计算机毕设选题推荐案例
课程设计
软件工程
spring
boot
开发语言
java
后端
spring
(一)
spark
是什么?
1.
spark
是什么?
spark
是一个用来实现快速,通用的集群计算平台
spark
适用于各种各样原先需要多种不同的分布式平台的场景,包括批处理,迭代算法,交互式查询,流处理。
一智哇
·
2025-03-05 11:21
大数据框架学习
spark
big
data
大数据
spark
hdfs 常用命令
目录lsrmgettext以下按照使用频率和使用先后顺序排序(纯个人习惯)ls列出hdfs文件系统路径下的目录和文件hdfsdfs-ls列出hdfs文件系统路径下所有的目录和文件hdfsdfs-ls-Rrmhadoopfs-rm...hadoopfs-rm-r...每次可以删除多个文件或目录getlocalfile不能和hdfsfile名字不能相同,否则会提示文件已存在,没有重名的文件会复制到本地
毛球饲养员
·
2025-03-05 11:19
spark
spark
hdfs
常用
spark
命令
--
spark
启动localhost$
spark
-sql--masteryarn启动主节点yarn模式--查看hdfs文件hdfsdfs-ls/
spark
/myDatabase.db查看我们建的表其实是是建立在
会拉小提琴的左脚
·
2025-03-05 11:19
大数据
spark
hadoop
hdfs
Spark
详解二
八、
Spark
部署模式1、Local本地模式:运行于本地
spark
-shell--masterlocal[2](local[2]是说,执行Application需要用到CPU的2个核)2、Standalone
卢子墨
·
2025-03-05 11:13
Spark原理
实战
总结
spark
Spark
基本命令
一、
spark
所在目录cdusr/local/
spark
二、启动
spark
/usr/local/
spark
/sbin/start-all.sh启动Hadoop以及
Spark
:bash.
chenworeng5605
·
2025-03-05 10:42
大数据
scala
shell
spark
vi基本使用
打开文件与创建文件是Linux的内置命令,以命令的方式来运行。命令格式:vi/路径/文件名注意以下两种情况:1.如果这个文件不存在,此时就是新建文件,编辑器的左下角会提示:newfile2.如果文件已存在,此时就打开这个文件,进入命令模式。把文本内容添加到一个全新的文件的快捷方式:echo1>>1.txt三种模式vi编辑器有三种工作模式,分别为:命令模式,输入模式,底线模式。命令模式:所敲按键编辑
忧伤火锅麻辣烫
·
2025-03-05 10:09
笔记
Spark
是什么?可以用来做什么?
Apache
Spark
是一个开源的分布式计算框架,专为处理大规模数据而设计。它最初由加州大学伯克利分校开发,现已成为大数据处理领域的核心工具之一。
Bugkillers
·
2025-03-05 10:37
大数据
spark
大数据
分布式
上一页
15
16
17
18
19
20
21
22
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他