E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
spark源码解读
大数据公司 Databricks 详解
Databricks是一家在大数据和人工智能领域具有重要影响力的美国企业软件公司,以下是关于它的详细技术解析:1.起源与背景:Databricks成立于2013年,由来自加州大学伯克利分校AMP实验室的
Spark
Bj陈默
·
2025-01-19 10:00
大数据
全面解读 Databricks:从架构、引擎到优化策略
导语:Databricks是一家由Apache
Spark
创始团队成员创立的公司,同时也是一个统一分析平台,帮助企业构建数据湖与数据仓库一体化(Lakehouse)的架构。
克里斯蒂亚诺罗纳尔多阿维罗
·
2025-01-19 09:27
架构
spark
大数据
使用 Hadoop 实现大数据的高效存储与查询
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-01-18 23:24
经验分享
大数据
hadoop
分布式
Spark
源码分析(一)
Spark
Rpc中序列化与反序列化Serializer的抽象类解读 (正在更新中~)别人能写出来的,你也能行!多学习别人的思路,形成自己的思路,高薪工作奔你而来!
Java序列化实现类JavaSerializer(1)JavaSerializationStream类代码实际例子1:序列化(2)JavaDeserializationStream代码实际例子2:反序列化
Spark
小白的大数据历程
·
2025-01-18 22:07
Spark源码解析
开发语言
spark
大数据
分布式
scala
Spark
源码分析(一)
Spark
Rpc中序列化与反序列化Serializer的抽象类解读 (java序列化部分完结,正在更新RpcEnv部分~)
目录(3)JavaSerializerInstance定义了一个Java序列化实例(1)构造方法参数(2)方法1:serializeStream(3)方法2:deserializeStreamdefaultClassLoader(4)方法3:deserializeStreamloader(5)方法4:serialize(6)方法5:deserializeloader(7)方法6:deseriali
小白的大数据历程
·
2025-01-18 22:37
Spark源码解析
spark
java
python
大数据-257 离线数仓 - 数据质量监控 监控方法 Griffin架构
已更完)HDFS(已更完)MapReduce(已更完)Hive(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis(已更完)Kafka(已更完)
Spark
武子康
·
2025-01-18 10:29
大数据
离线数仓
大数据
数据仓库
java
后端
hadoop
hive
py
spark
中删除hdfs的文件夹
在py
spark
中保存rdd的内存到文件的时候,会遇到文件夹已经存在而失败,所以如果文件夹已经存在,需要先删除。搜索了下资料,发现py
spark
并没有提供直接管理hdfs文件系统的功能。
TDengine (老段)
·
2025-01-18 09:21
大数据
spark
hadoop
hdfs
mapreduce
Python 爬虫:获取网页数据的 5 种方法
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-01-18 07:35
经验分享
python
python
开发语言
爬虫
python捕获异常
try:name="aaa"id="aaa"exceptExceptionase:print("任务报错")print(str(e))print(str(traceback.print_exc()))
spark
.sql
青云游子
·
2025-01-18 02:58
python
Spark
任务提交流程
当包含在applicationmaster中的
spark
-driver启动后,会与资源调度平台交互获取其他执行器资源,并通过反向注册通知对应的node节点启动执行容器。
尘世壹俗人
·
2025-01-18 01:21
大数据Spark技术
大数据
spark
读取、写入Clickhouse以及遇到的问题
最近需要处理Clickhouse里面的数据,经过上网查找总结一下
spark
读写Clickhouse的工具类已经遇到的问题点。具体Clickhouse的讲解本篇不做讲解,后面专门讲解这个。
Alex_81D
·
2025-01-18 01:18
大数据基础
大数据从入门到精通
clickhouse
spark
2024年最新Python:Page Object设计模式_python page object,BTAJ大厂最新面试题汇集
知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、
Spark
、Flink)、数据仓库、Python、前端等等。网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是
m0_60707708
·
2025-01-17 20:36
程序员
python
设计模式
开发语言
2024年总结:大转向
职业转向今年我在职业上尝试做了一个转向,具体的结果可能需要比较长的时间来检验我选择是否正确,所以转向的细节我就不全部展开了,可以确定是我依然会专注在Infra和BigData,比如今年我发布了
Spark
SQL
·
2025-01-17 20:11
年度总结
Java爬虫——使用
Spark
进行数据清晰
1.依赖引入 org.apache.
spark
spark
-core_2.13 3.5.3 org.apache.
spark
spark
-sql_2.13 3.5.32.数据加载从MySQL数据库中加载
Future_yzx
·
2025-01-17 20:59
java
爬虫
spark
万字详解数仓分层设计架构 ODS-DWD-DWS-ADS
把复杂问题简单化5、屏蔽原始数据的(影响),屏蔽业务的影响ETL操作1、数据抽取2、数据清洗3、数据转换4、数据加载数据中台包含的内容很多,对应到具体工作中的话,它可以包含下面的这些内容:系统架构:以Hadoop、
Spark
_Jordan
·
2025-01-17 16:56
自己写的
数据仓库
Monorepo设置:新手指南
CSS技巧与案例详解vue2与vue3技巧合集VueUse
源码解读
Monorepo是一种项目代码管理方法,指在单个代码仓库中管理多个项目,有助于简化代码共享、版本控制、构建和部署的复杂性,并提供更好的可重用性和协作性
·
2025-01-17 14:36
Java 大视界 -- Java 开发
Spark
应用:RDD 操作与数据转换
Apache
Spark
是一个强大的分布式计算框架,提供了高效的数据处理能力,广泛应用于大数据分析与机器学习。
Spark
提供了多种高级API,支持批处理和流处理。
一只蜗牛儿
·
2025-01-17 12:26
java
spark
开发语言
Go 错误处理指北:如何优雅的处理错误?
作为铺垫,我在系列的前两篇文章ErrorvsExceptionvsErrNo和pkg/errors
源码解读
中分别讲解了Go错误处理机制和流行的第三方包pkg/errors,现在是时候对Go
·
2025-01-17 09:20
后端go错误异常处理
告别CSS margin 和 padding 简写,拥抱更优雅的解决方案
CSS技巧与案例详解vue2与vue3技巧合集VueUse
源码解读
在前端开发中,CSS的外边距(margin)和内边距(padding)是使用频率极高的属性。
·
2025-01-17 09:49
使用 Next 14 + NextAuth 4 + Strapi v4进行 Google 和凭据提供商身份验证的完整指南(02)
CSS技巧与案例详解vue2与vue3技巧合集VueUse
源码解读
NextAuthv4介绍NextAuth是一个开源的身份验证解决方案,适用于全栈(Next)应用程序。
·
2025-01-17 09:19
javascript前端
使用 Next 14 + NextAuth 4 + Strapi v4进行 Google 和凭据提供商身份验证的完整指南(01)
CSS技巧与案例详解vue2与vue3技巧合集VueUse
源码解读
最近开始研究Strapi,这是一个无头CMS。由于它仅提供后端,前端部分包括身份验证流程需要你自己构建。
·
2025-01-17 09:19
前端javascript
只有 2% 的开发人员知道的 7 种神奇 JavaScript 数组方法
CSS技巧与案例详解vue2与vue3技巧合集VueUse
源码解读
很多人使用JavaScript数组时,最多就是for循环、map()或者filter()等常见方法,但其实数组还有不少“隐藏招数”。
·
2025-01-17 09:16
Spring Boot 和微服务:快速入门指南
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-01-17 09:56
Java
经验分享
spring
boot
微服务
后端
如何只使用 CSS 实现网站的暗黑模式切换
CSS技巧与案例详解vue2与vue3技巧合集VueUse
源码解读
想让你的网站从“明亮清新”切换到“暗黑酷炫”,而不依赖任何JavaScript?没问题!
·
2025-01-17 05:01
CDP中的Hive3之Hive Metastore(HMS)
Impala、
Spark
、Hive和其他服务共享元存储。与HMS的连接包括HiveServe
对许
·
2025-01-17 02:31
#
Hive
#
Spark
hive
cdp
【YashanDB知识库】Hive 命令工具insert崖山数据库报错
【问题分类】功能兼容【关键字】
spark
30041、不兼容【问题描述】本项目的架构是hadoop+hive+yashandb使用崖山数据库,初始化所有的原数据表和数据新建表之后,插入数据时候报错,hadoopcode30041
·
2025-01-17 00:46
数据库
初学者如何用 Python 写第一个爬虫?
大数据技术:涵盖Hadoop(HDFS)、Hive、
Spark
、Fli
王子良.
·
2025-01-16 23:27
python
经验分享
python
开发语言
爬虫
5分钟内理解 .prototype 链 | 2024
CSS技巧与案例详解vue2与vue3技巧合集VueUse
源码解读
在JavaScript的世界里,原型(prototype)系统是一个常被讨论但不易掌握的概念。
·
2025-01-16 22:36
Apache PAIMON 学习
新一代实时数据湖技术,ApachePAIMON兼容ApacheFlink、
Spark
等主流计算引擎,并支持流批一体化处理、快速查询和性能优化,成为加速AI转型的重要工具。
潇锐killer
·
2025-01-16 22:54
学习
VLM 系列——Qwen2 VL——论文解读——前瞻(
源码解读
)
一、概述1、是什么是一系列多模态大型语言模型(MLLM),其中包括2B、7B、72B三个版本,整体采用视觉编码器+LLM形式(可以认为没有任何投射层)。比较创新的是图像缩放方式+3DLLM位置编码+(预估后面的训练方式也不太一样)。能够处理包括文本、图像在内的多种数据类型,具备图片描述、单图文问答、多图问对话、视频理解对话、json格式、多语言、agent、高清图理解(代码编写和debug论文暂时
TigerZ*
·
2025-01-16 18:48
AIGC算法
AIGC
人工智能
transformer
计算机视觉
图像处理
只有 1% 的开发人员能在 60 秒内找到代码中的错误
CSS技巧与案例详解vue2与vue3技巧合集VueUse
源码解读
下面这段简单的JavaScript代码里藏着一个不起眼但足以让人抓狂的错误:functiongetResult(a,b){return{
·
2025-01-16 18:30
应急救援路径规划中的蚁群算法与路径评价研究【附代码】
数据驱动决策✨专业领域:数据挖掘与清洗大数据处理与存储技术机器学习与深度学习模型数据可视化与报告生成分布式计算与云计算数据安全与隐私保护擅长工具:Python/R/Matlab数据分析与建模Hadoop/
Spark
拉勾科研工作室
·
2025-01-16 17:36
算法
Java 大视界 -- Java 开发
Spark
应用:RDD 操作与数据转换(四)
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。本博客的精华专栏:大数
青云交
·
2025-01-16 16:59
大数据新视界
Java
大视界
Spark
RDD
数据转换
大数据
数据分区
性能优化
社交网络
java
大数据新视界 --大数据大厂之
Spark
Streaming 实时数据处理框架:案例与实践
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。本博客的精华专栏:大数
青云交
·
2025-01-16 15:21
大数据新视界
#
Spark
之道
Spark
Streaming
大数据新视界
实时数据处理
案例分析
实践技巧
框架比较
应用场景
nosql数据库技术与应用知识点
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(
Spark
、Flink
皆过客,揽星河
·
2024-09-16 08:42
NoSQL
nosql
数据库
大数据
数据分析
数据结构
非关系型数据库
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统
spark
大数据毕设项目(源码、调试、LW、开题、PPT)
作者:计算机源码社个人简介:本人八年开发经验,擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等,大家有这一块的问题可以一起交流!学习资料、程序开发、技术解答、文档报告如需要源码,可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
计算机源码社
·
2024-09-15 20:02
Python项目
大数据
大数据
python
hadoop
计算机毕业设计选题
计算机毕业设计源码
数据分析
spark毕设
Spark
组件 GraphX、Streaming
Spark
组件GraphX、Streaming一、
Spark
GraphX1.1GraphX的主要概念1.2GraphX的核心操作1.3示例代码1.4GraphX的应用场景二、
Spark
Streaming2.1
Spark
Streaming
叶域
·
2024-09-15 14:54
大数据
spark
spark
大数据
分布式
大数据毕业设计hadoop+
spark
+hive知识图谱租房数据分析可视化大屏 租房推荐系统 58同城租房爬虫 房源推荐系统 房价预测系统 计算机毕业设计 机器学习 深度学习 人工智能
做了那么多年开发,自学了很多门编程语言,我很明白学习资源对于学一门新语言的重要性,这些年也收藏了不少的Python干货,对我来说这些东西确实已经用不到了,但对于准备自学Python的人来说,或许它就是一个宝藏,可以给你省去很多的时间和精力。别在网上瞎学了,我最近也做了一些资源的更新,只要你是我的粉丝,这期福利你都可拿走。我先来介绍一下这些东西怎么用,文末抱走。(1)Python所有方向的学习路线(
2401_84572577
·
2024-09-15 10:20
程序员
大数据
hadoop
人工智能
Spark
集群的三种模式
文章目录1、
Spark
的由来1.1Hadoop的发展1.2MapReduce与
Spark
对比2、
Spark
内置模块3、
Spark
运行模式3.1Standalone模式部署配置历史服务器配置高可用运行模式
MelodyYN
·
2024-09-15 01:16
#
Spark
spark
hadoop
big
data
Java中的大数据处理框架对比分析
本文将重点介绍ApacheHadoop、Apache
Spark
、ApacheFlink和ApacheStorm这四种流行的
省赚客app开发者
·
2024-09-14 20:41
java
开发语言
写出渗透测试信息收集详细流程
一、扫描域名漏洞:域名漏洞扫描工具有AWVS、APPSCAN、Net
spark
、WebInspect、Nmap、Nessus、天镜、明鉴、WVSS、RSAS等。
卿酌南烛_b805
·
2024-09-14 16:08
Spark
MLlib模型训练—推荐算法 ALS(Alternative Least Squares)
Spark
MLlib模型训练—推荐算法ALS(AlternativeLeastSquares)如果你平时爱刷抖音,或者热衷看电影,不知道有没有过这样的体验:这类影视App你用得越久,它就好像会读心术一样
不二人生
·
2024-09-14 08:25
Spark
ML
实战
spark-ml
推荐算法
算法
K8S源码及定制化系列-
源码解读
第一步Kubectl(三)
本节重点介绍:kubectl的职责和kubectl的代码原理cobra库的使用简介kubectl的职责主要的工作是处理用户提交的东西(包括,命令行参数,yaml文件等)然后其会把用户提交的这些东西组织成一个数据结构体然后把其发送给APIServerKubectl系统架构图kubectl的代码原理从命令行和yaml文件中获取信息通过Builder模式并把其转成一系列的资源最后用Visitor模式模式
申专
·
2024-09-13 19:29
Golang
云原生
kubernetes
容器
云原生
Python基础知识进阶之正则表达式_头歌python正则表达式进阶
知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、
Spark
、Flink)、数据仓库、Python、前端等等。网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是
前端陈萨龙
·
2024-09-13 13:50
程序员
python
学习
面试
分布式离线计算—
Spark
—基础介绍
原文作者:饥渴的小苹果原文地址:【
Spark
】
Spark
基础教程目录
Spark
特点
Spark
相对于Hadoop的优势
Spark
生态系统
Spark
基本概念
Spark
结构设计
Spark
各种概念之间的关系Executor
测试开发abbey
·
2024-09-13 11:11
人工智能—大数据
spark
常用命令
查看报错日志:yarnlogsapplicationID
spark
2-submit--masteryarn--classcom.hik.ReadHdfstest-1.0-SNAPSHOT.jar进入$
SPARK
_HOME
我是浣熊的微笑
·
2024-09-13 10:38
spark
spark
启动命令
hadoop启动:cd/root/toolssstart-dfs.sh,只需在hadoop01上启动stop-dfs.sh日志查看:cat/root/toolss/hadoop/logs/hadoop-root-datanode-hadoop03.outzookeeper启动:cd/root/toolss/zookeeperbin/zkServer.shstart,三台都要启动bin/zkServ
学不会又听不懂
·
2024-09-13 10:36
spark
大数据
分布式
大数据领域的深度分析——AI是在帮助开发者还是取代他们?
1.大数据领域的AI工具现状在大数据领域,AI工具已经取得了显著进展,以下是几款主要的AI工具及其功能和实际应用:Apache
Spark
+MLlib:Apache
Spark
是一个开源的分布式计算系统,广泛用于
阳爱铭
·
2024-09-13 09:32
大数据与数据中台技术沉淀
大数据
人工智能
后端
数据库架构
数据库开发
etl工程师
chatgpt
大数据新视界 --大数据大厂之
Spark
性能优化秘籍:从配置到代码实践
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。本博客的精华专栏:Ja
青云交
·
2024-09-13 08:25
大数据新视界
Spark
性能优化
内存分配
并行度
存储级别
shuffle
减少
算法优化
代码实践
数据读取
广播变量
数据倾斜
Spark
数据库
编程常用命令总结
编程命令大全1.软件环境变量的配置JavaScala
Spark
HadoopHive2.大数据软件常用命令
Spark
基本命令
Spark
-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令
Yellow0523
·
2024-09-13 02:42
Linux
BigData
大数据
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他