E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
mapreduce源码分析
【
MapReduce
】分布式计算框架
MapReduce
分布式计算框架
MapReduce
什么是
MapReduce
?
桥路丶
·
2025-02-08 15:00
大数据Hadoop快速入门
big
data
Hive自定义UDF函数
JSONObject解析JSON对象二、JSONArray解析JSON数组对象三、两个UDF的配合使用过程一、UDF概述UDF全称:User-DefinedFunctions,即用户自定义函数,在HiveSQL编译成
MapReduce
浊酒南街
·
2025-02-08 07:30
#
大数据系列三
hive
UDF
MapReduce
的代码编写
MapReduce
用例代码的编写流程1)函数入口①首先创建配置对象Configuration,用于加载配置文件的信息;②创建一个Job对象,通过getInstance()函数设置当前main函数所在的类
hjy1821
·
2025-02-08 02:27
MapReduce
MapReduce代码
WordCount字数统计代码
MapReduce编写
MapReduce使用案例
RocketMQ中的NameServer主要数据结构
以前我有一篇博客中rocketMq
源码分析
之搭建本地环境-CSDN博客,在这篇博客中就简单看了下NameSever中会有两个组件:NamesrvConfig和NettyServerConfig。
小园子的小菜
·
2025-02-08 00:42
MQ
rocketmq
java-rocketmq
java
中间件
一文了解
mapreduce
及工作原理
目录前言-MR概述1.Hadoop
MapReduce
设计思想及优缺点设计思想优点:缺点:2.Hadoop
MapReduce
核心思想3.
MapReduce
工作机制剖析
MapReduce
运行机制过程描述第一阶段
TEL浅笑嫣然
·
2025-02-07 20:22
openstack
大数据
hadoop
笔记
大数据-267 实时数仓 - ODS Lambda架构 Kappa架构 核心思想
目前已经更新到了:Hadoop(已更完)HDFS(已更完)
MapReduce
(已更完)Hive(已更完)Flume(已更完)Sqoop(已更完)Zookeeper(已更完)HBase(已更完)Redis
m0_74823336
·
2025-02-07 16:57
面试
学习路线
阿里巴巴
大数据
架构
Hbase基础
HBase是基于Google的Bigtable技术实现的,GoogleBigtable利用GFS作为其文件存储系统,HBase利用Hadoop的HDFS作为其文件存储系统;Google运行
MapReduce
yandao
·
2025-02-07 13:38
hadoop
hbase
big
data
hadoop
nginx+flume网络流量日志实时数据分析实战_日志数据分析(1)
得到visits模型hadoopjar/export/data/
mapreduce
/web_log.jarcn.itcast.bigdata.weblog.clickstream.ClickStreamVisit
2401_84182578
·
2025-02-07 11:22
程序员
nginx
flume
数据分析
【kafka】kafka的动态配置管理使用和分析
该文章可能已过期,已不做勘误并更新,请访问原文地址(持续更新)Kafka中的动态配置
源码分析
kafka知识图谱:Kafka知识图谱大全kafka管控平台推荐使用滴滴开源的Kafka运维管控平台(戳我呀)
石臻臻的杂货铺
·
2025-02-07 06:16
Kafka
kafka
运维
如何处理大规模数据集中的数据处理:Spark和ApacheFlink
基本概念术语说明数据处理(DataProcessing)任务调度(TaskScheduling)HadoopApacheSparkApacheFlink3.核心算法原理和具体操作步骤以及数学公式讲解1.
MapReduce
AI天才研究院
·
2025-02-07 01:43
DeepSeek
R1
&
大数据AI人工智能大模型
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
基于android2.3.5系统:Android中native层C++单例模式
****************************************************************作者:EasyWave时间:2013.02.16类别:Android系统
源码分析
声明
wang-bob
·
2025-02-06 22:55
Android系统
HIVE常见面试题
Hive通过将结构化的数据文件映射成表,并提供类SQL的查询功能,使得用户可以通过编写SQL语句来进行数据分析,而不需要编写复杂的
MapReduce
程序2.简述hive读写文件机制Hive读写文件机制主要依赖
兔子宇航员0301
·
2025-02-06 18:59
数据开发小白成长笔记
hive
hadoop
数据仓库
node.js的require()
本文通过
源码分析
,详细介绍require语句的内部运行机制,帮你理解Node.js的模块机制。一、requ
是小傲雨呀^_^
·
2025-02-06 08:52
node.js
深入分析React-Scheduler原理
本文是基于众多的
源码分析
文章,加入自己的理解,然后输出
xiaofeng123aazz
·
2025-02-06 08:20
reactjs
使用python实现Hadoop中
MapReduce
Hadoop包含HDFS(分布式文件系统)、YARN(资源管理器)、
MapReduce
(编程模型)。
qq_44801116
·
2025-02-06 06:10
Python
python
hadoop
mapreduce
【大数据技术】编写Python代码实现词频统计(python+hadoop+
mapreduce
+yarn)
编写Python代码实现词频统计(python+hadoop+
mapreduce
+yarn)搭建完全分布式高可用大数据集群(VMware+CentOS+FinalShell)搭建完全分布式高可用大数据集群
Want595
·
2025-02-06 06:05
Python大数据采集与分析
大数据
python
hadoop
Hadoop1.0和2.0的主要区别
Hadoop1.0指的是版本为ApacheHadoop0.20.x、1.x或者CDH3系列的Hadoop,组件主要由HDFS和
MapReduce
两个系统组成,HDFS是一个分布式文件存储系统,
MapReduce
web_15534274656
·
2025-02-06 03:43
java
hadoop
大数据
hdfs
dubbo
java-zookeeper
Hadoop1.0-HDFS介绍
最核心的模块包括HadoopCommon、HDFS与
MapReduce
。
szjianzr
·
2025-02-06 03:13
HADOOP介绍
hadoop
HDFS
QML音视频架构与设计
QML音视频架构与设计使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与
源码分析
视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个QT技术视频免费QT视频课程
QT性能优化QT原理源码QT界面美化
·
2025-02-05 23:43
qt
qt6.3
qt5
QT教程
c++
大数据相关开源项目汇总
YARN是一种新的Hadoop资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,解决了旧
MapReduce
框架的性能瓶颈。它的基本思想是把资源
万里浮云
·
2025-02-05 17:03
大数据
顺序表ArrayList
源码分析
顺序表中的ArrayList源码新增元素add(intindex,Eelement)的时候,用到了位运算右移一位,此时扩容后的数组大小是原来的1.5倍(n+0.5n=1.5n),代码如下:intnewCapacity=oldCapacity+(oldCapacity>>1);然后用到了如下代码来将旧的数组中的元素移动到扩容后的数组中去:elementData=Arrays.copyOf(eleme
汤坤Sunshine
·
2025-02-05 11:10
Java基础
面试
java
ArrayList
为什么我的CDH不用Hue,改用Scriptis了?
理性谈谈Hue的优缺点平时做数据开发用的比较多的是CDH的Hue,Hue提供了对接Hadoop平台的UI界面,可以对Hbase数据进行直接操作,执行
Mapreduce
r任务时有可视化的执行界面,进行数据报表和
兔子那么可爱
·
2025-02-05 09:58
大数据
UI
开源
数据分析
中间件
ThreadLocal原理和使用场景
核心
源码分析
注意:ThreadLocal通常都定义为static,ThreadLo
Happytoo_
·
2025-02-05 07:14
java
java
开发语言
ThreadLocal
Android Audio基础(20)——AudioTrack音频控制
一、
源码分析
1、主要方法构造函数:创建AudioTrack时调用。play():播放音频文件。pause():暂停播放音频文件。stop():停止播放音频文件。flus
yyc_audio
·
2025-02-04 20:56
音频
android
音视频
驱动开发
VSCode
源码分析
参考资料
VSCodeArchitectureAnalysis-ElectronProjectCross-PlatformBestPractices中文版VSCode架构分析-Electron项目跨平台最佳实践SihanLi博客上的vscode
源码分析
系列
AI时代的程序员
·
2025-02-04 10:05
vscode
ide
编辑器
Hadoop3.2.1安装-单机模式和伪分布式模式
主要包括HDFS和
MapReduce
两个组件。
花菜回锅肉
·
2025-02-04 07:13
大数据
hadoop
hdfs
大数据
linux
apollo-client
源码分析
文章目录Apollo-Client1、基础客户端1.1、客户端获取配置流程1.1.1、初始化1.1.2、获取配置1.1.3、感知远程配置更新1.1.4、ConfigRepository监听器更新数据2、远程服务端设置3、Spring集成3.1、Spring初始化3.2、Config监听器更新数据Apollo-Client1、基础客户端Configconfig=ConfigService.getAp
肥牛火锅
·
2025-02-04 06:09
Java
Spring
java
开发语言
Hive重点面试题
Hive面试重点题目及答案1.Hive的优缺点及使用场景2.Hive与数据仓库的区别3.Hive的基本架构与元数据存储4.Hive内外部表的区别及适用场景5.Hive数据倾斜原因与解决方法6.Hive
MapReduce
Major Tom _
·
2025-02-03 20:43
hive
hadoop
数据仓库
Ubuntu 下 nginx-1.24.0
源码分析
ngx_debug_init();
目录ngx_debug_init()函数:NGX_LINUX的定义:ngx_debug_init()函数:ngx_debug_init()函数定义在src\os\unix目录下的ngx_linux_config.h中#definengx_debug_init()也就是说这个环境下的main函数中的ngx_debug_init()这行代码其实什么都没有做在nginx.c的开头引入了#include而
若云止水
·
2025-02-03 18:25
nginx
运维
Ubuntu 下 nginx-1.24.0
源码分析
- ngx_strerror_init()函数
目录ngx_strerror_init()函数声明ngx_int_t类型声明定义intptr_t类型ngx_strerror_init()函数实现NGX_HAVE_STRERRORDESC_NPngx_strerror_init()函数声明在nginx.c的开头引入了:#include在ngx_core.h中引入了#include在ngx_errno.h这个文件中声明了ngx_strerror_i
若云止水
·
2025-02-03 17:51
nginx
运维
Java 中 List 源码解析:深度剖析与实现
通过对List接口及其常见实现类的
源码分析
,开发者可以深入理解其内部机制和实现方式,进而优化应用程序的性能,做出更合适的选择。
HelloZheQ
·
2025-02-03 00:34
java
list
windows
深入解析 Python 装饰器:高级用法、最佳实践与源码剖析
本文将从装饰器的底层原理、高级用法、性能优化、常见陷阱及
源码分析
等多个角度,深度解析Python装饰器的强大之处。1.Python装饰器的底层原理装饰器本质
赵大仁
·
2025-02-03 00:26
Python
后端
技术
python
开发语言
人工智能
【llm对话系统】大模型 Llama
源码分析
之并行训练方案
1.引言训练大型语言模型(LLM)需要巨大的计算资源和内存。为了高效地训练这些模型,我们需要采用各种并行策略,将计算和数据分布到多个GPU或设备上。Llama作为当前最流行的开源大模型之一,其训练代码中采用了多种并行技术。本文将深入Llama的训练代码,分析其并行训练方案,主要关注参数并行和部分结构参数共享。2.并行训练策略概述常见的并行训练策略包括:数据并行(DataParallelism,DP
kakaZhui
·
2025-02-02 13:14
llama
人工智能
AIGC
chatgpt
【llm对话系统】大模型 Llama
源码分析
之 LoRA 微调
1.引言微调(Fine-tuning)是将预训练大模型(LLM)应用于下游任务的常用方法。然而,直接微调大模型的所有参数通常需要大量的计算资源和内存。LoRA(Low-RankAdaptation)是一种高效的微调方法,它通过引入少量可训练参数,固定预训练模型的权重,从而在保持性能的同时大大减少了计算开销。本文将深入分析LoRA的原理,并结合Llama源码解读其实现逻辑,最后探讨LoRA的优势。2
kakaZhui
·
2025-02-02 13:14
llama
深度学习
pytorch
AIGC
chatgpt
【llm对话系统】大模型 Llama
源码分析
之 Flash Attention
1.写在前面近年来,基于Transformer架构的大型语言模型(LLM)在自然语言处理(NLP)领域取得了巨大的成功。Transformer的核心组件是自注意力(Self-Attention)机制,它允许模型捕捉输入序列中不同位置之间的关系。然而,标准的自注意力机制的计算复杂度与序列长度的平方成正比,这使得它在处理长序列时效率低下。为了解决这个问题,FlashAttention被提出,它是一种高
kakaZhui
·
2025-02-02 13:43
llama
人工智能
AIGC
chatgpt
spark和python的区别_Spark入门(Python)
Spark使用函数式编程范式扩展了
MapReduce
模型以支持更多计算类型,可以涵盖广泛的工作流,这些工作流之前被实现为Hadoop之上的特殊系统。
weixin_39934257
·
2025-02-01 23:42
spark和python的区别
hive表指定分区字段搜索_Hive学习-Hive基本操作(建库、建表、分区表、写数据)...
Hive是类SQL语法的数据查询、计算、分析工具,执行引擎默认的是
MapReduce
,可以设置为Spark、Tez。Hive分内部表和外部表,外部表在建表的同时指定一个
weixin_39710660
·
2025-02-01 04:00
hive表指定分区字段搜索
11 Spark面试真题
11Spark大厂面试真题1.通常来说,Spark与
MapReduce
相比,Spark运行效率更高。请说明效率更高来源于Spark内置的哪些机制?2.hadoop和spark使用场景?
TTXS123456789ABC
·
2025-01-31 16:26
#
Spark
spark
面试
大数据
【llm对话系统】大模型
源码分析
之llama模型的long context更长上下文支持
1.引言Llama模型的一个重要特性是支持长上下文处理。本文将深入分析Llama源码中实现长上下文的关键技术点,包括位置编码(positionembedding)的外推方法、注意力机制的优化等。我们将通过详细的代码解析来理解其实现原理。2.位置编码的外推实现2.1旋转位置编码(RoPE)基础Llama采用旋转位置编码(RoPE,RotaryPositionEmbedding)来编码token的位置
kakaZhui
·
2025-01-30 12:57
llama
深度学习
pytorch
AIGC
chatgpt
YOLOv11小白的进击之路(六)创新YOLO的iou及损失函数时的
源码分析
iou或者说是损失函数的修改经常作为论文的创新点之一,那这篇文章就总结分析了在对YOLO11进行损失函数创新时需要关注的源代码,新的一年祝大家论文与财都发发发!总的来看需要关注三个函数,分别位于YOLO庞大源码的不同文件,下面逐一分析:bbox_iou函数bbox_iou函数位于/ultralytics-main/ultralytics/utils/metrics.py,这个函数的目的是计算两个边
水静川流
·
2025-01-30 12:23
YOLO
YOLO
pytorch
yolo
计算机视觉
人工智能
python
skynet
源码分析
(7)--skynet中的timer
作者:
[email protected]
,转载请注明作者skynet的timer是做游戏用得比较频繁的一个功能,分析一下它的源码还是有意义的。而且核心的C源码除了timer和网络以外,已经基本分析得差不多了。其它都是跟luacapi相关,或者是跟lua交互比较多的。timer的源码在skynet-timer.c和skynet-timer.h中。在开始看代码之前,请大家默念三遍:1秒=10
心中那自由的世界
·
2025-01-30 08:56
python 分布式集群_Python搭建Spark分布式集群环境
Spark最大的特点就是快,可比Hadoop
MapReduce
的处理速度快100倍。本文没有使用一台电脑上构建多个虚拟机的方法来模拟集群,而是使用三台电脑来搭建一个小型分布式集群环境安装。
小国阁下
·
2025-01-30 05:32
python
分布式集群
Hadoop错误: put: Lease mismatch on ... by DFSClient_NON
MAPREDUCE
_-499992815_1.... 学习总结
错误总结分享:使用了hadoop挺长时间了,多数人应该很熟悉它的特点了吧,但是今天突然遇到个错误,从来没见过,一时自己也想不到是什么原因,就在网上查了一些资料,得到了解决的办法,再次分享一下。过程:使用kettle数据清洗工具在进行同步任务的过程中,最后数据是被加载到hdfs的,这里用shell脚本实现,hdfsdfs-put-r/hdfs的目录。结果程序执行到这一步的时候报错了。错误描述就是文章
星月情缘02
·
2025-01-30 03:45
ETL技术
Hadoop
hdfs租约
hadoop错误
【llm对话系统】大模型
源码分析
之 LLaMA 位置编码 RoPE
在自然语言处理(NLP)领域,Transformer模型已经成为主流。然而,Transformer本身并不具备处理序列顺序的能力。为了让模型理解文本中词语的相对位置,我们需要引入位置编码(PositionalEncoding)。本文将深入探讨LLaMA模型中使用的RotaryEmbedding(旋转式嵌入)位置编码方法,并对比传统的Transformer位置编码方案,分析其设计与实现的优势。1.传
kakaZhui
·
2025-01-29 23:17
llama
深度学习
人工智能
AIGC
chatgpt
QT核心模块源码解析:组件化开发与模块化设计
QT核心模块源码解析:组件化开发与模块化设计使用AI技术辅助生成QT界面美化视频课程QT性能优化视频课程QT原理与
源码分析
视频课程QTQMLC++扩展开发视频课程免费QT视频课程您可以看免费1000+个
QT性能优化QT原理源码QT界面美化
·
2025-01-29 20:26
qt
qt6.3
qt5
QT教程
c++
Linux内存管理:(一)物理页面分配流程 及 Linux6.5
源码分析
(中)
《Linux6.5
源码分析
:内存管理系列文章》本系列文章将对内存管理相关知识进行梳理与
源码分析
,重点放在linux
源码分析
上,并结合eBPF程序对内核中内存管理机制进行数据实时拿取与分析。
Albert XUU
·
2025-01-29 07:47
内存管理
linux
运维
服务器
ffmpeg
源码分析
:结构体成员管理系统-AVOption
AVOption用于在FFmpeg中描述结构体中的成员变量。一个AVOption可以包含名称,简短的帮助信息,取值等等。下面开始从代码的角度记录AVOption。AVOption结构体的定义如下所示。libavutil\Opt.h/** *AVOption */typedefstructAVOption{ constchar*name; /** *shortEnglishhelptext
风雨兼程8023
·
2025-01-29 04:26
ffmpeg
ffmpeg
AVOption
图文详解
MapReduce
on YARN
前言本文隶属于专栏《1000个问题搞定大数据技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!本专栏目录结构和参考文献请见1000个问题搞定大数据技术体系正文权威版本——《Hadoop权威指南第3版》1.作业提交MRrunJob从RM获取新的作业ID作业客户端检査作业的输出说明,计算输入分片并将作业资源(包括作业JAR、配置和分片信息)复制到HDFS。通过调用R
Shockang
·
2025-01-28 13:20
大数据技术体系
大数据
mapreduce
yarn
深入
MapReduce
——从MRv1到Yarn
引入我们前面篇章有提到,和
MapReduce
的论文不太一样。
黄雪超
·
2025-01-28 12:49
大数据基础
#
深入MapReduce
mapreduce
大数据
hadoop
大数据小白系列——YARN(1)
这是大数据小白系列,YARN的第一篇,准确的说是介绍YARN的“前身”,即
MapReduce
第一版(下称MRv1)中的资源管理系统。
weixin_44386638
·
2025-01-28 07:13
大数据
大数据
人工智能
机器学习
数据挖掘
数据分析
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他