E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
预计分皮肤
LLM-
预
训练:深入理解 Megatron-LM(2)原理介绍
最近在基于Megatron-LM的代码来训练大语言模型,本人觉得Megatron的代码很具有学习意义,于是大量参考了网上很多对Megatron代码的解读文章和NVIDAMegatron团队公开发布的2篇论文,并结合最近Megatron-LM代码库的更新,整理成了这几篇系列文章。Megatron-LM代码版本:23.06https://github.com/NVIDIA/Megatron-LM/tr
u013250861
·
2025-02-01 15:05
#
LLM/训练
人工智能
jQuery可选择日期范围的日期选择器插件
整个日期选择器插件使用CSS来渲染样式,可以非常容易的使用CSS来定制它的
皮肤
。它的兼容性非常好,支持IE6+的IE浏览器。
�时过境迁,物是人非
·
2025-02-01 13:45
jquery
前端
javascript
深度学习-笔记1
在这儿做一个笔记:网址:https://gitee.com/paddlepaddle/PaddleNLPpaddle-nlp是一个自然语言处理NLP方面的工具包(代码库)ERNIEERNIE是百度基于BERT改进的
预
训练大模型
·
2025-02-01 12:15
深度学习神经网络
【学习心得】Python好库推荐——PEFT
这种技术主要应用于大型
预
训练模型的微调过程中,目的是在保持模型性能的同时减少所需的计算资源和时间。通过PEFT,可以有效地调整模型以适应特定任务或数据集,而无需对整个模型的所有参数进行全面微调。
小oo呆
·
2025-02-01 06:48
【学习心得】
人工智能
python
语言模型
Kafka 如何实现高性能
1.高吞吐量的设
计分
布式架构:Kafka通过分布式的集群架构设计来横向扩展,提高吞吐量。多个生产者、消费者和节点可以同时并行工作,分担流量负载。
言之。
·
2025-02-01 02:49
架构
面试
kafka
分布式
Python入门教程丨3.2 再见Excel!用Python这5个模块,我把3天工作压缩到3分钟
本期内容:模块核心功能应用场景math数学计算几何、物理模拟random生成随机数据游戏、抽样测试statistics统
计分
析回归分析、市场调研numpy数组与矩阵运算图像处理、机器学习pandas表格数据处理与分析金融分析
凌小添
·
2025-01-31 21:09
Python教程
python
excel
开发语言
深度学习篇---深度学习框架
简介特点动态计算图易于上手强大的社区支持与Python的集成度高核心组件2.TensorFlow简介特点静态计算图跨平台强大的生态系统Keras集成核心组件3.PaddlePaddle简介特点易于使用高性能工业级应用丰富的
预
训练模型核心组件第二部分
Ronin-Lotus
·
2025-01-31 21:05
深度学习篇
深度学习
人工智能
python
Pytorch
TensorFlow
paddlepaddle
单位订餐系统小程序技术开发架构功能分析
一、用户管理功能员工信息维护:存储员工姓名、工号、部门、联系方式等基本信息,便于识别订餐人员身份与所属部门,利于后续统
计分
析与配送安排。例如新员工入职时自动录入信息,员工信息变更可及时更新。
v.15889726201
·
2025-01-31 17:59
大数据
数据库
【大模型入门必看】LLM大语言模型导读
本章将简要梳理大语言模型的技术要点以及构建过程,并且列举了可用于
预
训练以及微调模型的常用数据集,介绍了目前开发大语言模型常用的代码库、
预
训练大语言模型的步骤以及涉及的关键技术,包括数据准备阶段、模型
古-月
·
2025-01-31 16:24
LLM
大语言模型
python 使用Whisper模型进行语音翻译
多尺寸
预
训练模型:官方提供了5个不同大小的模型(tiny,
哦里 哦里哦里给
·
2025-01-31 15:16
AI
大语言模型实战
python
whisper
Deepseek两项关键发现:无需人类专家介入SFT、有自己
目前尚未实现AGI,主流AI行业和公众普遍认为通过扩大纯语言模型(LLM)的
预
训练规模就能实现突破
极道Jdon
·
2025-01-31 08:13
javascript
reactjs
GGUF 大模型文件格式
1.基础原理GGUF简介当前的大模型的参数规模较大,数以千亿的参数导致了它们的
预
训练结果文件都在几十GB甚至是几百GB,这不仅导致其使用成本很高,在不同平台进行交换也非常困难。
香菜烤面包
·
2025-01-31 07:04
AI
系统与算法部署
语言模型
vue3+vite+Electron构建跨平台应用
集中配置主进程、渲染器和预加载脚本的Vite配置,并针对Electron的独特环境进行
预
配置。为渲染器提供快速模块热替换(H
vitenode
·
2025-01-31 06:28
Electron
electron
javascript
前端
使用numpy自定义数据集 使用tensorflow框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行
预
1.引言逻辑回归(LogisticRegression)是一种常见的分类算法,广泛应用于二分类问题。在本篇博客中,我们将使用numpy生成一个简单的自定义数据集,并使用TensorFlow框架构建和训练逻辑回归模型。训练完成后,我们会保存模型,并演示如何加载保存的模型进行预测。2.创建自定义数据集首先,我们使用numpy生成一个简单的二分类数据集,包含两个特征和对应的标签。标签0表示负类,标签1表
辞落山
·
2025-01-31 04:11
numpy
tensorflow
逻辑回归
AI绘画能取代设计师吗?
1.AI绘画的现状1.1AI绘画技术的形成与发展AI绘画的背后,离不开图像风格迁移、图文
预
训练模型和扩散模型这三大技术的共同推动。有点像是一位多才多艺的音乐家,利用不同
网络安全我来了
·
2025-01-30 20:09
IT技术
AI作画
模型架构选择:从传统NLP到Transformer
模型架构选择:从传统NLP到Transformer关键词:自然语言处理(NLP),模型架构,传统NLP,Transformer,RNN,CNN,
预
训练模型文章目录模型架构选择:从传统NLP到Transformer1
AI天才研究院
·
2025-01-30 08:23
AI大模型应用入门实战与进阶
大数据AI人工智能
计算
大数据
人工智能
语言模型
AI
大模型
LLM
Java
Python
架构设计
Agent
RPA
大型语言模型构建指南:从头开始构建大语言模型《Build a Large Language Model (From Scratch)》免费PDF
你将从最初的设计和创建到通用语料库的
预
训练,一直到特定任
AGI大模型学习
·
2025-01-30 05:34
语言模型
pdf
人工智能
大模型
大模型学习
大模型教程
大模型书籍
书籍推荐:《从零构建大型语言模型》附免费PDF下载
你将从最初的设计和创建到通用语料库的
预
训练,一直到特定任
大模型入门学习
·
2025-01-30 05:33
语言模型
pdf
人工智能
产品经理
大模型学习
大模型教程
大模型入门
如何评价deepseek上线的deepseek-V3模型?怎么使用?
DeepSeek-V3模型是深度求索公司最新推出的自研MoE(混合专家)模型,具有6710亿参数,激活参数为370亿,经过14.8万亿token的
预
训练。
百态老人
·
2025-01-30 01:36
学习
DeepSeek V3 模型微调(SFT)技术详解
DeepSeekV3模型微调(SFT)技术详解目录引言背景知识2.1深度学习与
预
训练模型2.2微调(Fine-tuning)的概念2.3监督微调(SupervisedFine-tuning,SFT)DeepSeekV3
zhangjiaofa
·
2025-01-30 00:28
大模型
DeepSeek
模型微调
Mooncake:面向大语言模型服务的以 KVCache 为中心的架构
它采用以KVCache为中心的分解架构,将
预
填充和解码集群分离。它还利用GPU集群未充分利用的CPU、DRAM和SSD资源来实现KVCache的分解缓存。
步子哥
·
2025-01-29 22:42
AGI通用人工智能
语言模型
架构
人工智能
如何从零开始训练大模型(
预
训练方向)
但还有一个很直观的情况,随着
预
训练样本的质量不断提升,训练手段的优化。新的模型,往往效果能轻松反超参数量两倍于它的模型。例如,最新出的minicpm,微信内部评测效果也是非常棒的。
AI小白熊
·
2025-01-29 16:43
prompt
人工智能
ai
大模型
程序员
转行
学习
前端性能优化:HMR热更新和
预
获取加载
本文将深入探讨
预
获取(Prefetch)、动态导入(DynamicImport)和热模块替换(HMR)这三个关键技术1.
预
获取(Prefetch):加速后续页面加载1.1什么是
预
获取?
疯狂小料
·
2025-01-29 12:07
前端
面试
R 调用 python
R的强项在于统计方面,尤其是专业的统
计分
析,统计检验以及作图功能十分强大,但是在通用性方面,就远不如Python了,比如python可以做web,可以开发GUI,可以爬虫,甚至可以开发游戏,这些R其实也不是完全不行
weixin_33971205
·
2025-01-28 23:12
python
json
java
LLM架构与优化:从理论到实践的关键技术
重点分析了
预
训练、后训练、监督微调(SFT)和偏好对齐(PreferenceAlignment)在提升模型性能中的作用,并对比了直接偏好优化(DPO)
XianxinMao
·
2025-01-28 20:14
人工智能
第76期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成
预
训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。
云起无垠
·
2025-01-28 15:05
GPTSecurity
人工智能
网络安全
第84期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成
预
训练Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。
云起无垠
·
2025-01-28 14:30
GPTSecurity
人工智能
gpt
AIGC
Silero VAD 开源项目教程
SileroVAD开源项目教程项目地址:https://gitcode.com/gh_mirrors/si/silero-vad项目介绍SileroVAD是一个
预
训练的企业级语音活动检测器(VoiceActivityDetector
苏鹃咪Healthy
·
2025-01-28 14:55
一篇带你搞懂 为什么Vue3比Vue2效率更高!
目录一、静态提升二、
预
字符串化三、缓存事件处理函数四、BlockTree五、PatchFlag一、静态提升Vue3中的静态提升(StaticTreeHoisting)是一种编译阶段的优化技术,它能够提高组件的渲染性能
一朵好运莲
·
2025-01-28 08:49
前端
javascript
vue.js
html5
css
前端框架
高效向量搜索RAG解决方案(Canopy)
一、基本原理1.向量嵌入:Canopy首先会将文本数据转换为向量表示,通常使用
预
训练的语言模型等技术,将文本映射到
deepdata_cn
·
2025-01-28 08:18
RAG
RAG
预
训练语言模型
一.
预
训练模型的基本介绍
预
训练模型是一种在大规模数据上训练而得的模型,通常通过无监督学习或自监督学习的方式进行。在
预
训练阶段,模型被训练来学习数据的内在表示,而无需标注数据或任务特定的目标函数。
Algorithm_Engineer_
·
2025-01-28 04:51
基础知识和深度学习
语言模型
人工智能
自然语言处理
一套专业的医院实验室信息管理系统源码,.Net检验系统LIS源码,
一套专业的医院实验室信息管理系统,包含检验标本采集系统、条码管理系统、常规报告、微生物报告、镜检报告、质控管理系统、消息与通知管理系统、危急值管理、检验周期TAT监控管理、查询统
计分
析管理、主任办公管理
源码 世界
·
2025-01-27 22:37
人工智能
源码
LIS
检验系统
实验室
程序代码
R语言和Python的协同工作
R语言和Python的协同工作在数据科学和统
计分
析领域,R语言和Python是两个非常流行的编程语言。
数据科学引擎
·
2025-01-27 18:40
R语言
【赵渝强老师】MongoDB写入数据的过程
在MongoDB数据更新时,WiredTiger存储引擎使用
预
写日志的机制先将数据更新写入到Journal日志文件中。然后在创建检查点操作开始时,再将日志文件中记录的操作刷新到数据文件。
·
2025-01-27 18:09
数据库nosqlmongodb
R语言学习笔记6-数据框
dplyr进行数据框的管道操作数据框的时间序列操作大数据框的处理数据框的绘图数据框的文本处理数据框的连接与关联按行或列连接数据框按键值关联数据框数据框的条件处理与逻辑操作条件筛选逻辑操作数据框的汇总与统
计分
析
Colin♛
·
2025-01-27 15:17
r语言
学习
笔记
开发语言
信息可视化
.NET 8 WebAssembly 加载体验优化
今天我们来探讨如何在.NET8RC2中实现一个无
预
渲染的WebAssembly页面,并且在页面加载时显示一个加载动画。
t0_54coder
·
2025-01-27 12:24
编程问题解决手册
.net
wasm
个人开发
利用MMDetection进行模型微调和权重初始化
目录模型微调修改第一处:更少的训练回合Epoch修改第二处:更小的学习率LearningRate修改第三处:使用
预
训练模型权重初始化实际使用案例init_cfg的具体使用规则初始化器配置汇总本文基于MMDetection
MickeyCV
·
2025-01-27 07:27
目标检测
深度学习
目标检测
计算机视觉
python
python在统计专业的应用_Python在计量经济与统计学中的应用
这套笔记将重点介绍Python在计量经济学与统
计分
析中的应用。
weixin_39851457
·
2025-01-27 06:49
python在统计专业的应用
顶刊论文:一种用于病理学的多模态全切片基础模型 TITAN
MultimodalWholeSlideFoundationModelforPathology”提出了一种用于病理学的多模态全切片基础模型TITAN,通过在大量组织切片图像(WSIs)上的自监督学习和视觉语言对齐
预
训练
思陌Ai算法定制
·
2025-01-27 04:06
人工智能
机器学习
ai
深度学习
对话小羊驼vicuna
文章目录1.gpu租用2.公网网盘存储实例/数据3.登录实例4.
预
训练模型下载5.llama、alpaca、vicuna的前世今生6.对话Vicuna(1)llama-2-7b-hf(2)vicuna-
Always_Shine
·
2025-01-27 01:44
大模型
人工智能
深度学习
大模型
自然语言处理
Firefly-LLaMA2-Chinese - 开源中文LLaMA2大模型
文章目录关于模型列表&数据列表训练细节增量
预
训练&指令微调数据格式&数据处理逻辑增量
预
训练指令微调模型推理权重合并模型推理部署关于github:https://github.com/yangjianxin1
伊织产研
·
2025-01-27 00:07
Firefly-LLaMA2
LLaMA-2
跨域请求的终极武器:Spring MVC一招搞定OPTIONS
预
检
若我告诉你,SpringMVC通过一个简单配置,便可轻松解决烦人的OPTIONS
预
检请求,你能相信吗?没错,就是这么简单!
星际编程喵
·
2025-01-26 23:26
探索Spring的奇妙世界
spring
mvc
java
后端
spring
boot
spring
cloud
Python计算离差与标准
计分
离差和标准
计分
是统计学和数据分析中的重要概念,广泛应用于各类数据集的处理和分析过程中。掌握离差和标准
计分
有助于理解数据的分布情况,评估数据在群体中的相对位置,尤其在处理大规模数据或数据分析时非常重要。
Mr数据杨
·
2025-01-26 21:12
Python
数据分析师
python
数据分析
开发语言
【TCN回归预测】蜣螂算法优化时间卷积神经网络DBO-TCN负荷数据回归预测【含Matlab源码 6222期】
更多Matlab智能算法神经网络预测与分类仿真内容点击①Matlab神经网络预测与分类(进阶版)②付费专栏Matlab智能算法神经网络
预
Matlab领域
·
2025-01-26 18:23
matlab
飞速搭震撼上线 开启软件开发智能化新篇章
用户只需将需求文档或需求描述输入给
预
训练的大模型,这一步骤极大地简化了传统软件开发中繁琐的需求分析和文档编写过程,使用户能够更专注于核心需求的表达。大模型
·
2025-01-26 16:32
低代码
学习R语言:数学运算与模拟
本文内容来自《R语言编程艺术》(TheArtofRProgramming),有部分修改R内置很多数学函数和统
计分
布函数。
Mrrunsen
·
2025-01-26 14:50
R语言大学作业
r语言
开发语言
C++ 包装器与绑定器的应用之如何取代虚函数
CPU每跳转一次,
预
取指令要作废很多,所以效率会很低.为了管理的方便(基类指针可指向派生类对象和自动析构派生类),保留类之间的继承关系。
__雨夜星辰__
·
2025-01-26 11:59
C++
学习之路
c++
开发语言
学习
笔记
KNOWLEDGE UNLEARNING FOR MITIGATING PRIVACY RISKS IN LANGUAGE MODELS
2.1语言模型的隐私方法2.2机器去学习2.3语言模型中的记忆3语言模型中的知识去学习3.1方法论3.2量化语言模型的隐私风险4实验4.1模型、数据集和配置4.2主要实验4.3知识去学习的分析5结论摘要
预
训练语言模型
绒绒毛毛雨
·
2025-01-26 02:10
语言模型
人工智能
自然语言处理
探秘FreeMovie:一个开源的电影推荐系统
技术分析FreeMovie的核心架构包括以下关键组件:数据处理-项目采用Hadoop进行大数据
预
处
孟振优Harvester
·
2025-01-26 02:39
我在高职教STM32——LCD液晶显示(3)
在这里,我准备陆续把自己花了很多心思的教学设
计分
享出来,主要面向广大师生朋友,单片机老鸟就略过吧。欢迎点赞+关注,各位的支持是本人持续输出的动力,多谢多谢!前边我们讲解了LED、按键和蜂鸣器的
南耿先生
·
2025-01-26 00:29
我在高职教STM32
stm32
嵌入式硬件
单片机
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他