E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Caffe训练
DeepSeek V3 模型微调(SFT)技术详解
DeepSeekV3模型微调(SFT)技术详解目录引言背景知识2.1深度学习与预
训练
模型2.2微调(Fine-tuning)的概念2.3监督微调(SupervisedFine-tuning,SFT)DeepSeekV3
zhangjiaofa
·
2025-01-30 00:28
大模型
DeepSeek
模型微调
【DeepSeek】大模型强化学习
训练
GRPO算法,你学会了吗?
如果你还不知道GRPO,你可以先看这篇帖子:【DeepSeek】一文详解GRPO算法——为什么能减少大模型
训练
资源?看了论文跟没看一样?做两道题练练!曾经最痛恨的应试教育,却能让你深深记住这知识点。
FF-Studio
·
2025-01-29 21:56
DeepSeek
R1
算法
缓存失效算法
常见的缓存失效算法有FIFO、LRU、LFU,以及
Caffe
ine中的WindowTinyLFU算法。FIFOFIFO算法是一种比较容易实现也最容易理解的算法。
孜泽
·
2025-01-29 20:55
本地缓存
java
后端
本地缓存
缓存失效算法
智联未来——打造基于机器学习的MySQL智能运维助手,开启协作新时代
今天,我们将深入了解如何
训练
这样一个基于机器学习的MySQL智能运维助手
墨夶
·
2025-01-29 19:45
数据库学习资料2
机器学习
mysql
运维
大模型部署工具 llama.cpp 介绍与安装使用
1.大模型部署工具llama.cpp大模型的研究分为
训练
和推理两个部分。
训练
的过程,实际上就是在寻找模型参数,使得模型的损失函数最小化,推理结果最优化的过程。
大模型柳儿
·
2025-01-29 18:03
llama
服务器
人工智能
web安全
linux
安全
自建stgcn数据集并
训练
1.安装st-gcn复现STGCNCPU版(ubuntu16.04+pytorch0.4.0+openpose+
caffe
)_Significance的博客-CSDN博客复现旧版STGCNGPU版(win10
青年夏日科技工作者
·
2025-01-29 18:31
AI编程
kinetics-skeleton格式行为数据提取方法
用自建kinetics-skeleton行为识别数据集
训练
st-gcn网络流程记录,利用Lightweight-OpenPose生成kinetics-skeleton格式数据0.准备工作1.下载/裁剪视频
青年夏日科技工作者
·
2025-01-29 18:31
python
人工智能
深度学习
火出圈的DeepSeeK R1详解
强化学习驱动的
训练
:采用大规模强化学习技术,仅需极少量标注数据,显著提升推理能力。长链推理(CoT)支持:思维链长度可达数万字,能逐步分解复杂问题,通过多步骤逻辑推理解决问题。
清风AI
·
2025-01-29 17:58
深度学习
人工智能
神经网络
python
计算机视觉
conda
Transformer--概念、作用、原理、优缺点以及简单的示例代码
与传统的循环神经网络(RNN)和长短时记忆网络(LSTM)不同,Transformer完全摆脱了序列结构的依赖,可以并行处理数据,显著提高了
训练
效率和效果
Ambition_LAO
·
2025-01-29 17:23
transformer
深度学习
DeepSeek:通用人工智能的技术前沿与创新突破
其研发方向覆盖自然语言处理、多模态交互、强化学习等领域,并在模型架构、
训练
效率及实际应用场景中取得显著成果。二、核心
热爱分享的博士僧
·
2025-01-29 17:52
人工智能
如何从零开始
训练
大模型(预
训练
方向)
但还有一个很直观的情况,随着预
训练
样本的质量不断提升,
训练
手段的优化。新的模型,往往效果能轻松反超参数量两倍于它的模型。例如,最新出的minicpm,微信内部评测效果也是非常棒的。
AI小白熊
·
2025-01-29 16:43
prompt
人工智能
ai
大模型
程序员
转行
学习
如何用Python
训练
一个AI模型(超详细教程)非常详细收藏我这一篇就够了!
AI模型是通过
训练
得到的一种程序,能够利用海
程序员二飞
·
2025-01-29 15:42
人工智能
架构
算法
制造
自然语言处理
万字精研:大型语言模型微调Fine-Tuning技术——14种主流方法的原理、适用场景及实践指南
万字精研:大型语言模型微调Fine-Tuning技术——14种主流方法的原理、适用场景及实践指南LLM
训练
时间和的成本太过庞大,况且个人卷
训练
经验极为困难,不妨从微调开始搞起。
汀、人工智能
·
2025-01-29 15:40
LLM工业级落地实践
LLM技术汇总
语言模型
人工智能
自然语言处理
P-tuning
LoRA
prompt
tuning
adapter
详解三种常用标准化:Batch Norm、Layer Norm和RMSNorm
在深度学习中,标准化技术是提升模型
训练
速度、稳定性和性能的重要手段。
yyytucj
·
2025-01-29 13:57
batch
开发语言
MATLAB设计控制系统仿真实验,基于MATLAB的自动控制原理实验仿真系统的设计
传统性实验
训练
了学生对以传递函数为核心的控制系统与模拟电
stellagugu
·
2025-01-29 13:55
YOLOv8改进策略【Backbone/主干网络】| 替换骨干网络为2023-CVPR ConvNeXt V2 (附网络详解和完整配置步骤)
本文将ConvNeXtV2应用于YOLOv8,一方面利用全卷积掩码自动编码器在
训练
时优化特征学习,减少模型对大规模标注数据的依赖;另一方面,通过全局响应归一化层增强特征竞争,缓解特征坍塌问题,提高特征多样性
Limiiiing
·
2025-01-29 13:54
YOLOv8改进专栏
YOLO
深度学习
计算机视觉
目标检测
GEE
训练
教程——哨兵2号、Landsat-8以及DEM影像的可视化展示
目录简介1.哨兵2号(Sentinel-2)2.Landsat-83.CGIAR/SRTM90_V4函数visualize(bands,gain,bias,min,max,gamma,opacity,palette,forceRgbOutput)Arguments:Returns:Imageexpression(expression,map)Arguments:Returns:Imageee.Te
此星光明
·
2025-01-29 11:59
GEE教程训练
人工智能
gee
javascript
Landsat
sentinel
dem
可视化
利用 PyTorch 动态计算图和自动求导机制实现自适应神经网络
动态添加/移除层:可以在
训练
过程中根据需
drebander
·
2025-01-29 11:24
AI
编程
pytorch
神经网络
人工智能
Qwen-VL论文解读
从Qwen-LM开始,我们通过精心设计的(i)视觉受体,(ii)输入-输出接口,(iii)3阶段
训练
管道,以及(iv)多语言多模态清洗语料库,赋予其视觉能力。
dream_home8407
·
2025-01-29 09:10
人工智能
基于Blackwell架构的GPU,用七十二个GPU拼接成性能强大的计算集群,其性能比上一代提升三倍,GPU已成为AI时代的基础设施,可实现各种大模型的
训练
英伟达在2024年3月发布了基于Blackwell架构的GPU,这一新一代GPU在性能上相比上一代Hopper架构有显著提升。具体来说,Blackwell架构的GPU拥有2080亿个晶体管,采用台积电4纳米工艺制造,其AI性能达到了20petaflops,是前代H100GPU的五倍。Blackwell架构通过多芯片封装技术(MCM),将两个GPU集成在一起,从而解决了内存局部性和缓存问题,提高了计
百态老人
·
2025-01-29 08:03
架构
人工智能
Tensorflow入门——
训练
结果的保存与加载
2019独角兽企业重金招聘Python工程师标准>>>
训练
完成以后我们就可以直接使用
训练
好的模板进行预测了但是每次在预测之前都要进行
训练
,不是一个常规操作,毕竟有些复杂的模型需要
训练
好几天甚至更久所以将
训练
好的模型进行保存
weixin_34087301
·
2025-01-29 08:32
人工智能
python
数据库
使用PyTorch实现逻辑回归:从
训练
到模型保存与加载
PyTorch用于构建和
训练
模型,pandas和numpy用于数据处理,matplotlib用于结果的可视化。
Luzem0319
·
2025-01-29 08:26
pytorch
逻辑回归
人工智能
python3+TensorFlow 2.x(四)反向传播
目录反向传播算法反向传播算法基本步骤:反向中的参数变化总结反向传播算法反向传播算法(Backpropagation)是
训练
人工神经网络时使用的一个重要算法,它是通过计算梯度并优化神经网络的权重来最小化误差
刀客123
·
2025-01-29 07:53
python学习
tensorflow
人工智能
python
scikit-learn基本功能和示例代码
scikit-learn(简称sklearn)是一个广泛使用的Python机器学习库,提供了丰富的工具和算法,涵盖了数据预处理、模型
训练
、评估和优化等多个方面。
weixin_30777913
·
2025-01-29 02:02
深度学习
机器学习
python
scikit-learn
强化学习很多ac架构的算法比如ppo,为什么使用状态价值网络而不使用动作价值网络实现critic呢?|状态价值网络的优势与挑战|Actor-Critic|状态价值|强化学习
3.1
训练
稳定性3.2计算效率3.3高维动作空间的适应性4.使用状态价值网络的挑战4.1收敛速度4.2欠拟合风险5.解决方案与未来方向5.1改进的状态价值网络5.2结合动作价值和状态价值6.结论随着强化学习技术的不断发展
concisedistinct
·
2025-01-29 01:27
人工智能
算法
人工智能
架构
强化学习中,为什么用AC架构
缺点:相关算法:基于AC架构的算法总结强化学习中,为什么用AC架构在强化学习(ReinforcementLearning,RL)中,AC架构(即Actor-Critic架构)是一种非常常用的架构,用于
训练
智能体
资源存储库
·
2025-01-29 01:25
算法
强化学习
算法
AI会不会是一个大泡沫
推出后不久,R1就凭借其开源的性质、大幅下降的售价和
训练
成本获得了
人机与认知实验室
·
2025-01-28 23:38
人工智能
machine learning knn算法之使用KNN对鸢尾花数据集进行分类
通过导入必要的scikit-learn导入必要的库,加载给定的数据,划分测试集和
训练
集之后
训练
预测和评估即可具体代码如下:importnumpyasnpfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.preprocessingimportStandardS
知识鱼丸
·
2025-01-28 21:53
machine
learning
机器学习
算法
分类
LLM架构与优化:从理论到实践的关键技术
重点分析了预
训练
、后
训练
、监督微调(SFT)和偏好对齐(PreferenceAlignment)在提升模型性能中的作用,并对比了直接偏好优化(DPO)
XianxinMao
·
2025-01-28 20:14
人工智能
YOLOv10涨点改进:特征融合创新 | 多层次特征融合(SDI),小目标涨点明显,| UNet v2,比UNet显存占用更少、参数更少
YOLOv10魔术师专栏》将从以下各个方向进行创新:【原创自研模块】【多组合点优化】【注意力机制】【卷积魔改】【block&多尺度融合结合】【损失&IOU优化】【上下采样优化】【小目标性能提升】【前沿论文分享】【
训练
实战篇
AI小怪兽
·
2025-01-28 19:08
YOLOv10魔术师
YOLO
目标检测
算法
人工智能
目标跟踪
YOLO11涨点优化:特征融合创新 | 多层次特征融合(SDI),小目标涨点明显| UNet v2,比UNet显存占用更少、参数更少
YOLOv11魔术师专栏》将从以下各个方向进行创新:【原创自研模块】【多组合点优化】【注意力机制】【卷积魔改】【block&多尺度融合结合】【损失&IOU优化】【上下采样优化】【小目标性能提升】【前沿论文分享】【
训练
实战篇
AI小怪兽
·
2025-01-28 19:08
YOLO11魔术师
深度学习
目标检测
计算机视觉
目标跟踪
神经网络
python
MicroAI™将人工智能培训引入RENESAS MCU
与全球微控制器领导者Renesas合作将机器学习引入MCU,并借助MicroAI直接在嵌入式环境中
训练
机器学习模型的能力——这在业界尚属
sinat_41698914
·
2025-01-28 16:16
人工智能
mcu
big
data
DeepSeek R1:中国AI黑马的崛起与挑战
文章目录技术突破:从零开始的推理能力进化DeepSeekR1-Zero:纯RL
训练
的“自我觉醒”DeepSeekR1:冷启动与多阶段
训练
的平衡之道实验验证:推理能力的全方位跃升基准测试:超越顶尖闭源模型蒸馏技术
码事漫谈
·
2025-01-28 16:13
AI
人工智能
C++ 与机器学习:构建高效推理引擎的秘诀
虽然Python被广泛用于模型的
训练
和开发,但C++却在推理领域独占鳌头,其性能优势和硬件控制能力无可替代。
salsm
·
2025-01-28 15:07
C++
编程魔法师
c++
机器学习
开发语言
【Java程序员面试专栏 数据结构】五 高频面试算法题:二叉树
一轮的算法
训练
完成后,对相关的题目有了一个初步理解了,接下来进行专题
训练
,以下这些题目就是二叉树相关汇总的高频题目总的来说,前序遍历是自上而下调整或比较节点,中序遍历用来对节点排序,后序遍历是自下而上的寻找或求最值供上层决策
存在morning
·
2025-01-28 15:36
Java
程序员技术栈
#
二叉树
java
面试
算法
第76期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预
训练
Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。
云起无垠
·
2025-01-28 15:05
GPTSecurity
人工智能
网络安全
第84期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预
训练
Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。
云起无垠
·
2025-01-28 14:30
GPTSecurity
人工智能
gpt
AIGC
使用onnxruntime-web 运行yolov8-nano推理
端上运行推理模型,为了让这个推理更直观,我选择了试验下yolov8识别预览图片:1.跨平台兼容性ONNX是一种开放的格式,可以在不同的深度学习框架之间共享模型,如PyTorch、TensorFlow、MXNet和
Caffe
2
CHEN_RUI_2200
·
2025-01-28 14:27
机器学习
YOLO
使用Bert+BiLSTM+CRF
训练
NER任务
使用的数据集在这里E-CommercialNERDataset/电商NER数据集_数据集-阿里云天池针对面向电商的命名实体识别研究,我们通过爬取搜集了淘宝商品文本的标题,并标注了4大类,9小类的实体类别。具体类型及实体数量如下针对面向电商的命名实体识别研究,我们通过爬取搜集了淘宝商品文本的标题,并标注了4大类,9小类的实体类别。具体类型及实体数量如下:每个文件数据格式相同,都为根据BIschema
CHEN_RUI_2200
·
2025-01-28 14:57
机器学习
bert
人工智能
深度学习
Silero VAD 开源项目教程
SileroVAD开源项目教程项目地址:https://gitcode.com/gh_mirrors/si/silero-vad项目介绍SileroVAD是一个预
训练
的企业级语音活动检测器(VoiceActivityDetector
苏鹃咪Healthy
·
2025-01-28 14:55
人工智能学习框架:深入解析与实战指南
本指南将全面介绍人工智能主流学习框架的特点、安装方法、核心功能,以及通过实践案例展示如何使用这些框架进行AI模型开发、
训练
与优化。1.
一ge科研小菜鸡
·
2025-01-28 11:07
人工智能
人工智能
json格式的标记文件转yolo格式(txt)的标记文件
背景我在使用anylabeling标记软件时发现导出的标记文件格式只能是json格式,而我yolov8
训练
模型的标记文件需要时txt格式的,所以我需要写一个转换脚本脚本1.脚本1这个脚本是针对于矩形框标记的转换
帅气的亮
·
2025-01-28 10:33
json
YOLO
python
AI人工智能深度学习算法:搭建可拓展的深度学习模型架构
然而,随着模型规模的不断扩大,如何高效地搭建、
训练
和部署深度学习模型,成为一个亟待解决的问题。传统的单机
训练
方式在计算资源有限的情况
AI天才研究院
·
2025-01-28 10:30
大数据AI人工智能
AI大模型企业级应用开发实战
大厂Offer收割机
面试题
简历
程序员读书
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
Java
Python
架构设计
Agent
程序员实现财富自由
高效向量搜索RAG解决方案(Canopy)
一、基本原理1.向量嵌入:Canopy首先会将文本数据转换为向量表示,通常使用预
训练
的语言模型等技术,将文本映射到
deepdata_cn
·
2025-01-28 08:18
RAG
RAG
遥感深度学习过程中图像分割的尺寸对模型
训练
结果的影响
1.计算资源与显存占用大尺寸图像:需要更高的显存和计算资源,可能限制
训练
时的批大小(batchsize),甚至导致无法
训练
。
司南锤
·
2025-01-28 08:18
深度学习
遥感
深度学习
人工智能
使用小尺寸的图像进行逐像素语义分割
训练
,出现样本不均衡
训练
效果问题
在使用小尺寸图像进行逐像素语义分割
训练
时,确实可能出现样本不均衡问题,且这种问题可能比大尺寸图像更显著。1.小尺寸图像如何加剧样本不均衡?
司南锤
·
2025-01-28 08:18
深度学习
遥感
计算机视觉
人工智能
机器学习
06-机器学习-数据预处理
以下是数据清洗的详细流程、方法和实战示例:一、数据清洗的核心任务问题类型表现示例影响缺失值数值型字段为空(NaN)模型无法处理缺失值,导致
训练
中断或偏差异常值年龄=200岁,房价=-100万扭曲统计指标
不会打代码呜呜呜呜
·
2025-01-28 08:47
机器学习
机器学习
人工智能
高可用架构,高性能架构和高并发架构
视频号2023年度优秀创作者,互联网大厂P8技术专家,SpringCloudAlibaba微服务架构实战派(上下册)和RocketMQ消息中间件实战派(上下册)的作者,资深架构师,技术负责人,极客时间
训练
营讲师
架构随笔录
·
2025-01-28 06:35
超级架构师
架构
kafka
分布式
hbase
大数据
hdfs
预
训练
语言模型
一.预
训练
模型的基本介绍预
训练
模型是一种在大规模数据上
训练
而得的模型,通常通过无监督学习或自监督学习的方式进行。在预
训练
阶段,模型被
训练
来学习数据的内在表示,而无需标注数据或任务特定的目标函数。
Algorithm_Engineer_
·
2025-01-28 04:51
基础知识和深度学习
语言模型
人工智能
自然语言处理
IsaacLab从入门到精通(六)真机部署与Sim2real
在之前的教程中,我们已经完成了整个强化学习任务流程,现在我们需要将自己
训练
的策略迁移到真机上1.1Sim2real简要方法论强化学习的Sim2real问题一直以来是非常难解决的问题,在仿真环境中
训练
的policy
NathanWu7
·
2025-01-28 04:47
IsaacLab
人工智能
机器人
深度学习
机器学习
上一页
11
12
13
14
15
16
17
18
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他