E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
2020牛客多校训练
一次性了解OpenAI的“草莓”(Strawberry)超强实力
“草莓”项目是OpenAI在AI推理领域的一项重要突破具备高级推理能力、长任务规划、超大规模
训练
等核心功能与技术特点。该项目的推出将进
金融街小单纯
·
2025-03-05 22:51
预测模型
生成式人工智能
人工智能
代码随想录算法
训练
营 | 图论 | DFS
98.所有可达路径//DFS#includeusingnamespacestd;vector>result;vectorpath;voiddfs(constvector>&graph,inti,inttarget){if(i==target){result.push_back(path);return;}for(intnums:graph[i]){path.push_back(nums);dfs(
jcc_newszu
·
2025-03-05 21:16
代码随想录学习记录
深度优先
算法
图论
kNN算法:对红酒数据进行分类
train_feature,train_label,test_feature):'''使用KNeighborsClassifier对test_feature进行分类:paramtrain_feature:
训练
集数据
阿拉保
·
2025-03-05 20:07
算法
分类
数据挖掘
对“预
训练
”的理解
预
训练
有什么用传统的机器学习是偏数学的,对数据的量不做过多要求,而深度学习的项目通常是有大量的数据可供使用。
衣衣困
·
2025-03-05 18:59
深度学习
神经网络
自然语言处理
C++使用Onnxruntime/TensorRT模型推理
步骤流程模型
训练
,python下生成pytorch的模型.pth,并基于.pth模型进行推理python下依据模型推理实现从.pth转向.onnxpython下基于.onnx进行推理,与后续两种推理方式种的推理结果进行比较环境
奇华智能
·
2025-03-05 16:30
AI
c++
开发语言
人工智能
AI
计算机视觉
基于K8S设计实现机器学习管理调度平台
设计和实现一套基于Kubernetes(K8s)的机器学习管理调度平台,目标是利用K8s的容器化和调度能力,提供高效的资源管理、任务调度、可扩展性及灵活性,适应机器学习(ML)
训练
、推理等不同场景的需求
richenlin
·
2025-03-05 15:56
机器学习
《YOLOv12魔术师专栏》专栏介绍 & 专栏目录
25.03.05):【原创自研模块】【多组合点优化】【注意力机制】【主干篇】【neck优化】【卷积魔改】【block&多尺度融合结合】【损失&IOU优化】【上下采样优化】【小目标性能提升】【前沿论文分享】【
训练
实战篇
AI小怪兽
·
2025-03-05 15:24
YOLOv8
11
v12成长师
YOLO
深度学习
人工智能
目标检测
计算机视觉
XGBoost系列文章(四):参数调优与模型
训练
XGBoost系列文章(四):参数调优与模型
训练
本文是XGBoost系列的第四篇,聚焦参数调优与模型
训练
实战,从参数分类到调优技巧,结合代码示例解析核心方法。
什么都想学的阿超
·
2025-03-05 14:13
原理概念
#
机器学习
机器学习
xgboost
【图像去噪】论文复现:真实噪声转高斯噪声,提升高斯噪声
训练
的模型性能!Learning to Translate Noise的Pytorch源码复现,跑通流程,框架结构和损失函数详解!
图像去噪(ImageDenoising)】关于【图像去噪】专栏的相关说明,包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总(更新中)完整代码和
训练
好的模型权重文件下载链接见本文底部
十小大
·
2025-03-05 13:01
pytorch
人工智能
python
图像去噪
图像处理
深度学习
计算机视觉
大模型
训练
内存预估计算方法
方法论大模型在
训练
过程中,需要预估需要多少显存进行参数的存储,需要进行预估.来方便GPU的购买.举例以DeepSeek-V3模型为例,总共有671B个参数.B=Billion(十亿),因此,671B模型指拥有
junjunzai123
·
2025-03-05 13:29
人工智能
深度学习
机器学习
零基础也能看懂的ChatGPT等大模型入门解析!大模型入门到精通,看这篇就够了!
GPT对应的是三个关键概念:生成式(Generative)、预
训练
(Pre-Training)和Transfo
大模型微调实战
·
2025-03-05 12:27
chatgpt
百度
人工智能
大数据
wps
学习
大模型
曝罗永浩挖走小米前50号员工要做AIOS;谷歌呼吁美国政府不要拆分公司;Copilot+PC能本地运行DeepSeek|极客头条
AAAI2025杰出论文奖出炉,南大周志华团队获奖字节跳动以约3150亿美元估值启动新一轮股票回购计划消息称vivoOS部门新成立AI领域,大模型
训练
重心向端侧转移为“AIOS”招兵买马:消息称罗永浩挖来小
极客日报
·
2025-03-05 12:55
资讯
DeepSeek 各版本的区别
训练
数据:14.8万亿Token预
训练
,推理速度较快(每秒
dushky
·
2025-03-05 12:25
ai
语言模型
AI编程
智能模型轻量化:知识蒸馏技术如何重塑AI部署格局
一、技术本质的解构与重构知识蒸馏颠覆了传统模型
训练
的范式,构建了"师生传承"的新型学习
·
2025-03-05 11:10
人工智能
探秘Mixup:数据增强的新利器
这个项目的目标是通过混合不同样本的数据点生成新的
训练
样本,从而帮助模型更好地学习数
荣正青
·
2025-03-05 10:42
大模型研究:DeepSeek版本比较说明
它基于海量代码数据进行
训练
,对各类编程语言的语法、语义有深入理解。能快速准确地完成代码补全、代码生成、代码解释、代码纠错等任务,在编程场景中为开发者提供高效的辅助。
程序猿学长
·
2025-03-05 09:33
语言模型
深度学习代码分析——自用
tab=readme-ov-file借助了一些人工智能1_train_stage1.py代码功能总览该代码是弱监督语义分割(WSSS)流程的Stage1
训练
与测试脚本,核心任务是通过多标签分类模型生成图像级标签
肆——
·
2025-03-05 08:28
深度学习
人工智能
笔记
PyTorch 中结合迁移学习和强化学习的完整实现方案
迁移学习可以利用预
训练
模型的知识加速
训练
,而强化学习则通过与环境的交互优化策略。以下是如何在PyTorch中结合迁移学习和强化学习的完整实现方案。
小赖同学啊
·
2025-03-05 07:54
人工智能
pytorch
迁移学习
人工智能
pytorch 模型测试
在使用PyTorch进行模型测试时,一般包含加载测试数据、加载
训练
好的模型、进行推理以及评估模型性能等步骤。以下为你详细介绍每个步骤及对应的代码示例。
小赖同学啊
·
2025-03-05 07:24
人工智能
pytorch
人工智能
python
大模型在高血压预测及围手术期管理中的应用研究报告
目录一、引言1.1研究背景与意义1.2研究目的1.3国内外研究现状二、大模型预测高血压的原理与方法2.1常用大模型介绍2.2数据收集与预处理2.3模型
训练
与验证三、术前风险预测与手术方案制定3.1术前风险因素分析
LCG元
·
2025-03-05 07:21
围术期危险因子
预测模型研究
人工智能
算法
机器学习
Pytorch实现之基于相对平均生成对抗网络的人脸图像超分辨率
简介简介:改进SRGAN,并使用相对平均生成对抗网络的人脸图像超分辨率
训练
自己的数据集论文题目:FaceImageSuper-resolutionBasedOnRelativeAverageGenerativeAdversarialNetworks
这张生成的图像能检测吗
·
2025-03-05 07:49
优质GAN模型训练自己的数据集
生成对抗网络
人工智能
神经网络
计算机视觉
深度学习
python
pytorch
【论文笔记】3DGS压缩相关工作2篇
这一解决方案为新视图合成(NVS)带来了前所未有的视觉质量,但代价是
训练
多层感知机的优化过程极为耗时,且渲染速度很慢。
AndrewHZ
·
2025-03-05 06:11
深度学习新浪潮
论文阅读
3DGS
计算机图形学
算法
三维高斯飞溅
压缩方法
【大模型开源实战】10 分钟,教你如何用 LLama-Factory
训练
和微调大模型
在这个AI快速发展的时代,我们很高兴为大家带来LlamaFactory-一个为AI开发者和爱好者量身打造的实用工具平台。作为非计算机专业出身的开发者,我们深深受益于计算机世界的开放共享精神。今天,我们希望通过LlamaFactory为这个社区贡献我们的一份力量。LlamaFactory能为您提供什么?英文文档的AI翻译:利用大语言模型将英文文档翻译成中文,助您更便捷地获取最新技术信息。快速获取主流
Langchain
·
2025-03-05 06:40
llama
人工智能
自然语言处理
大模型
LLaMA
Factory
LLM
大语言模型
Scaling Laws(缩放法则)详解
ScalingLaws(缩放法则)详解1.定义与核心概念ScalingLaws(缩放法则)描述的是模型性能(如准确率、任务表现)与计算资源(模型参数量、
训练
数据量、
训练
时间)之间的数学关系。
天一生水water
·
2025-03-05 05:00
人工智能
人工智能
tensorflow Serving架构详解和代码示例
tensorflowServing的原理和代码实现,并提供简要的代码阅读指导.如何serve一个模型具体的步骤可以参考官方文档.主要包括两个部分:1.导出模型1.启动服务需要说明的是导出模型部分.如果要把我们
训练
的模型拿来提供服务
lloyd_chou
·
2025-03-05 03:44
算法
ml
机器翻译
智慧城市
边缘计算
人工智能
DeepSeek 提示词技巧深度解析:从原理到实践
统计数据显示,经过专业提示词
训练
的用户,其获取有效答案的成功率可提升300%以上。要实现这种质的飞跃,需要掌握以下核心认知:1.信息解码机制:AI通过token化处理理解文本,
悠悠空谷1615
·
2025-03-05 02:00
经验分享
深度学习
语言模型
什么是预
训练
?
一、介绍预
训练
模型诞生背景:对于某种特殊任务只存在少量的相关
训练
数据,以至于模型不能从中学习到有用的规律(标注资源稀缺,无大数据支持)举例:想对一批法律领域的文件进行关系抽取,就需要投入大量的精力(意味着时间和金钱的大量投入
卡卡大怪兽
·
2025-03-04 23:44
自然语言处理
MLM: 掩码语言模型的预
训练
任务
MLM:掩码语言模型的预
训练
任务掩码语言模型(MaskedLanguageModel,MLM)是一种用于
训练
语言模型的预
训练
任务,其核心目标是帮助模型理解和预测语言中的上下文关系。
XianxinMao
·
2025-03-04 23:41
语言模型
人工智能
自然语言处理
预
训练
模型微调与下游任务迁移学习技术
1.背景介绍机器学习技术近年来在计算机视觉、自然语言处理等领域取得了飞速发展,这离不开大规模预
训练
模型的贡献。
AGI大模型与大数据研究院
·
2025-03-04 22:37
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
什么是预
训练
语言模型下游任务?
问题:Word2Vec模型是预
训练
模型吗?由于
训练
的特性,word2Vec模型一定是与
训练
模型。给定一个词先使用独热编码然后使用预
训练
好的Q矩阵得到这个词的词向量。
衣衣困
·
2025-03-04 22:36
语言模型
人工智能
自然语言处理
代码随想录算法
训练
营第五十六天| 图论02
99.岛屿数量注意深搜的两种写法,熟练掌握这两种写法以及知道区别在哪里,才算掌握的深搜。注意广搜的两种写法,第一种写法为什么会超时,如果自己做的录友,题目通过了,也要仔细看第一种写法的超时版本,弄清楚为什么会超时,因为你第一次幸运没那么想,第二次可就不一定了。代码随想录深度搜索,定义上下左右四个方向,找到一个第一个邻接矩阵就递归该点的上下左右,避免重复计算。版本一:direction=[[0,1]
Rachela_z
·
2025-03-04 21:00
算法
图论
微调(Fine-tuning)
微调(Fine-tuning)是自然语言处理(NLP)和深度学习中的一种常见技术,用于将预
训练
模型(Pre-trainedModel)适配到特定任务上。
路野yue
·
2025-03-04 20:49
人工智能
深度学习
《DataWorks:为人工智能算法筑牢高质量数据根基》
而在这一系列AI应用的背后,高质量的
训练
数据是其能够发挥强大效能的关键所在。就如同巧妇难为无米之炊,没有优质的数据,再先进的AI算法也难以施展拳脚。
·
2025-03-04 19:16
人工智能深度学习
我的2024年总结
【坚持健身,不用私教自己
训练
】这个也做到了,虽然做不到一周三四练,但基本上还是保证一周可以两练,同时尝试自己去健身房进行健身,感觉效果也不错。后面
XiyouLinux_Kangyijie
·
2025-03-04 18:36
小小总结
个人开发
大模型学习笔记-基于《Deep Dive into LLMs like ChatGPT》
构建数据集对于大语言模型(LLM)的
训练
而言,首先需要构建
XiyouLinux_Kangyijie
·
2025-03-04 18:33
学习
笔记
chatgpt
软件设计和软件架构之间的区别
并且深耕深度学习和数据集
训练
,提供商业化的视觉人工智能检测和预警系统(煤矿,工厂,制造业,消防等领域的工业化产品),合
前网易架构师-高司机
·
2025-03-04 17:56
软件架构
软件设计
系统架构
代码随想录算法
训练
营第十天|1. 两数之和,第454题.四数相加II
文档讲解:代码随想录难度:一般嗷~~1.两数之和力扣题目链接(opensnewwindow)给定一个整数数组nums和一个目标值target,请你在该数组中找出和为目标值的那两个整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素不能使用两遍。示例:给定nums=[2,7,11,15],target=9因为nums[0]+nums[1]=2+7=9所以返回[0,1
火车叨位去1949
·
2025-03-04 17:54
算法
哈希算法
数据结构
java
散列表
BERT 和 Milvus 构建智能问答系统的全面技术解析,涵盖从原理到实践的完整流程
下面Python代码示例和优化策略:一、技术栈协作原理BERT的语义编码能力BERT作为预
训练
语言模型,通过双向Transformer结构将文本转换为高维向量(如768维),捕捉上下文语义信息。
·
2025-03-04 14:28
python流水线自动化项目教程
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言1.项目环境准备Python安装选择Python开发环境安装必要库2.数据获取与理解4.模型
训练
流水线6.模型保存7.模型部署
小白教程
·
2025-03-04 12:46
python
python
自动化
开发语言
python自动化
python学习教程
python基础教程
SFT与RLHF的关系
在大模型
训练
中,SFT(监督微调)和RLHF(基于人类反馈的强化学习)是相互关联但目标不同的两个阶段,通常需要结合使用以优化模型性能,而非互相替代。
一只积极向上的小咸鱼
·
2025-03-04 11:12
人工智能
AI大模型与区块链技术的结合
模型可信度:区块链记录模型的
训练
和使用过程,确保模型的透明性和
小赖同学啊
·
2025-03-04 10:31
人工智能
人工智能
区块链
深度学习
蚂蚁技术研究院发布推理大模型强化学习框架,邀请开发者共同助力 AGI 生态
AReaL源自开源项目ReaLHF,旨在
训练
每个人都可以复现和贡献的大型推理模型(LRM)。AReaL是蚂蚁技术研究院为开发一个完全开放和包容的AGI世界迈出的一步。
·
2025-03-04 10:52
开源开源项目介绍
大模型开发和微调工具Llama-Factory-->WebUI
#避免从HuggingFace下载模型导致网速不畅USE_MODELSCOPE_HUB=1llamafactory-cliwebui1.
训练
在模型开始
训练
之
m0_74823705
·
2025-03-04 05:56
llama
神经网络之CNN文本识别
但是在文本分类问题上,相比于RNN,CNN的构建和
训练
更为简单和快速,并且效果也不差,所以仍然会有一些研究。那么,CNN到底是怎么应用到NLP上的
邪恶的贝利亚
·
2025-03-04 05:56
神经网络
cnn
人工智能
【Address Overfitting】解决过拟合的三种方法
:2.特征选择方法介绍:实践示例:适用场景:优缺点:3.正则化(Regularization)正则化类型:实践示例:适用场景:优缺点:总结与对比总结在机器学习中,过拟合(Overfitting)是模型
训练
过程中常见的问题
HP-Succinum
·
2025-03-04 05:24
机器学习
机器学习
数据分析
Word2Vec的使用,一些思考,含示例——包括使用预
训练
Word2Vec模型和自
训练
Word2Vec模型
你可以直接通过它
训练
生成词向量,也就是一个新的Word2Vec,也可以使用预
训练
好的词向量,也就是那里直接用。
热爱生活的猴子
·
2025-03-04 03:13
NLP_自然语言处理
word2vec
人工智能
自然语言处理
AI大模型教程入门到精通,非常详细收藏我这一篇就够了!AI大模型零基础入门教程(适合小白)
AI大模型是指使用大规模数据和强大的计算能力
训练
出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力,可以应用于各种领域,如自然语言处理、图像识别、语音识别等。为什么要学AI大模型?
AGI大模型学习
·
2025-03-04 01:21
人工智能
大模型应用
大模型
AI产品经理
学习
AI大模型
大模型教程
大模型算法工程师的技术图谱和学习路径
负责整个模型开发生命周期,包括数据清洗、特征工程、模型选择、
训练
和部署。与数据科学家、工程团队和产品团队合作,理解业务需求并将算法转化为实际产品。对模型性能进行评估和优化,确保模型的准确性、效率和可扩
执于代码
·
2025-03-03 23:39
开发者职业加速服务
算法
学习
AI提示词终极奥秘:三招破解Zero-Shot/Few-Shot/COT魔法
二、三分钟掌握三大核心技术1.Zero-Shot:空手道大师的思维(无需任何示例)核心原理:利用模型预
训练
知识直接推
曦紫沐
·
2025-03-03 22:05
提示词
人工智能
提示词
DeepSeek-R1:通过强化学习激励大型语言模型的推理能力
DeepSeek-R1-Zero是一个通过大规模强化学习(RL)
训练
而成的模型,无需监督微调(SFT)作为初步步骤,展示了卓越的推理能力。
AI专题精讲
·
2025-03-03 22:05
大模型专题系列
语言模型
人工智能
自然语言处理
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他