E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
训练误差
大型推理模型 (LRM) 的比较 OpenAI DeepSeek R1 Gemini 2.0
分钟发布时间:2025-02-06近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】1.架构与
训练
技术
·
2025-02-06 17:20
人工智能
构建安全可靠的LLM应用架构
接下来,我们将详细解析数据处理模块、模型
训练
模块、应用部署模块和安全防护模块的设计与实现策略。本文将使用Mermaid流程图和Pyth
AI天才研究院
·
2025-02-06 16:15
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
从零开始构建一个大语言模型-第五章第五节
第五章目录5.1评估生成文本模型5.2
训练
一个LLM5.3控制随机性的解码策略5.4在PyTorch中加载和保存模型权重5.5从OpenAI加载预
训练
权重5.5从OpenAI加载预
训练
权重此前,我们使用一个由一本短篇小说集组成的有限数据集
训练
了一个小型
释迦呼呼
·
2025-02-06 15:41
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
机器学习
pytorch
弹性文件服务(SFS)的使用场景
华为云弹性文件服务(ScalableFileService,简称SFS)是一种高性能、高可用、弹性伸缩的文件存储服务,广泛应用于多种场景,包括高性能计算、媒体处理、企业办公、AI
训练
等。
九河云
·
2025-02-06 14:02
人工智能
华为云
服务器
Seed Edge- AGI(人工智能通用智能)长期研究计划
目标与定位核心目标是做比预
训练
和大模型迭代更长期、更基础的AGI前沿研究,为AI研究者提供更自由的探索空间和资源支持,探索AGI的新方法,推动通用智能的边界。支持措
自不量力的A同学
·
2025-02-06 13:29
人工智能
DeepSeek-R1真算得上开源吗?
OpenAIo1模型证明,当LLM在推理时,通过增加计算量进行类似
训练
后,它们在数学、编程和逻辑等推理任务上的表现显著提升。然而,OpenAI推理模型的
训练
方法一直是秘密。
·
2025-02-06 13:37
人工智能
基于YOLOv11的目标检测系统
在之前YOLO版本令人印象深刻的进步基础上,YOLO11在架构和
训练
方法上进行了重大改进,使其成为广泛的计算机视觉任务的多功能选择。
夜思、晨
·
2025-02-06 12:21
YOLO
目标检测
人工智能
使用Python和TensorFlow/Keras构建一个简单的CNN模型来识别手写数字
一个简单的图像识别项目代码示例,使用Python和TensorFlow/Keras库来
训练
一个基本的CNN模型,用于识别MNIST手写数字数据集,并将测试结果输出到HTML。
mosquito_lover1
·
2025-02-06 12:48
python
tensorflow
keras
【保姆级教程】YOLOv8_Seg实例分割:
训练
自己的数据集
一、YOLOV8环境准备1.1下载安装最新的YOLOv8代码仓库地址:https://github.com/ultralytics/ultralytics1.2配置环境pipinstall-rrequirements.txt-ihttps://pypi
BILLY BILLY
·
2025-02-06 12:47
YOLOv8系列
语义分割
YOLO
人工智能
Python模型上线pmml以及自定义函数转换(1)
1、常规转换-模型
训练
好之后立即转换importjoblibfromsklearn2pmmlimportPMMLPipeline,sklearn2pmml#保存模型python可读入defdump(clf
jin_tmac
·
2025-02-06 12:46
机器学习与数据挖掘
python
python
sklearn
yolov5 实例分割:从原理、构建数据集到
训练
部署
yolov5实例分割:从原理、构建数据集到
训练
部署1.模型介绍1.1YOLOv5结构1.2YOLOv5推理时间2.构建数据集2.1使用labelme标注数据集2.2生成coco格式label2.3coco
外卖猿
·
2025-02-06 12:15
AI实战
yolov5
实例分割
c++部署
opencv
自定义数据集
深度学习No module named ‘torchvision.transforms.functional_tensor‘问题解决
问题在进行深度学习
训练
过程中出现ModuleNotFoundError:Nomodulenamed'torchvision.transforms.functional_tensor'报错,多方查阅资料后得到了解决方案
winrisef
·
2025-02-06 11:44
YOLO
深度学习
人工智能
python
conda
【单层神经网络】基于MXNet的线性回归实现(底层实现)
写在前面刚开始先从普通的寻优算法开始,熟悉一下学习
训练
过程下面将使用梯度下降法寻优,但这大概只能是局部最优,它并不是一个十分优秀的寻优算法整体流程生成
训练
数据集(实际工程中,需要从实际对象身上采集数据)
辰尘_星启
·
2025-02-06 11:43
线性回归
mxnet
机器学习
人工智能
深度学习
神经网络
python
在 Python 中生成一个简单的类 GPT 软件?
本文将详细介绍实现这一目标的具体步骤,涵盖环境搭建、数据准备、模型选择、
训练
与推理等多个方面。二、环境搭建2.1安装Python首先要确保系统中安装了Python。建议使用Python3.7及以上版本
一只小灿灿
·
2025-02-06 10:37
Python
#
自然语言处理
python
gpt
开发语言
遗传算法与深度学习实战(33)——WGAN详解与实现
遗传算法与深度学习实战(33)——WGAN详解与实现0.前言1.
训练
生成对抗网络的挑战2.GAN优化问题2.1梯度消失2.2模式崩溃2.3无法收敛3WassersteinGAN3.1Wasserstein
盼小辉丶
·
2025-02-06 09:29
深度学习
人工智能
生成对抗网络
国家超算平台上线DeepSeek - R1系列模型:开启AI新征程
它用了强化学习
训练
,推理的时候会反复思考验证,思维链能有好几万字长。在数学、代码编写和复杂逻辑推理这些方面,表现相当厉害
CodeJourney.
·
2025-02-06 08:25
数据库
人工智能
算法
人工智能
大模型的底层逻辑及Transformer架构
一、大模型的底层逻辑1.数据驱动大模型依赖海量的数据进行
训练
,数据的质量和数量直接影响模型的性能。通过大量的数据,模型能够学习到丰富的模式和规律,从而更好地处理各种任务。
搏博
·
2025-02-06 02:04
transformer
架构
深度学习
机器学习
人工智能
【深度学习】权重衰减
我们总是可以通过去收集更多的
训练
数据来缓解过拟合。但这可能成本很高,耗时颇多,或者完全超出我们的控制,因而在短期内不可能做到。假设我们已经拥有尽可能多的高质量数据,我们便可以将重点放在正则化技术上。
熙曦Sakura
·
2025-02-06 02:33
深度学习
深度学习
人工智能
java调用ONNX模型
一、导出一个onnx模型这里
训练
了一个简单的线性回归模型通过SerializeToString完成导出。
jason.zeng@1502207
·
2025-02-06 01:30
java
开发语言
AIGC从入门到实战:基于大模型的人工智能应用的涌现和爆发
1.2大模型:AIGC的基石AIGC的核心驱动力在于大规模预
训练
模型(简称“大模型”)。这些模型拥
AI天才研究院
·
2025-02-06 01:00
计算
AI大模型企业级应用开发实战
ChatGPT
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
大规模语言模型从理论到实践 DeepSpeed实践
大规模语言模型从理论到实践DeepSpeed实践文章目录大规模语言模型从理论到实践DeepSpeed实践1.背景介绍1.1大规模语言模型的兴起1.2
训练
和部署LLM的挑战1.3DeepSpeed:赋能LLM
AI天才研究院
·
2025-02-06 01:59
大数据AI人工智能
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
【Mamba之模型
训练
系列(四)】将 mamba 扩展到多模态大型语言模型,实现高效推理
将mamba扩展到多模态大型语言模型,实现高效推理背景知识与研究动机Cobra模型设计视觉编码器DINOv2SigLIP投影器Mamba语言模型主干
训练
策略
训练
数据
训练
阶段预
训练
阶段多模态指令调整阶段微调策略
训练
细节
训练
策略的关键结论实验验证实验设置性能比较推理速度消融研究关键结论参考文献这篇文章介绍了一个名为
愷创作者
·
2025-02-06 00:45
Mamba及多模态模型训练系列
语言模型
人工智能
自然语言处理
一、TensorFlow的建模流程
划分数据集:
训练
集、验证集、测试集。转换为Dataset对象:利用tf.data优化数据流水线。
李建军
·
2025-02-05 23:10
TensorFlow
tensorflow
人工智能
python
【专题】DeepSeek技术颠覆or创新共赢,开启Al算法变革元年报告汇总PDF洞察(附原数据表)
海量数据不仅为模型
训练
提供了坚实基础,更驱动着AIAgent在各领域的创新应用。与此同时,国产大模型在近期密集涌现,数量已颇具规模且广泛渗透到多个垂直行业,展现出强
·
2025-02-05 22:18
数据挖掘深度学习机器学习算法
Python-机器学习(二)-K近邻算法的原理与鸢尾花数据集实现详解
fromsklearn.neighborsimportKNeighborsClassifierk=5#对模型
训练
clf=KNeighborsClassifier(n_neighbors=k)clf.fit
2401_84009679
·
2025-02-05 22:00
程序员
机器学习
python
近邻算法
什么是大模型框架?常用的大模型框架盘点对比
什么是大模型框架大模型框架是指用于
训练
、推理和部署大型语言模型(LLMs)的软件工具和库。
AI产品经理
·
2025-02-05 21:25
学习
人工智能
大数据
深度学习
语言模型
DeepSeek R1技术报告关键解析(5/10):知识蒸馏:如何让小模型也能具备强推理能力?
在DeepSeek-R1
训练
过程中,研究人员通过知识蒸馏,让较小的模型也能具备较强的
董董灿是个攻城狮
·
2025-02-05 19:43
人工智能
计算机视觉
CNN
学霸带你游戏化增强学习动力奖励与挑战助力成长
无论是语言、编程还是技能
训练
,游戏化都能提供全新的解决方案。游戏化吸引学习者注意力游戏的奖励机制、即时反馈和目标导向能迅速抓住学习者的注意力。
Snow Hide(雪诺海德)
·
2025-02-05 18:10
纽雪澳诺加海美德
学霸挺拔
学霸挺拔
游戏化学习
动力提升
学习效率
兴趣驱动
目标检测数据集-Pascal VOC 数据集介绍
在该挑战中,这是一个监督学习的问题,
训练
集以带标签的图片的形式给出。介绍PascalVOC数据集:C
AI研习图书馆
·
2025-02-05 17:01
深度学习数据集
目标检测
数据集
VOC2007
人工智能基础知识速成 - 机器学习、深度学习算法原理及其实际应用案例
机器学习的基本原理机器学习的基本原理是通过构建数学模型,使用大量的数据进行
训练
,使得模型能够智能地预测和决策。在机器学习中,常用的模型包括线性回归、逻辑回
苹果酱0567
·
2025-02-05 16:23
面试题汇总与解析
课程设计
spring
boot
vue.js
java
mysql
基于昇腾用PyTorch实现传统CTR模型WideDeep网络
基于昇腾用PyTorch实现传统CTR模型WideDeep网络本文主要介绍如何在昇腾上使用pytorch对推荐系统中经典的网络模型WideDeep网络进行
训练
的实战讲解,使用数据集是criteo,主要内容分为以下几个模块
·
2025-02-05 14:00
人工智能推荐算法
PyTorch中的 torch.nn.GRU
与传统的RNN相比,GRU引入了门控机制,旨在解决长序列
训练
中的梯度消失问题,并提高了
训练
效率和性能。在PyTorch中,torch.nn.GRU是一个非常方便的模块,用于构建和
训练
GRU网络。
彬彬侠
·
2025-02-05 12:53
自然语言处理
GRU
PyTorch
Python
NLP
自然语言处理
深度探索:机器学习中的粒子群优化算法(PBMT)原理及应用
目录一、引言与背景二、定理三、算法原理四、算法实现五、优缺点分析优点:缺点:六、案例应用七、对比与其他算法八、结论与展望一、引言与背景随着机器学习技术的迅速发展,优化算法在模型
训练
、特征选择、参数调优等多个环节扮演着至关重要的角色
生瓜蛋子
·
2025-02-05 12:22
机器学习
机器学习
算法
人工智能
基于深度学习的车牌检测识别系统 —— 使用YOLOv5实现车牌检测与识别
目录引言项目背景与目标1.1项目背景1.2项目目标系统设计与架构2.1系统功能概述2.2系统架构数据准备与处理3.1数据集选择与收集3.2数据标注3.3数据集划分YOLOv5模型
训练
与优化4.1YOLOv5
2025年数学建模美赛
·
2025-02-05 12:20
深度学习
YOLO
人工智能
分类
ui
DeepSeek-R1 低成本
训练
的根本原因是?
然而,高性能的背后往往是高昂的
训练
成本,动辄数百万美元的投入让许多企业和研究机构望而却步。近期,国产大模型DeepSeek-R1的横空出世,以其卓越的性能和极具竞争力的成本,打破了这一固有认知。
明哲AI
·
2025-02-05 11:10
AIGC
人工智能
大模型
deepseek
AI
Agent
关于大模型 AGI 应知应会_生在AI发展的时代
这些模型通过
训练
海量数据来学习复杂的模式和特
森焱森
·
2025-02-05 10:38
机器人
人工智能
算法
总结
科技
【知识图谱增强】大模型应用架构:融合智能与数据的新纪元!
ChatGPT的外部搜索能力,使其不仅限于预
训练
的数据,而是可以实时访问和检索互联网的最新信息。这就是典型的知识增强大模型应用,通过外部知识的增强能够扩展大模型的能力,让其
大模型入门教程
·
2025-02-05 10:36
知识图谱
架构
人工智能
语言模型
大模型
llama
AI大模型
如何利用DeepSeek打造医疗领域专属AI助手?从微调到部署全流程解析
本文将手把手带您实现医疗垂直领域大模型的定制化
训练
,以DeepSeek-R1为基座,打造专业可靠的医疗AI助手。
明哲AI
·
2025-02-05 10:05
AIGC
人工智能
机器学习
Deepseek
大模型
国内首个!百度成功点亮昆仑芯三代万卡集群,将于近日点亮3万卡集群
而24年9月升级的百度百舸AI异构计算平台4.0,围绕落地大模型全旅程的算力需求,在集群创建、开发实验、模型
训练
、模型推理四大方面,能为企业提供“多、快、稳、省”的AI基础设施,在万卡集群的建设中发挥了至关
·
2025-02-05 09:50
深度学习
大语言模型LLM分布式
训练
:TensorFlow攻略与深度解析(LLM系列04)
文章目录大语言模型LLM分布式
训练
:TensorFlow攻略与深度解析(LLM系列04)1.引言2.TensorFlow分布式
训练
基础概念3.TensorFlow中LLM分布式
训练
的关键技术及应用4.利用
North_D
·
2025-02-05 08:20
大语言模型LLM
分布式
tensorflow
人工智能
自然语言处理
深度学习
python
神经网络
自定义数据集 使用pytorch框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测,对预测结果计算精确度和召回率及F1分数
训练
模型:使用二元交叉熵损失函数BCELoss和随机梯度下降优化器SGD进行
训练
。保存模型:使用torch.save保存模型的参数。加载模型并预测:加载
知识鱼丸
·
2025-02-05 06:42
machine
learning
机器学习
GPU 进阶笔记(二):华为昇腾 910B GPU
1术语1.1与NVIDIA术语对应关系1.2缩写2产品与机器2.1GPU产品2.2
训练
机器底座CPU功耗操作系统2.3性能3实探:鲲鹏底座8*910BGPU主机3.1CPU3.2网卡和网络3.3GPU信息
hao_wujing
·
2025-02-05 04:22
gpu算力
【2024第一期CANN
训练
营】Ascend C算子开发基础篇
AscendC是面向算子开发场景的编程语言,它原生支持C和C++标准规范,并提供了多层接口抽象、自动并行计算等关键技术,以提高算子开发效率。AscendC的特点C/C++原语编程编程模型屏蔽硬件差异类库API封装,兼顾易用与高效孪生调试,可在CPU侧模拟NPU侧的行为开发基本流程环境准备使用AscendC完成Add算子核函数开发;使用ICPU_RUN_KFCPU调测宏完成算子核函数CPU侧运行验证
小超编程
·
2025-02-05 03:45
c语言
java
算法
DeepSeek-R1全面超越OpenAI o1:开源大模型
训练
范式革新
CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读人工智能在过去十年中的发展令人惊叹。其中,2017年Google发布的“AttentionIsAllYouNeed”论文奠定了神经网络架构的重要基础,推动了大规模语言模型(LLM)的突破。OpenAI早期专注于强化学习(RL),但在Transformer结构问世后,迅速调整方向,借助Google的开源研究开发出强大的LLM。然而,尽
·
2025-02-05 02:16
前端javascript
心法利器[128] | 2024年算法小结-个人成长-打开思路-生日
往期回顾心法利器[123]|算法面试的八股和非八股讨论心法利器[124]|24年算法思考-大模型的应用与
训练
篇心法利器[125]|24年算法思考-RAG技术论文和实践小
机智的叉烧
·
2025-02-05 01:07
算法
心法利器[127] | 24年算法思考-特征工程和经典深度学习
往期回顾心法利器[122]|效果提升的根本来源讨论心法利器[123]|算法面试的八股和非八股讨论心法利器[124]|24年算法思考-大模型的应用与
训练
篇心法利器[125
机智的叉烧
·
2025-02-05 01:37
算法
深度学习
人工智能
大模型带你学pytorch课程
PyTorch是一个强大的开源机器学习框架,由Facebook的人工智能研究实验室开发,被广泛用于深度学习模型的构建和
训练
。让我们开始你的PyTorch旅程吧!1.预备课程大纲1.1引入Pyth
立杰说
·
2025-02-05 01:33
Python
deep-learning
Pytorch
pytorch
人工智能
python
自定义数据集 使用scikit-learn中svm的包实现svm分类
数据划分:-使用train_test_split函数将生成的数据集划分为
训练
集和测试集,测试集占比为20%,同样通过random_state=42保证划分的一致性。SVM模型:-初始化SV
知识鱼丸
·
2025-02-05 01:31
machine
learning
人工智能
招商银行2022 Fintech精英
训练
营数据赛道-第4名方案分享
0.比赛简介竞赛时间:4月29日9:00-5月12日17:00竞赛流程:4月29日9:00-5月9日24:00,赛题开放A榜数据(test_A榜),预测结果数据每天限提交3次;5月10日00:00-5月12日17:00,赛题开放B榜数据(test_B榜),预测结果数据每天限提交3次。重复提交或提交格式错误均扣除有效提交次数,请谨慎提交答案,结果提交后请务必点击“运行”按钮,方可查看当前个人排名。排
藏在云中的猫
·
2025-02-04 22:38
机器学习
人工智能
python
Llama最新开源大模型Llama3.1
以下是关于Llama3.1的详细介绍:参数规模与
训练
数据Llama3.1拥有4050亿(405B)参数,是目前开源领域中参数规模最大的模型之一。
kcarly
·
2025-02-04 21:32
LLaMA2
食用指南
llama
开源
开源大模型
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他