E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
天梯赛训练
DeepSeek R1技术报告关键解析(5/10):知识蒸馏:如何让小模型也能具备强推理能力?
在DeepSeek-R1
训练
过程中,研究人员通过知识蒸馏,让较小的模型也能具备较强的
董董灿是个攻城狮
·
2025-02-05 19:43
人工智能
计算机视觉
CNN
学霸带你游戏化增强学习动力奖励与挑战助力成长
无论是语言、编程还是技能
训练
,游戏化都能提供全新的解决方案。游戏化吸引学习者注意力游戏的奖励机制、即时反馈和目标导向能迅速抓住学习者的注意力。
Snow Hide(雪诺海德)
·
2025-02-05 18:10
纽雪澳诺加海美德
学霸挺拔
学霸挺拔
游戏化学习
动力提升
学习效率
兴趣驱动
目标检测数据集-Pascal VOC 数据集介绍
在该挑战中,这是一个监督学习的问题,
训练
集以带标签的图片的形式给出。介绍PascalVOC数据集:C
AI研习图书馆
·
2025-02-05 17:01
深度学习数据集
目标检测
数据集
VOC2007
人工智能基础知识速成 - 机器学习、深度学习算法原理及其实际应用案例
机器学习的基本原理机器学习的基本原理是通过构建数学模型,使用大量的数据进行
训练
,使得模型能够智能地预测和决策。在机器学习中,常用的模型包括线性回归、逻辑回
苹果酱0567
·
2025-02-05 16:23
面试题汇总与解析
课程设计
spring
boot
vue.js
java
mysql
基于昇腾用PyTorch实现传统CTR模型WideDeep网络
基于昇腾用PyTorch实现传统CTR模型WideDeep网络本文主要介绍如何在昇腾上使用pytorch对推荐系统中经典的网络模型WideDeep网络进行
训练
的实战讲解,使用数据集是criteo,主要内容分为以下几个模块
·
2025-02-05 14:00
人工智能推荐算法
PyTorch中的 torch.nn.GRU
与传统的RNN相比,GRU引入了门控机制,旨在解决长序列
训练
中的梯度消失问题,并提高了
训练
效率和性能。在PyTorch中,torch.nn.GRU是一个非常方便的模块,用于构建和
训练
GRU网络。
彬彬侠
·
2025-02-05 12:53
自然语言处理
GRU
PyTorch
Python
NLP
自然语言处理
深度探索:机器学习中的粒子群优化算法(PBMT)原理及应用
目录一、引言与背景二、定理三、算法原理四、算法实现五、优缺点分析优点:缺点:六、案例应用七、对比与其他算法八、结论与展望一、引言与背景随着机器学习技术的迅速发展,优化算法在模型
训练
、特征选择、参数调优等多个环节扮演着至关重要的角色
生瓜蛋子
·
2025-02-05 12:22
机器学习
机器学习
算法
人工智能
基于深度学习的车牌检测识别系统 —— 使用YOLOv5实现车牌检测与识别
目录引言项目背景与目标1.1项目背景1.2项目目标系统设计与架构2.1系统功能概述2.2系统架构数据准备与处理3.1数据集选择与收集3.2数据标注3.3数据集划分YOLOv5模型
训练
与优化4.1YOLOv5
2025年数学建模美赛
·
2025-02-05 12:20
深度学习
YOLO
人工智能
分类
ui
DeepSeek-R1 低成本
训练
的根本原因是?
然而,高性能的背后往往是高昂的
训练
成本,动辄数百万美元的投入让许多企业和研究机构望而却步。近期,国产大模型DeepSeek-R1的横空出世,以其卓越的性能和极具竞争力的成本,打破了这一固有认知。
明哲AI
·
2025-02-05 11:10
AIGC
人工智能
大模型
deepseek
AI
Agent
关于大模型 AGI 应知应会_生在AI发展的时代
这些模型通过
训练
海量数据来学习复杂的模式和特
森焱森
·
2025-02-05 10:38
机器人
人工智能
算法
总结
科技
【知识图谱增强】大模型应用架构:融合智能与数据的新纪元!
ChatGPT的外部搜索能力,使其不仅限于预
训练
的数据,而是可以实时访问和检索互联网的最新信息。这就是典型的知识增强大模型应用,通过外部知识的增强能够扩展大模型的能力,让其
大模型入门教程
·
2025-02-05 10:36
知识图谱
架构
人工智能
语言模型
大模型
llama
AI大模型
如何利用DeepSeek打造医疗领域专属AI助手?从微调到部署全流程解析
本文将手把手带您实现医疗垂直领域大模型的定制化
训练
,以DeepSeek-R1为基座,打造专业可靠的医疗AI助手。
明哲AI
·
2025-02-05 10:05
AIGC
人工智能
机器学习
Deepseek
大模型
国内首个!百度成功点亮昆仑芯三代万卡集群,将于近日点亮3万卡集群
而24年9月升级的百度百舸AI异构计算平台4.0,围绕落地大模型全旅程的算力需求,在集群创建、开发实验、模型
训练
、模型推理四大方面,能为企业提供“多、快、稳、省”的AI基础设施,在万卡集群的建设中发挥了至关
·
2025-02-05 09:50
深度学习
大语言模型LLM分布式
训练
:TensorFlow攻略与深度解析(LLM系列04)
文章目录大语言模型LLM分布式
训练
:TensorFlow攻略与深度解析(LLM系列04)1.引言2.TensorFlow分布式
训练
基础概念3.TensorFlow中LLM分布式
训练
的关键技术及应用4.利用
North_D
·
2025-02-05 08:20
大语言模型LLM
分布式
tensorflow
人工智能
自然语言处理
深度学习
python
神经网络
自定义数据集 使用pytorch框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测,对预测结果计算精确度和召回率及F1分数
训练
模型:使用二元交叉熵损失函数BCELoss和随机梯度下降优化器SGD进行
训练
。保存模型:使用torch.save保存模型的参数。加载模型并预测:加载
知识鱼丸
·
2025-02-05 06:42
machine
learning
机器学习
GPU 进阶笔记(二):华为昇腾 910B GPU
1术语1.1与NVIDIA术语对应关系1.2缩写2产品与机器2.1GPU产品2.2
训练
机器底座CPU功耗操作系统2.3性能3实探:鲲鹏底座8*910BGPU主机3.1CPU3.2网卡和网络3.3GPU信息
hao_wujing
·
2025-02-05 04:22
gpu算力
【2024第一期CANN
训练
营】Ascend C算子开发基础篇
AscendC是面向算子开发场景的编程语言,它原生支持C和C++标准规范,并提供了多层接口抽象、自动并行计算等关键技术,以提高算子开发效率。AscendC的特点C/C++原语编程编程模型屏蔽硬件差异类库API封装,兼顾易用与高效孪生调试,可在CPU侧模拟NPU侧的行为开发基本流程环境准备使用AscendC完成Add算子核函数开发;使用ICPU_RUN_KFCPU调测宏完成算子核函数CPU侧运行验证
小超编程
·
2025-02-05 03:45
c语言
java
算法
DeepSeek-R1全面超越OpenAI o1:开源大模型
训练
范式革新
CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读人工智能在过去十年中的发展令人惊叹。其中,2017年Google发布的“AttentionIsAllYouNeed”论文奠定了神经网络架构的重要基础,推动了大规模语言模型(LLM)的突破。OpenAI早期专注于强化学习(RL),但在Transformer结构问世后,迅速调整方向,借助Google的开源研究开发出强大的LLM。然而,尽
·
2025-02-05 02:16
前端javascript
心法利器[128] | 2024年算法小结-个人成长-打开思路-生日
往期回顾心法利器[123]|算法面试的八股和非八股讨论心法利器[124]|24年算法思考-大模型的应用与
训练
篇心法利器[125]|24年算法思考-RAG技术论文和实践小
机智的叉烧
·
2025-02-05 01:07
算法
心法利器[127] | 24年算法思考-特征工程和经典深度学习
往期回顾心法利器[122]|效果提升的根本来源讨论心法利器[123]|算法面试的八股和非八股讨论心法利器[124]|24年算法思考-大模型的应用与
训练
篇心法利器[125
机智的叉烧
·
2025-02-05 01:37
算法
深度学习
人工智能
大模型带你学pytorch课程
PyTorch是一个强大的开源机器学习框架,由Facebook的人工智能研究实验室开发,被广泛用于深度学习模型的构建和
训练
。让我们开始你的PyTorch旅程吧!1.预备课程大纲1.1引入Pyth
立杰说
·
2025-02-05 01:33
Python
deep-learning
Pytorch
pytorch
人工智能
python
自定义数据集 使用scikit-learn中svm的包实现svm分类
数据划分:-使用train_test_split函数将生成的数据集划分为
训练
集和测试集,测试集占比为20%,同样通过random_state=42保证划分的一致性。SVM模型:-初始化SV
知识鱼丸
·
2025-02-05 01:31
machine
learning
人工智能
招商银行2022 Fintech精英
训练
营数据赛道-第4名方案分享
0.比赛简介竞赛时间:4月29日9:00-5月12日17:00竞赛流程:4月29日9:00-5月9日24:00,赛题开放A榜数据(test_A榜),预测结果数据每天限提交3次;5月10日00:00-5月12日17:00,赛题开放B榜数据(test_B榜),预测结果数据每天限提交3次。重复提交或提交格式错误均扣除有效提交次数,请谨慎提交答案,结果提交后请务必点击“运行”按钮,方可查看当前个人排名。排
藏在云中的猫
·
2025-02-04 22:38
机器学习
人工智能
python
Llama最新开源大模型Llama3.1
以下是关于Llama3.1的详细介绍:参数规模与
训练
数据Llama3.1拥有4050亿(405B)参数,是目前开源领域中参数规模最大的模型之一。
kcarly
·
2025-02-04 21:32
LLaMA2
食用指南
llama
开源
开源大模型
MagicBot:AI 与算力让它在工厂立足
可能大家都曾在脑海中预想过机器人活跃于工厂的场景:它们如同
训练
有素的“工作狂魔”,在工厂的各个角落穿梭,自主分工合作,高效地完成各项任务。
算家云
·
2025-02-04 20:57
话题文章
人工智能
深度学习
算力需求
机器人
负重机器人
scikit-learn实现SVM
最大间隔超平面:SVM的目标是找到能够最大化
训练
样本间隔的超平面。间隔被定义为到最近
训练
样本点的距离,这些点被称为支持向量。这种策略的优势在于它提供了一种防止模型过拟合的方法,从而提高了泛化能力。
PeterClerk
·
2025-02-04 19:23
支持向量机
scikit-learn
算法
PyTorch中的In-place操作是什么?为什么要避免使用这种操作?
点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达导读In-place操作用在推理的时候可以显著节省内存,但是
训练
的时候一定要小心使用。
小白学视觉
·
2025-02-04 19:49
AI大模型学习的七个阶段,学完你就是大模型大师!
预
训练
、SFT、RLHF。第三阶段:编程基础与工具使用目标:掌握大
AGI大模型老王
·
2025-02-04 19:48
人工智能
学习
大模型
大模型学习
AI大模型
RAG
大模型教程
大模型文件格式GGUF格式
GGUF简介当前的大模型的参数规模较大,数以千亿的参数导致了它们的预
训练
结果文件都在几十GB甚至是几百GB,这不仅导致其使用成本很高,在不同平台进行交换也非常困难。
·
2025-02-04 18:36
人工智能大模型
【自然语言处理(NLP)】生成词向量:GloVe(Global Vectors for Word Representation)原理及应用
文章目录介绍GloVe介绍核心思想共现矩阵1.共现矩阵的定义2.共现概率矩阵的定义3.共现概率矩阵的意义4.共现概率矩阵的构建步骤5.共现概率矩阵的应用6.示例7.优缺点优点缺点**总结**目标函数
训练
过程使用预
训练
的
道友老李
·
2025-02-04 16:59
自然语言处理(NLP)
自然语言处理
人工智能
蓝桥杯算法
训练
排序C++
代码:#includeusingnamespacestd;intmain(){intnum[3];inttemp;cin>>num[0]>>num[1]>>num[2];for(inti=0;inum[i]){temp=num[j];num[j]=num[i];num[i]=temp;}for(inti=0;i<3;i++)cout<<num[i]<<"";return0;}
王大头不吃藕
·
2025-02-04 15:47
C++
DeepSeek R1 AI 论文翻译
DeepSeek-R1-Zero是一个通过大规模强化学习(RL)
训练
的模型,且在此过程中未使用监督微调(SFT)作为预处理步骤,展现出了显著的推理能力。
·
2025-02-04 14:27
后端java
自定义数据集 ,使用朴素贝叶斯对其进行分类
fit_transform方法在
训练
数据上拟合向量器并进行转换。模型
训练
:-初始化MultinomialNB模型,这是适用于离散数据(如词频)的朴素贝叶斯分类器。
知识鱼丸
·
2025-02-04 14:40
machine
learning
机器学习
【AI开源项目】Dify- 轻松打造可持续运营的 GPT 系列的 AI应用 —— 全面解析LLMOps平台
Q2:如何使用Dify“
训练
”自己的
ChatGPT-千鑫
·
2025-02-04 13:02
AI开源项目
人工智能
人工智能
开源
gpt
gpt-3
AI编程
codemoss能用AI
【漫话机器学习系列】079.超参数调优(Hyperparameter Tuning)
超参数是模型在
训练
之前设定的参数,而不是通过
训练
数据学习到的参数。正确地选择超参数可以显著提高模型的预测能力,反之,错误的超参数选择可能会导致过拟合、欠拟合或
训练
过程缓慢。
IT古董
·
2025-02-04 11:44
漫话机器学习系列专辑
机器学习
深度学习
人工智能
全场景深度学习开源框架(MindSpore)
无论是在数据中心的大规模计算,还是在手机、物联网设备等资源受限的终端上,MindSpore都能灵活适配,充分发挥各硬件平台的性能优势,实现模型的高效
训练
和推理。
deepdata_cn
·
2025-02-04 11:41
人工智能
深度学习
开源
人工智能
torch.nn.RNN: PyTorch 中的循环神经网络(RNN)模块
它提供了一个可以进行
训练
的RNN层,广泛应用于序列数据的建模,如自然语言处理、时间序列分析等。这个模块可以处理各种类型的序列数据,并支持多种功能和配置。
彬彬侠
·
2025-02-04 10:40
自然语言处理
RNN
PyTorch
Python
循环神经网络
NLP
自然语言处理
AI学习指南HuggingFace篇-高级优化技巧
一、引言在深度学习和自然语言处理(NLP)中,模型
训练
的效率和性能至关重要。HuggingFace提供了多种高级优化技巧,帮助开发者提升模型
训练
的效率和效果。
俞兆鹏
·
2025-02-04 10:35
AI学习指南
ai
DeepSeek- R1 原理介绍
DeepSeek-R1是由DeepSeek公司推出的一款基于强化学习(RL)的开源推理模型,其核心原理和特点如下:1.核心技术与架构强化学习驱动:DeepSeek-R1是首个完全通过强化学习
训练
的大型语言模型
kcarly
·
2025-02-04 08:50
大模型知识乱炖
杂谈
DeepSeek
R1
原理介绍
深度学习框架PyTorch原理与实践
3.2PyTorch的特点1)自动求导机制2)GPU加速3)模型部署4)数据管道5)代码阅读友好4.核心算法原理4.1神经网络结构4.2神经网络层4.3激活函数5.实际案例——MNIST手写数字识别数据准备模型定义
训练
测试整体代码
AI天才研究院
·
2025-02-04 07:47
AI实战
大数据
人工智能
语言模型
Java
Python
架构设计
自定义数据集 使用paddlepaddle框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测
1.引言在这篇博客中,我们将使用PaddlePaddle框架实现一个逻辑回归模型,利用NumPy自定义数据集进行
训练
,并保存模型。最后,我们将演示如何加载保存的模型并进行预测。
辞落山
·
2025-02-04 07:16
逻辑回归
Databricks 开源 LLM,
训练
只需三个小时
像ChatGPT和Bard这样的生成式AI,它们使用的数据通常来自于在成千上万不同网站,使用的数据量十分惊人,而且想要使用这些数据
训练
AI还需要数以千计的强大GPU在背后提供支持。
唐 城
·
2025-02-04 07:15
AI-毕业设计全套
spring
log4j
postgresql
数据库
java
解决_pickle.UnpicklingError: A load persistent id instruction was encountered,but no persistent_load
Aloadpersistentidinstructionwasencountered,butnopersistent_loadfunctionwasspecified.报错原因:在加载模型参数时,torch版本发生变化,我报错因为
训练
前
邻家的狗2
·
2025-02-04 07:14
深度学习
人工智能
机器学习
DeepSeek R1 AI 论文翻译
DeepSeek-R1-Zero是一个通过大规模强化学习(RL)
训练
的模型,且在此过程中未使用监督微调(SFT)作为预处理步骤,展现出了显著的推理能力。
老马啸西风
·
2025-02-04 06:04
java
Yuan 2.0-M32 是一个基于 Yuan 2.0 架构的双语混合专家 (MoE) 语言模型,旨在以更少的参数和计算量实现更高的准确率
高效计算:使用MoE架构,40B总参数中仅有3.7B激活参数,
训练
计算消耗仅为同规模密集模型的9.25%,推理成本与3.7B参数的密集模型相当。
东方佑
·
2025-02-04 06:01
量子变法
架构
语言模型
人工智能
【分割评价指标-nnUNet V2
训练
】- AutoDL
目录一、DSC二、IOU三、VOE(VolumeOverlapError)四、RVD(RelativeVolumeDifference)五、Hausdorff95(95thPercentileofHausdorffDistance)六、ASSD(AverageSymmetricSurfaceDistance)七、MSD(MeanSurfaceDistance)八、NSD(NormalizedSur
HUI 别摸鱼了
·
2025-02-04 05:00
深度学习PyTorch
算法
人工智能
python
PyTorch
训练
一个分类器
文章目录0前言1加载和规范化CIFAR102定义一个卷积网络3定义损失函数和优化器4
训练
网络5测试网络6在GPU上
训练
模型参考资料0前言 TRAINGINGACLASSIFIER这篇教程很清楚的描述了如何使用
亚里
·
2025-02-04 05:59
平台工具类
pytorch训练网络
蓝桥杯——试题集——入门
训练
入门
训练
BEGIN-1A+B问题问题描述输入A、B,输出A+B。输入格式输入的第一行包括两个整数,由空格分隔,分别表示A、B。输出格式输出一行,包括一个整数,表示A+B的值。
唐煜鑫
·
2025-02-04 04:54
蓝桥杯
c语言
蓝桥杯
训练
1——缩位求和
缩位求和例如123输出为6n=int(input())lst=list(str(n))sum=0foriinlst:sum+=int(i)whilesum>=10:s=0lst1=list(str(sum))foriteminlst1:s+=int(item)sum=sprint(s)
会编程的小孩
·
2025-02-04 04:52
蓝桥杯
职场和发展
python中keras_Python深度学习——keras(一)
大多数深度学习,都是将若干个简单的层给链接起来,实现渐进式的数据过滤,也就是数据蒸馏(过滤到一定程度就等同于蒸馏)首先来看一个数字识别的案例(1)读取
训练
集和测试集fromkeras.datasetsimportmnist
weixin_39534321
·
2025-02-04 04:48
python中keras
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他