E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
推理训练
使用vLLM部署Qwen2.5-VL-7B-Instruct模型的详细指南
部署Qwen2.5-VL-7B-Instruct模型的详细指南引言环境搭建安装vLLM安装依赖库下载模型启动vLLM服务器总结参考引言近年来,随着大规模语言模型(LLM)的快速发展,如何高效地进行模型
推理
成为了一个热门话题
engchina
·
2025-02-06 03:40
LINUX
vllm
qwen2.5-vl
7B
本地部署
DeepSeek-R1:通过强化学习提升大型语言模型
推理
能力的探索
DeepSeek-R1:通过强化学习提升大型语言模型
推理
能力的探索在人工智能领域,大型语言模型(LLMs)的发展日新月异,其在自然语言处理和生成任务中的表现逐渐接近人类水平。
kaichu2
·
2025-02-06 03:07
论文翻译
DeepSeek
大模型的底层逻辑及Transformer架构
一、大模型的底层逻辑1.数据驱动大模型依赖海量的数据进行
训练
,数据的质量和数量直接影响模型的性能。通过大量的数据,模型能够学习到丰富的模式和规律,从而更好地处理各种任务。
搏博
·
2025-02-06 02:04
transformer
架构
深度学习
机器学习
人工智能
大语言模型轻量化:知识蒸馏的范式迁移与工程实践
摘要在大型语言模型(LLM)主导人工智能发展的当下,模型参数量与
推理
成本的指数级增长已成为制约技术落地的核心瓶颈。
LucianaiB
·
2025-02-06 02:04
语言模型
人工智能
自然语言处理
python
【深度学习】权重衰减
我们总是可以通过去收集更多的
训练
数据来缓解过拟合。但这可能成本很高,耗时颇多,或者完全超出我们的控制,因而在短期内不可能做到。假设我们已经拥有尽可能多的高质量数据,我们便可以将重点放在正则化技术上。
熙曦Sakura
·
2025-02-06 02:33
深度学习
深度学习
人工智能
java调用ONNX模型
一、导出一个onnx模型这里
训练
了一个简单的线性回归模型通过SerializeToString完成导出。
jason.zeng@1502207
·
2025-02-06 01:30
java
开发语言
AIGC从入门到实战:基于大模型的人工智能应用的涌现和爆发
1.2大模型:AIGC的基石AIGC的核心驱动力在于大规模预
训练
模型(简称“大模型”)。这些模型拥
AI天才研究院
·
2025-02-06 01:00
计算
AI大模型企业级应用开发实战
ChatGPT
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
大规模语言模型从理论到实践 DeepSpeed实践
大规模语言模型从理论到实践DeepSpeed实践文章目录大规模语言模型从理论到实践DeepSpeed实践1.背景介绍1.1大规模语言模型的兴起1.2
训练
和部署LLM的挑战1.3DeepSpeed:赋能LLM
AI天才研究院
·
2025-02-06 01:59
大数据AI人工智能
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
【Mamba之模型
训练
系列(四)】将 mamba 扩展到多模态大型语言模型,实现高效
推理
将mamba扩展到多模态大型语言模型,实现高效
推理
背景知识与研究动机Cobra模型设计视觉编码器DINOv2SigLIP投影器Mamba语言模型主干
训练
策略
训练
数据
训练
阶段预
训练
阶段多模态指令调整阶段微调策略
训练
细节
训练
策略的关键结论实验验证实验设置性能比较
推理
速度消融研究关键结论参考文献这篇文章介绍了一个名为
愷创作者
·
2025-02-06 00:45
Mamba及多模态模型训练系列
语言模型
人工智能
自然语言处理
一、TensorFlow的建模流程
划分数据集:
训练
集、验证集、测试集。转换为Dataset对象:利用tf.data优化数据流水线。
李建军
·
2025-02-05 23:10
TensorFlow
tensorflow
人工智能
python
【专题】DeepSeek技术颠覆or创新共赢,开启Al算法变革元年报告汇总PDF洞察(附原数据表)
海量数据不仅为模型
训练
提供了坚实基础,更驱动着AIAgent在各领域的创新应用。与此同时,国产大模型在近期密集涌现,数量已颇具规模且广泛渗透到多个垂直行业,展现出强
·
2025-02-05 22:18
数据挖掘深度学习机器学习算法
Python-机器学习(二)-K近邻算法的原理与鸢尾花数据集实现详解
fromsklearn.neighborsimportKNeighborsClassifierk=5#对模型
训练
clf=KNeighborsClassifier(n_neighbors=k)clf.fit
2401_84009679
·
2025-02-05 22:00
程序员
机器学习
python
近邻算法
什么是大模型框架?常用的大模型框架盘点对比
什么是大模型框架大模型框架是指用于
训练
、
推理
和部署大型语言模型(LLMs)的软件工具和库。
AI产品经理
·
2025-02-05 21:25
学习
人工智能
大数据
深度学习
语言模型
昇腾设备torch_npu
推理
配置
1.Ascend310B1的npu
推理
思路在昇腾Ascend310B1NPU上基于PyTorch进行
推理
时,通过torch_npu替换原有GPU/CUDA操作。
时间逝世298
·
2025-02-05 20:21
pytorch
深度学习
人工智能
DeepSeek R1技术报告关键解析(5/10):知识蒸馏:如何让小模型也能具备强
推理
能力?
大模型通常计算量大、
推理
速度慢,而小模型虽然计算资源消耗更少,但
推理
能力往往不如大模型。通过知识蒸馏,小模型可以继承大模型的
推理
能力,同时保持较低的计算成本。
董董灿是个攻城狮
·
2025-02-05 19:43
人工智能
计算机视觉
CNN
学霸带你游戏化增强学习动力奖励与挑战助力成长
无论是语言、编程还是技能
训练
,游戏化都能提供全新的解决方案。游戏化吸引学习者注意力游戏的奖励机制、即时反馈和目标导向能迅速抓住学习者的注意力。
Snow Hide(雪诺海德)
·
2025-02-05 18:10
纽雪澳诺加海美德
学霸挺拔
学霸挺拔
游戏化学习
动力提升
学习效率
兴趣驱动
TensorRT-LLM保姆级教程(一)-快速入门
随着大模型的爆火,投入到生产环境的模型参数量规模也变得越来越大(从数十亿参数到千亿参数规模),从而导致大模型的
推理
成本急剧增加。
大模型部署
·
2025-02-05 18:38
人工智能
transformer
产品经理
自然语言处理
kubernetes
大模型
LLM
知识蒸馏教程 Knowledge Distillation Tutorial
来自于:KnowledgeDistillationTutorial将大模型蒸馏为小模型,可以节省计算资源,加快
推理
过程,更高效的运行。
Qiming_v
·
2025-02-05 17:03
Distillation
蒸馏
目标检测数据集-Pascal VOC 数据集介绍
在该挑战中,这是一个监督学习的问题,
训练
集以带标签的图片的形式给出。介绍PascalVOC数据集:C
AI研习图书馆
·
2025-02-05 17:01
深度学习数据集
目标检测
数据集
VOC2007
人工智能基础知识速成 - 机器学习、深度学习算法原理及其实际应用案例
机器学习的基本原理机器学习的基本原理是通过构建数学模型,使用大量的数据进行
训练
,使得模型能够智能地预测和决策。在机器学习中,常用的模型包括线性回归、逻辑回
苹果酱0567
·
2025-02-05 16:23
面试题汇总与解析
课程设计
spring
boot
vue.js
java
mysql
昆仑天工SkyWork:更懂中文的AIGC开源模型
昆仑天工SkyWork系列AIGC开源模型,由奇点智源公司研发,在2022年12月发布,覆盖图像、文本、编程等多模态内容生成能力,包括绘画、文章续写、对话、中英翻译、内容风格生成、
推理
、诗词对联、代码补全等
AIGC探索家
·
2025-02-05 16:52
aigc
ai绘画
AI作画
stable
diffusion
chatgpt
nlp
人工智能
昆仑万维官宣开源2000亿稀疏大模型Skywork-MoE
6月3日,昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE,性能强劲,同时
推理
成本更低。
TMT星球
·
2025-02-05 16:50
人工智能
人工智能
国产AI大爆发!讯飞星火X1横空出世,直接“杀疯”成中文数学王者?
而今天要给大家介绍的这个主角——讯飞星火深度
推理
模型X1,那可是最近科技圈的一大热点。为啥它值得我们重视呢?要知道,中文数学能力在AI
盼达思文体科创
·
2025-02-05 15:15
经验分享
【LangChain编程:从入门到实践】代码实践
在早期,AI主要集中于基于规则的系统和专家系统,试图模拟人类的
推理
过程。然而,随着大数据时代的到来和计算能力的飞速提升,机器学习和深度学习技术开始占据主
AI天才研究院
·
2025-02-05 14:09
计算
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
基于昇腾用PyTorch实现传统CTR模型WideDeep网络
基于昇腾用PyTorch实现传统CTR模型WideDeep网络本文主要介绍如何在昇腾上使用pytorch对推荐系统中经典的网络模型WideDeep网络进行
训练
的实战讲解,使用数据集是criteo,主要内容分为以下几个模块
·
2025-02-05 14:00
人工智能推荐算法
PyTorch中的 torch.nn.GRU
与传统的RNN相比,GRU引入了门控机制,旨在解决长序列
训练
中的梯度消失问题,并提高了
训练
效率和性能。在PyTorch中,torch.nn.GRU是一个非常方便的模块,用于构建和
训练
GRU网络。
彬彬侠
·
2025-02-05 12:53
自然语言处理
GRU
PyTorch
Python
NLP
自然语言处理
深度探索:机器学习中的粒子群优化算法(PBMT)原理及应用
目录一、引言与背景二、定理三、算法原理四、算法实现五、优缺点分析优点:缺点:六、案例应用七、对比与其他算法八、结论与展望一、引言与背景随着机器学习技术的迅速发展,优化算法在模型
训练
、特征选择、参数调优等多个环节扮演着至关重要的角色
生瓜蛋子
·
2025-02-05 12:22
机器学习
机器学习
算法
人工智能
基于深度学习的车牌检测识别系统 —— 使用YOLOv5实现车牌检测与识别
目录引言项目背景与目标1.1项目背景1.2项目目标系统设计与架构2.1系统功能概述2.2系统架构数据准备与处理3.1数据集选择与收集3.2数据标注3.3数据集划分YOLOv5模型
训练
与优化4.1YOLOv5
2025年数学建模美赛
·
2025-02-05 12:20
深度学习
YOLO
人工智能
分类
ui
DeepSeek-R1 低成本
训练
的根本原因是?
然而,高性能的背后往往是高昂的
训练
成本,动辄数百万美元的投入让许多企业和研究机构望而却步。近期,国产大模型DeepSeek-R1的横空出世,以其卓越的性能和极具竞争力的成本,打破了这一固有认知。
明哲AI
·
2025-02-05 11:10
AIGC
人工智能
大模型
deepseek
AI
Agent
关于大模型 AGI 应知应会_生在AI发展的时代
这些模型通过
训练
海量数据来学习复杂的模式和特
森焱森
·
2025-02-05 10:38
机器人
人工智能
算法
总结
科技
【知识图谱增强】大模型应用架构:融合智能与数据的新纪元!
ChatGPT的外部搜索能力,使其不仅限于预
训练
的数据,而是可以实时访问和检索互联网的最新信息。这就是典型的知识增强大模型应用,通过外部知识的增强能够扩展大模型的能力,让其
大模型入门教程
·
2025-02-05 10:36
知识图谱
架构
人工智能
语言模型
大模型
llama
AI大模型
如何利用DeepSeek打造医疗领域专属AI助手?从微调到部署全流程解析
本文将手把手带您实现医疗垂直领域大模型的定制化
训练
,以DeepSeek-R1为基座,打造专业可靠的医疗AI助手。
明哲AI
·
2025-02-05 10:05
AIGC
人工智能
机器学习
Deepseek
大模型
怎么在家用笔记本上轻松部署和使用DeepSeek R1?
而且在数学、编程等领域表现出众,可处理复杂逻辑
推理
任务,如果你不了解蒸馏技术文末也会提供相关的拓展知识运行
程序员辣条
·
2025-02-05 10:32
人工智能
LLama
AI产品经理
大模型学习
大模型
DeepSeek
大模型部署
国内首个!百度成功点亮昆仑芯三代万卡集群,将于近日点亮3万卡集群
而24年9月升级的百度百舸AI异构计算平台4.0,围绕落地大模型全旅程的算力需求,在集群创建、开发实验、模型
训练
、模型
推理
四大方面,能为企业提供“多、快、稳、省”的AI基础设施,在万卡集群的建设中发挥了至关
·
2025-02-05 09:50
深度学习
metagpt中ActionNode的用法
THINK_NODES类:4.ThinkAction类:5.SimplePrint类:6.Printer类:7.main函数:总结:主要执行流程:代码参考链接:整体流程实现一个基于节点(Node)结构和思维
推理
的系统
ZHOU_WUYI
·
2025-02-05 08:20
metagpt
metagpt
大语言模型LLM分布式
训练
:TensorFlow攻略与深度解析(LLM系列04)
文章目录大语言模型LLM分布式
训练
:TensorFlow攻略与深度解析(LLM系列04)1.引言2.TensorFlow分布式
训练
基础概念3.TensorFlow中LLM分布式
训练
的关键技术及应用4.利用
North_D
·
2025-02-05 08:20
大语言模型LLM
分布式
tensorflow
人工智能
自然语言处理
深度学习
python
神经网络
自定义数据集 使用pytorch框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测,对预测结果计算精确度和召回率及F1分数
训练
模型:使用二元交叉熵损失函数BCELoss和随机梯度下降优化器SGD进行
训练
。保存模型:使用torch.save保存模型的参数。加载模型并预测:加载
知识鱼丸
·
2025-02-05 06:42
machine
learning
机器学习
GPU 进阶笔记(二):华为昇腾 910B GPU
1术语1.1与NVIDIA术语对应关系1.2缩写2产品与机器2.1GPU产品2.2
训练
机器底座CPU功耗操作系统2.3性能3实探:鲲鹏底座8*910BGPU主机3.1CPU3.2网卡和网络3.3GPU信息
hao_wujing
·
2025-02-05 04:22
gpu算力
Ollama能本地部署Llama 3等大模型的原因解析(ollama核心架构、技术特性、实际应用)
文章目录前言1、Ollama的核心架构和技术能力1.1、高效模型加载和存储1.2、
推理
优化1.3、微调支持1.4、部署工具链2.、Llama3模型的技术特性2.1、模型架构2.2、模型性能3.
周杰伦_Jay
·
2025-02-05 03:19
大模型LLMs
llama
架构
transformer
深度学习
人工智能
数据结构
【2024第一期CANN
训练
营】Ascend C算子开发基础篇
AscendC是面向算子开发场景的编程语言,它原生支持C和C++标准规范,并提供了多层接口抽象、自动并行计算等关键技术,以提高算子开发效率。AscendC的特点C/C++原语编程编程模型屏蔽硬件差异类库API封装,兼顾易用与高效孪生调试,可在CPU侧模拟NPU侧的行为开发基本流程环境准备使用AscendC完成Add算子核函数开发;使用ICPU_RUN_KFCPU调测宏完成算子核函数CPU侧运行验证
小超编程
·
2025-02-05 03:45
c语言
java
算法
DeepSeek-R1全面超越OpenAI o1:开源大模型
训练
范式革新
CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读人工智能在过去十年中的发展令人惊叹。其中,2017年Google发布的“AttentionIsAllYouNeed”论文奠定了神经网络架构的重要基础,推动了大规模语言模型(LLM)的突破。OpenAI早期专注于强化学习(RL),但在Transformer结构问世后,迅速调整方向,借助Google的开源研究开发出强大的LLM。然而,尽
·
2025-02-05 02:16
前端javascript
心法利器[128] | 2024年算法小结-个人成长-打开思路-生日
往期回顾心法利器[123]|算法面试的八股和非八股讨论心法利器[124]|24年算法思考-大模型的应用与
训练
篇心法利器[125]|24年算法思考-RAG技术论文和实践小
机智的叉烧
·
2025-02-05 01:07
算法
心法利器[127] | 24年算法思考-特征工程和经典深度学习
往期回顾心法利器[122]|效果提升的根本来源讨论心法利器[123]|算法面试的八股和非八股讨论心法利器[124]|24年算法思考-大模型的应用与
训练
篇心法利器[125
机智的叉烧
·
2025-02-05 01:37
算法
深度学习
人工智能
大模型带你学pytorch课程
PyTorch是一个强大的开源机器学习框架,由Facebook的人工智能研究实验室开发,被广泛用于深度学习模型的构建和
训练
。让我们开始你的PyTorch旅程吧!1.预备课程大纲1.1引入Pyth
立杰说
·
2025-02-05 01:33
Python
deep-learning
Pytorch
pytorch
人工智能
python
自定义数据集 使用scikit-learn中svm的包实现svm分类
数据划分:-使用train_test_split函数将生成的数据集划分为
训练
集和测试集,测试集占比为20%,同样通过random_state=42保证划分的一致性。SVM模型:-初始化SV
知识鱼丸
·
2025-02-05 01:31
machine
learning
人工智能
ChatGPT怎么回事?
纯属发现,调侃一下~这段时间deepseek不是特别火吗,尤其是它的
推理
功能,突发奇想,想用deepseek回答一些问题,回答一个问题之后就回复服务器繁忙(估计还在被攻击吧~_~)然后就转向了GPT,真的被笑到了
cimeo
·
2025-02-05 00:23
人工智能
chatgpt
人工智能
招商银行2022 Fintech精英
训练
营数据赛道-第4名方案分享
0.比赛简介竞赛时间:4月29日9:00-5月12日17:00竞赛流程:4月29日9:00-5月9日24:00,赛题开放A榜数据(test_A榜),预测结果数据每天限提交3次;5月10日00:00-5月12日17:00,赛题开放B榜数据(test_B榜),预测结果数据每天限提交3次。重复提交或提交格式错误均扣除有效提交次数,请谨慎提交答案,结果提交后请务必点击“运行”按钮,方可查看当前个人排名。排
藏在云中的猫
·
2025-02-04 22:38
机器学习
人工智能
python
Llama最新开源大模型Llama3.1
以下是关于Llama3.1的详细介绍:参数规模与
训练
数据Llama3.1拥有4050亿(405B)参数,是目前开源领域中参数规模最大的模型之一。
kcarly
·
2025-02-04 21:32
LLaMA2
食用指南
llama
开源
开源大模型
揭秘DeepSeek R1大模型:它如何像人类一样“思考”?
而近期备受关注的DeepSeekR1,凭借更高效的
推理
能力和更低能耗,成为行业焦点。今天,我们将深入它的“大脑”,看看它是如何工作的!
大模型扬叔
·
2025-02-04 20:00
学习
自然语言处理
prompt
人工智能
hugging
face怎么用
MagicBot:AI 与算力让它在工厂立足
可能大家都曾在脑海中预想过机器人活跃于工厂的场景:它们如同
训练
有素的“工作狂魔”,在工厂的各个角落穿梭,自主分工合作,高效地完成各项任务。
算家云
·
2025-02-04 20:57
话题文章
人工智能
深度学习
算力需求
机器人
负重机器人
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他