E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
DNN推理
多模态大模型常见问题
Q-Former(BLIP2):优点:Q-Former通过查询机制有效融合了视觉和语言特征,使得模型能够更好地处理视觉-语言任务,尤其是在多模态
推理
任务中表现优秀。
cv2016_DL
·
2025-03-23 12:06
多模态大模型
人工智能
语言模型
自然语言处理
机器学习
transformer
C# 调用 VITS,
推理
模型 将文字转wav音频调试 -数字人分支
Microsoft.ML.OnnxRuntime.OnnxRuntimeException:[ErrorCode:InvalidArgument]Inputname:'input_name'isnotinthemetadata在Microsoft.ML.OnnxRuntime.InferenceSession.LookupInputMetadata(StringnodeName)位置D:\a\_w
未来之窗软件服务
·
2025-03-23 08:40
c#
开发语言
人工智能
数字人
统一的视频动作模型
然而,有效地结合视频生成和动作预测仍然具有挑战性,当前基于视频生成的方法在动作准确性和
推理
速度方面难以与直接策略学习的性能相匹配。
三谷秋水
·
2025-03-23 08:36
计算机视觉
机器学习
人工智能
计算机视觉
深度学习
机器学习
人工智能
知识图谱系列文章——文物知识图谱
明确领域和目的——文物知识图谱&设计创意2、领域信息采集与分析——文物信息,340件文物实例,3、定义文物本体概念和结构层次4、定义概念属性和属性约束5、本体编码(建模语言和工具)6、本体评估——Jena的内嵌
推理
机
weixin_43407382
·
2025-03-23 07:56
知识图谱
Deepseek API 调用
1获取APIKey目前比较知名的提供了DeepSeek的
推理
服务商包括硅基流动、阿里云、腾讯云等等。这些
推理
服务商一般是提供API接口,需要安装大模型客户端并配置API。
哦豁灬
·
2025-03-23 05:08
LLM
深度学习
生产工具
deepseek
LLM
API
大模型
vLLM 部署大模型
1介绍vLLM是来自UCBerkeley的LMSYS在LLM
推理
方面的最新工作(没错就是搞出Vicuna的那个group),最大亮点是采用PagedAttention技术,结合ContinuousBatching
哦豁灬
·
2025-03-23 05:07
深度学习
LLM
人工智能
vLLM
大模型部署
LLM
【人工智能之大模型】阐述生成式语言模型的工作机理...(二)
(二)前言4.代码逐行解释TransformerBlock类初始化前向传播GenerativeLM类初始化前向传播
推理
示例测试生成5.总结欢迎宝子们点赞、关注、收藏!欢迎宝子们批评指正!
985小水博一枚呀
·
2025-03-23 02:09
大大大模型知识点
人工智能
语言模型
自然语言处理
机器学习
神经网络
微软 LIDA 库:基于大模型的自动化数据分析与可视化
微软LIDA库:基于大模型的自动化数据分析与可视化一、核心架构与LLM交互流程调用LLM生成数据摘要基于LLM
推理
分析目标LLM生成可视化代码结合图像生成模型优化原始数据Summarizer模块结构化摘要
窝窝和牛牛
·
2025-03-23 01:01
microsoft
数据分析
AI 赋能应急管理:ChatGPT、DeepSeek、Grok 的应用探索
ChatGPT、DeepSeek、Grok等AI模型凭借强大的文本处理、数据分析和
推理
能力,可为灾害预警、应急响应、风险评估等提供高效支持。
一ge科研小菜菜
·
2025-03-22 20:58
人工智能
人工智能
深度解析大模型
推理
框架:原理、应用与实践
在当今数据驱动的时代,大模型
推理
框架已经成为人工智能领域的重要支柱。
百度_开发者中心
·
2025-03-22 19:24
人工智能
大模型
自然语言处理
大模型
推理
框架:从理论到实践的全面解析
然而,深度学习模型的训练和
推理
过程往往涉及大量数据和复杂计算,传统的计算框架难以满足需求。因此,大模型
推理
框架应运而生,成为解决这一问题的关键。
百度_开发者中心
·
2025-03-22 19:23
人工智能
大模型
自然语言处理
LLM-Agent方法评估与效果分析
从基础的单智能体强化学习算法(如PPO)到多智能体协作、语料重组以及在线自学习等新技术不断涌现,研究人员致力于探索如何提高LLM在实际应用中的决策能力、
推理
能力和任务执行效率。
·
2025-03-22 18:50
agent人工智能ai开发
MiniMind:完全从 0 训练自己的大模型
其目标是把上手LLM的门槛无限降低,直接从0开始训练一个极其轻量的语言模型,最低仅需2G显卡即可
推理
训练!
三花AI
·
2025-03-22 15:49
三花AI
人工智能
LLM大模型
MiniMind:3小时完全从0训练一个仅有26M的小参数GPT,最低仅需2G显卡即可
推理
训练!
MiniMind:3小时完全从0训练一个仅有26M的小参数GPT,最低仅需2G显卡即可
推理
训练!
哈罗·沃德
·
2025-03-22 15:19
LLM
gpt
【人工智能】大模型的幻觉问题:DeepSeek 的解决策略与实践
本文深入探讨了幻觉问题的成因,包括训练数据的偏差、
推理
过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象,我们分析了其在解
蒙娜丽宁
·
2025-03-22 13:29
Python杂谈
人工智能
人工智能
黑客攻击deepseek服务原理解析
一、攻击原理与实现路径无限
推理
循环攻击通过输入特定构造的提示词(如“树中两条路径之间的距离”),诱导模型陷入无限思考链(Chain-of-Thought,CoT
大囚长
·
2025-03-22 12:23
大模型
机器学习
黑客帝国
人工智能
PyTorch基础知识讲解(一)完整训练流程示例
文章目录Tutorial1.数据处理2.网络模型定义3.损失函数、模型优化、模型训练、模型评价4.模型保存、模型加载、模型
推理
Tutorial大多数机器学习工作流程涉及处理数据、创建模型、优化模型参数和保存训练好的模型
苏雨流丰
·
2025-03-22 12:20
机器学习
pytorch
人工智能
python
机器学习
深度学习
Tinyflow AI 工作流编排框架 v0.0.7 发布
该框架代码库轻量,学习成本低,能轻松应对简单任务编排和复杂多模态
推理
自不量力的A同学
·
2025-03-22 09:21
人工智能
法律行业——合同审查与AI律师
1.法律行业数字化转型的底层逻辑技术革命推手:以DeepSeekR1大模型为代表的开源AI技术,让法律文本解析、案例
推理
等复杂任务实现平民化应用
zhouyaowei1983
·
2025-03-22 06:27
人工智能
人工智能
人工智能革命:技术演进图谱与人类文明重构路径
当GPT-4在2023年3月通过注册会计师考试时,其财务分析模块展现的
推理
能力已超越85%的人类考生。这个标志性事件背后,折射出人工智能正在突破认知型工作的最后防线。
A达峰绮
·
2025-03-22 06:23
人工智能
重构
经验分享
图形绘制
数据处理
AI
一步到位!7大模型部署框架深度测评:从理论到DeepSeek R1:7B落地实战
本文在掘金同步发布:文章地址更多优质文章,请关注本人掘金账号:人肉推土机的掘金账号随着大语言模型(LLM)的广泛应用,如何高效部署和
推理
模型成为开发者关注的核心问题。
人肉推土机
·
2025-03-22 05:12
人工智能
python
深度学习模型性能全景评估与优化指南
深度学习模型性能全景评估与优化指南一、算力性能指标体系1.核心算力指标对比指标计算方式适用场景硬件限制TOPS(TeraOperationsPerSecond)每秒万亿次整数运算量化模型
推理
NVIDIAJetsonNano
niuTaylor
·
2025-03-22 02:49
深度学习
人工智能
DeepSeek-R1大模型微调技术深度解析:架构、方法与应用全解析
DeepSeek-R1大模型架构设计与技术特性1.1架构设计DeepSeek-R1作为超大规模语言模型,其核心架构设计包含以下创新:专家混合架构(MoE)采用6710亿参数的混合专家架构(MoE),每个
推理
过程仅激活
大势下的牛马
·
2025-03-22 00:58
搭建本地gpt
架构
deepseek
微调
【深度学习】DeepSeek模型介绍与部署
为了实现高效
推理
和成本效益的训练,DeepSeek-V3采用了多头潜在注意力(MLA)和DeepSeekMoE架构,这些架构在DeepSeek-V2中得到了充分验证。
Nerous_
·
2025-03-21 19:15
深度学习
深度学习
人工智能
【
DNN
量化工具】QKeras 工具简介
QKeras主要目标是优化模型的存储和
推理
速度,特别适用于需要在资源受限的设备(如移动设备和嵌入式系统)上运行深度学习模型的场景。
kanhao100
·
2025-03-21 18:07
笔记
dnn
人工智能
神经网络
【nnUnetv2】Code复现
相反的,把重心放在:预处理(resampling和normalization)、训练(loss,optimizer设置、数据增广)、
推理
(patch-based策略、test-time-augmentations
是Winky啊
·
2025-03-21 18:35
#
项目nnUnet
人工智能
深度学习
QKeras、Brevitas和QONNX量化工具对比
通过将浮点权重转换为低精度表示,量化能显著减小模型体积、降低内存占用并加速
推理
过程。对于资源受限的设备(如移动设备、嵌入式系统和边缘计算设备),量化技术尤为重要。
kanhao100
·
2025-03-21 16:48
笔记
深度学习
边缘计算
目标检测中归一化的目的?
这使得模型在训练和
推理
时能够处理任意尺寸的图像,而不需要关心图像的具体像素尺寸。2.位置和尺寸的相对性归一化后的坐标和尺寸是相对于图像尺寸的,而不是绝对像素值。这种相对性使得
林语微光
·
2025-03-21 14:37
kaggle
目标检测
目标跟踪
人工智能
AI界劳斯莱斯o1 -Pro来了!百万token收费600刀,OpenAI在AI普惠反方向狂奔?
刚刚,OpenAI宣布推出其最新的高性能
推理
模型o1-pro。
算家计算
·
2025-03-21 13:23
话题文章
人工智能
算家云
OpenAI
o1-pro
API
OpenAI发布最贵模型
DeepSeek
知识图谱在人工智能语义理解与
推理
中的关键作用及发展研究
摘要本文聚焦知识图谱,深入剖析其在人工智能语义理解与
推理
中的核心作用。
@王威&
·
2025-03-21 13:50
人工智能
【新品发售】NVIDIA 发布全球最小个人 AI 超级计算机 DGX Spark
DGXSpark(前身为ProjectDIGITS)支持AI开发者、研究人员、数据科学家和学生,在台式电脑上对大模型进行原型设计、微调和
推理
。
·
2025-03-21 12:09
segmentfault
月薪7万招工程师,小米汽车APP启动华为鸿蒙版开发工作;马化腾深夜回复网友对元宝的建议;苹果重组AI高管团队 | 极客头条
整理|苏宓出品|CSDN(ID:CS
DNn
ews)一分钟速览新闻点!
极客日报
·
2025-03-21 12:39
华为
汽车
harmonyos
【ai】mocap:conda 安装python3.8+ cuda+ pytorch+torchaudio、torchvision
安装pytorch就是会带上cudacu
dnn
啥的pytorch【ai】tx2nx:安装torch、torchvisionforyolov5这里就发现pytorch和torchvision有依赖关系的,
等风来不如迎风去
·
2025-03-21 05:41
AI入门与实战
人工智能
ubuntu
conda
大模型微调
文章目录前言一、使用的库二、数据预处理1.引入库2.读入数据3.对数据进行预处理4.转换为json格式文件三,使用算子分析数据并进行数据处理四,划分训练集和测试集五,编写训练脚本开始训练六,进行模型
推理
人工评估总结前言这是使用知乎评论进行模型微调
归一码字
·
2025-03-21 04:36
人工智能
AI 大模型应用数据中心的数据迁移架构
这些AI模型通常需要海量的数据进行训练和
推理
,因此数据中心作为AI应用的基础设施,显得尤为重要。然而,随着AI模型规模的不断扩大,数据中心面临着新的挑战:数据规模庞大:AI模型的训练和
推理
需要海量数据
AGI大模型与大数据研究院
·
2025-03-21 03:34
DeepSeek
R1
&
大数据AI人工智能
java
python
javascript
kotlin
golang
架构
人工智能
DeepLabv3+改进18:在主干网络中添加REP_BLOCK
本专栏重磅推出:✅独家改进策略:融合注意力机制、轻量化设计与多尺度优化✅即插即用模块:ASPP+升级、解码器PS:订阅专栏提供完整代码论文简介我们提出了一种通用的卷积神经网络(ConvNet)构建模块,可在不增加
推理
时间成本的情况下提升性能
AICurator
·
2025-03-21 03:01
深度学习
python
机器学习
deeplabv3+
语义分割
查看 CUDA cu
dnn
版本 查看Navicat GPU版本
查看显卡型号:lspci|grepVGA(lspci是linux查看硬件信息的命令),屏幕会打印出主机的集显几独显信息python中查看显卡型号fromtensorflow.python.clientimportdevice_libdevice_lib.list_local_devices()
FergusJ
·
2025-03-21 03:30
备份
python
开发语言
Qwen2-Audio:通义千问音频大模型技术解读
引言:从llm到mlm(audio)大型语言模型(LLM)的发展日新月异,它们在文本理解、生成、
推理
等方面展现出惊人的能力。
kakaZhui
·
2025-03-21 01:41
音视频
AIGC
人工智能
python
chatgpt
【AI论文】RWKV-7“鹅”模型,具备富有表现力的动态状态演化能力
然而,RWKV-7模型仅需常量内存使用和每个标记的常量
推理
时间。RWKV-7引入了一种新泛化的delta规则,该规则具有向量值门控和上
东临碣石82
·
2025-03-21 00:02
人工智能
Dify 项目开源大模型应用开发平台
其核心功能包括:可视化工作流构建通过可视化画布(如ReactFlow)编排AI工作流,支持多步骤任务处理,例如文档解析、模型
推理
和
魔王阿卡纳兹
·
2025-03-20 23:30
IT杂谈
开源项目观察
开源
dif
LLM
开发平台
开源模型应用落地-qwen模型小试-调用Qwen2-7B-Instruct-进阶篇(十二)
本文将介绍如何使用Transformers库进行模型
推理
(相较于qwen1系列,使用方式上有较大的调整),现在,我们赶紧跟上脚步,去体验一下新版本模型
开源技术探险家
·
2025-03-20 19:23
开源模型-实际应用落地
#
深度学习
自然语言处理
语言模型
LangChain入门:使用Python和通义千问打造免费的Qwen大模型聊天机器人
它提供了一个灵活的框架,使得开发者可以构建具有上下文感知能力和
推理
能力的应用程序,这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。
南七小僧
·
2025-03-20 18:44
人工智能
网站开发
AI技术产品经理
服务器
数据库
windows
附tensorrt
推理
代码
设备:cuda12.1,cu
dnn
8.9.2,tensorrt8.6.11.问题tensorrt的
推理
没输出???
李卓璐
·
2025-03-20 18:11
算法实战
python
开发语言
Hugging Face 模型格式全解析:从 PyTorch 到 GGUF
HuggingFace模型格式全解析:从PyTorch到GGUFHuggingFace生态支持多种模型格式,以满足不同场景下的存储、部署和
推理
需求。
mingo_敏
·
2025-03-20 17:37
Deep
Learning
pytorch
人工智能
python
华为余承东“剧透”新形态手机;自DeepSeek发布以来,英伟达市值已蒸发4200亿美元;Java 24正式发布 | 极客头条
整理|郑丽媛出品|CSDN(ID:CS
DNn
ews)一分钟速览新闻点!
极客日报
·
2025-03-20 14:17
华为
智能手机
java
用LangChain构建自愈式生成式AI:颠覆传统知识库的智能问答系统实战
本文将揭秘如何通过LangChain框架构建具有自进化能力的智能问答系统,实现企业知识库的实时动态更新与智能
推理
。通过本文,您将掌握一套让AI系统在运行中持续学习、自主优化的创新架构。
煜bart
·
2025-03-20 13:32
机器人
人工智能
python
AI编程
复旦:过程奖励优化多模态
推理
2503.10291摘要我们引入了VisualPRM,这是一种具有8B参数的高级多模态过程奖励模型(PRM),它通过Best-of-N(BoN)评估策略提高了现有多模态大型语言模型(MLLM)在不同模型尺度和族之间的
推理
能力
大模型任我行
·
2025-03-20 13:59
大模型-模型训练
人工智能
自然语言处理
语言模型
论文笔记
有了大模型为何还需要Agent智能体
其核心架构如下:大脑(LLM):负责语言理解、逻辑
推理
、知识问答等认知任务。感官(工具链):通过API、传感器或数据库获取实时数据(如天气、股价)。
全栈你个大西瓜
·
2025-03-20 09:59
人工智能
人工智能
AI
Agent
Agent
智能体
Agent
原理
Manus详细介绍
其名称源自拉丁语“MensetManus”,意为“手脑并用”,强调将大模型的逻辑
推理
能力转化为实际生产力。
accurater
·
2025-03-20 09:28
c++算法笔记
深度学习
人工智能
神经网络
deepseek具体应用场景
以下是基于证据的详细总结:金融领域DeepSeek在金融领域的应用表现突出,例如通过其大语言模型(如DeepSeekLLM67Bt)提供数学、逻辑
推理
等能力,帮助金融机构提升服务效率。
ahyouxiang
·
2025-03-20 06:06
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他