E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
模型部署(tensorRT)
DeepSeek使用中的问题及解决方案(部分)
1.
模型部署
与配置问题问题1:环境依赖冲突现象:安装模型依赖库时出现版本不兼容(如Python、PyTorch版本冲突)。解决方案:使用虚拟环境(如conda或venv)隔离依赖。
WeiLai1112
·
2025-02-20 07:17
DeepSeek
人工智能
PyTorch `.pth` 转 ONNX:从模型训练到跨平台部署
但当你想在不同的环境(如
TensorRT
、OpenVINO、ONNXRuntime)部署模型时,.pth可能并不适用。这时,ONNX(OpenNeuralNetworkExchange)就必不可少。
MO__YE
·
2025-02-18 23:46
人工智能
PyTorch `.pth` 转 ONNX:从模型训练到跨平台部署
但当你想在不同的环境(如
TensorRT
、OpenVINO、ONNXRuntime)部署模型时,.pth可能并不适用。这时,ONNX(OpenNeuralNetworkExchange)就必不可少。
MO__YE
·
2025-02-18 23:12
pytorch
人工智能
python
HarmonyOS Next轻量化模型的部署与优化
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统(截止目前API12)中轻量化
模型部署
与优化相关技术细节,基于实际开发实践进行总结。
·
2025-02-18 22:36
harmonyos
腾讯云目前支持4种DeepSeek开源大
模型部署
方案
欢迎交流#deepseek腾讯云目前支持4种DeepSeek开源大
模型部署
方案1、面向开发者开箱即用的HAI方式1)参考:https://mp.weixin.qq.com/s/kZLPfXv3b1sxLSwyRVsEsg2
szqcloud
·
2025-02-18 03:41
database
DeepSeek R1蒸馏版
模型部署
的实战教程
大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委,编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
herosunly
·
2025-02-18 03:09
DeepSeek从入门到精通
deepseek
大模型
人工智能
实战教程
[C#]C#使用yolov8的目标检测
tensorrt
模型+bytetrack实现目标追踪
【测试通过环境】win10x64vs2019cuda11.7+cudnn8.8.0
TensorRT
-8.6.1.6opencvsharp==4.9.0.NETFramework4.7.2NVIDIAGeForceRTX2070Super
FL1623863129
·
2025-02-17 23:55
深度学习
c#
YOLO
目标检测
hunyuan-DiT
模型部署
指南
1.部署ComfyUI本篇的
模型部署
是在ComfyUI的基础上进行,如果没有部署过ComfyUI,请按照下面流程先进行部署,如已安装
算家云
·
2025-02-17 05:12
模型构建
ComfyUI
图片生成
大模型
人工智能
pytorch
AIGC
解决Deepseek服务器繁忙的两种高效方案:本地部署与平替平台实测
方案一:本地化部署核心优势说白了就是
模型部署
在自己本地,只有自己一个人用了没人挤了,但是对电脑硬件要求高部署步骤详解环境准备系统要求:Linux/Windows10+(推荐Ubuntu20.04)硬件配置
小真—
·
2025-02-16 18:52
自然语言处理
ai
人工智能
《DeepSeek Janus Pro 7B:多模态人工智能大
模型部署
全攻略》
《DeepSeekJanusPro7B:多模态人工智能大
模型部署
全攻略》引言:开启多模态AI新世界在科技飞速发展的当下,多模态AI已成为人工智能领域中最耀眼的明星,正以前所未有的速度改变着我们的生活与工作方式
空云风语
·
2025-02-16 03:57
神经网络
人工智能
深度学习
人工智能
数据驱动的DevOps,MLOps工具链初现端倪
DevOps,MLOps,数据驱动,工具链,自动化,持续交付,
模型部署
,模型监控1.背景介绍在当今以数据为中心的时代,软件开发和机器学习模型的部署和维护日益复杂。
AI架构设计之禅
·
2025-02-16 03:53
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
c++加载
TensorRT
调用深度学习模型方法
使用
TensorRT
来调用训练好的模型并输出结果是一个高效的推理过程,特别是在需要低延迟和高吞吐量的应用场景中。以下是一个基本的步骤指南,展示了如何在C++中使用
TensorRT
进行推理。
feibaoqq
·
2025-02-15 13:35
深度学习
深度学习
YOLO
tensorrt
推理 onxx转engine代码(python),cyclegan网络推理(python、C++)
将onnx文件导出为engine,FP16格式import
tensorrt
astrtimportpycuda.driverascudaimportpycuda.autoinit#加载ONNX文件onnx_file_path
maobin_1
·
2025-02-14 10:04
python
c++
模型实战(19)之 从头搭建yolov9环境+
tensorrt
部署+CUDA前处理 -> 实现目标检测
从头搭建yolov9环境+
tensorrt
部署实现目标检测yolov9虚拟环境搭建实现训练、推理与导出导出onnx并转为
tensorrt
模型Python\C++-trt实现推理,CUDA实现图像前处理文中将给出详细实现源码
明月醉窗台
·
2025-02-14 09:59
#
深度学习实战例程
目标检测
人工智能
计算机视觉
图像处理
YOLO
模型应用管理的成功之道:策略、工具与团队协作
2.
模型部署
●
·
2025-02-13 11:28
项目管理工具
Deep Seek大
模型部署
到本地 详细教程
以下是将DeepSeek大
模型部署
到本地开发环境的详细教程,分为多个步骤,包含技术细节和注意事项:步骤1:环境准备硬件要求GPU:推荐NVIDIAGPU(至少16GB显存,如RTX3090/4090或A100
Katie。
·
2025-02-12 11:40
人工智能
AI编程
ai
pytorch深度学习模型推理和部署、pytorch&ONNX&
tensorRT
模型转换以及python和C++版本部署
目录1.采用pytorch进行推理2.采用onnx进行推理2.1pytorch转换为onnx2.2onnx推理3.采用
tensorrt
进行推理(python环境)3.1onnx转engine文件3.2
tensorrt
机械心
·
2025-02-12 10:40
深度学习
python
pytorch
昇腾,Ascend,NPU,mindie,镜像,部署vllm:第4篇,尝试多模态大
模型部署
(Qwen2-vl)
文章目录前言下载模型前言一直想部署一个多模态大模型,今天就以Qwen2-vl为例尝试一番吧。(当然是在昇腾环境下)提示:需要把这篇文章先看一遍昇腾,mindie,镜像,部署vllm:第2篇,启动mindieservice_daemon服务,支持对Qwen2.5的7B版本的推理提示:本文章的撰写思路是,按照一个思路进行部署,报错,并反思,并解决。所以不太适合直接上来就跟着一步一步做。建议看完全文,再
几道之旅
·
2025-02-12 10:36
Dify:智能体(Agent)
工作流
知识库
全搞定
Agent)
人工智能
【大
模型部署
及其应用 】Ollama搭建运行中文大语音模型Llama3-8B-Chinese-Chat
Ollama是一种用于运行大语言模型(如LLaMA)的平台,适合本地化部署和运行。以下是如何在Ollama上搭建和运行中文大语言模型Llama3-8B-Chinese-Chat的步骤:下载地址:https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat-GGUF-8bit项目地址:https://github.com/ymcui/Chine
源代码杀手
·
2025-02-11 18:34
AIGC核心技术剖析
人工智能
深度学习
llama
人工智能在制造业的具体应用案例-总纲
实时预测:将
模型部署
到C
局外人_Jia
·
2025-02-11 09:05
人工智能
c#
大数据
2025年Python领域最新国际动态与技术趋势解析(截至2025年2月)
一、AI与Python的深度融合:从
模型部署
到开发工具OpenAI与谷歌的模型竞赛OpenAI近期推出的免费推理模型o3-mini在数学代码生成和物理模拟领域表现突出,尤其在Python生态中,开发者可通过
虫洞没有虫
·
2025-02-11 08:57
Python资讯
python
开发语言
【Windows/C++/yolo开发部署03】将实例分割模型ONNX导出为
TensorRT
引擎:完整记录
【完整项目下载地址】:【
TensorRT
部署YOLO项目:实例分割+目标检测】+【C++和python两种方式】+【支持linux和windows】资源-CSDN文库目录写在前面环境准备1.使用trtexec
认识祂
·
2025-02-09 13:42
CV计算机视觉
Ultralytics
yolo
实例分割
模型部署
大数据集群Spark-on-Yarn+Paddle深度学习
模型部署
背景:因数据量较大,想要将
模型部署
到大数据集群上进行计算。
jqtree
·
2025-02-08 19:32
#
大数据开发
大数据
spark
paddle
本地部署DeepSeek-R1模型用于企业生产环境:基于Xinference
而非Ollama如何安装和配置Xinference如何下载DeepSeek-R1-Distill-Qwen-7B模型如何在Xinference中运行DeepSeek-R1-Distill-Qwen-7B
模型部署
成功后
MaxCode-1
·
2025-02-08 06:50
搭建本地gpt
人工智能
大模型实战篇之Deepseek二、一键部署DeepSeek-V3和DeepSeek-R1模型
然而,传统的
模型部署
流程往往复杂且耗时。今天,我们将详细介绍如何在阿里云PAIModelGallery上通过零代码的方式一键部署DeepSeek-V3和De
伯牙碎琴
·
2025-02-07 19:44
大模型
Deepseek
AI
大模型
Java 大数据
模型部署
与运维:生产环境的挑战与应对(43)
亲爱的朋友们,热烈欢迎你们来到青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客,正是这样一个温暖美好的所在。在这里,你们不仅能够收获既富有趣味又极为实用的内容知识,还可以毫无拘束地畅所欲言,尽情分享自己独特的见解。我真诚地期待着你们的到来,愿我们能在这片小小的天地里共同成长,共同进步。一、本博客的精华专栏:
青云交
·
2025-02-06 18:57
大数据新视界
Java
大视界
模型部署
运维
生产环境
环境一致性
性能优化
分布式部署
大数据
java
开源数据分析工具 RapidMiner
以下是对RapidMiner的深度介绍:1.概述RapidMiner是一款开源且全面的端到端数据科学平台,支持从数据准备、机器学习、预测分析到
模型部署
的整个工作流程。
kcarly
·
2025-02-06 08:21
大数据治理与分析
开源
数据分析
数据挖掘
TensorRT
-LLM保姆级教程(一)-快速入门
本系列将针对
TensorRT
-LLM推理进行讲解。本文为该系列第一篇,将简要概述
TensorRT
-LLM的基本特性。另外,我撰写的大模型相关的博客及配套代码均整理放置在Github:llm-act
大模型部署
·
2025-02-05 18:38
人工智能
transformer
产品经理
自然语言处理
kubernetes
大模型
LLM
使用Ollama本地化部署DeepSeek
1、Ollama简介Ollama是一个开源的本地化大
模型部署
工具,旨在简化大型语言模型(LLM)的安装、运行和管理。
·
2025-02-05 02:15
大模型llm人工智能
LLM大
模型部署
实战指南:部署简化流程
LLM大
模型部署
实战指南:Ollama简化流程,OpenLLM灵活部署,LocalAI本地优化,Dify赋能应用开发1.Ollama部署的本地模型()Ollama是一个开源框架,专为在本地机器上便捷部署和运行大型语言模型
汀、人工智能
·
2025-02-04 13:00
LLM工业级落地实践
AI
Agent
人工智能
深度学习框架PyTorch原理与实践
作者:禅与计算机程序设计艺术文章目录1.简介2.背景介绍3.基本概念和术语3.1PyTorch简介3.2PyTorch的特点1)自动求导机制2)GPU加速3)
模型部署
4)数据管道5)代码阅读友好4.核心算法原理
AI天才研究院
·
2025-02-04 07:47
AI实战
大数据
人工智能
语言模型
Java
Python
架构设计
AI大
模型部署
:Ollama与vLLM部署对比:哪个更合适?
前言近年来,大语言模型(LLM)的应用日益广泛,而高效的部署方案至关重要。Ollama和vLLM作为两种流行的LLM部署工具,各有优劣。本文将深入比较Ollama和vLLM的部署方式,帮助选择最合适的方案。Ollama:简单易用的LLM部署工具Ollama以其简洁的安装和易于使用的特性而闻名。其官方文档清晰易懂,即使是新手也能快速上手。Ollama支持多种LLM模型,并提供便捷的命令行界面进行管理
大模型部署
·
2025-02-02 21:11
langchain
人工智能
docker
llama
LLM
程序员
Ollama
ONNX推理warning:
TensorRT
does not natively support INT64. Attempting to cast down to INT32.
只想用ONNX进行模型推理,加载时报Warning,加载模型时间也特别长。加载模型的代码:self.session=onnxruntime.InferenceSession(model_path,providers=onnxruntime.get_available_providers())修改为:self.session=onnxruntime.InferenceSession(model_pa
paradoxjun
·
2025-02-02 18:48
人工智能
DeepSeek R1 Ollama本地化部署全攻略:三步实现企业级私有化大
模型部署
前言Ollama作为当前最受欢迎的本地大模型运行框架,为DeepSeekR1的私有化部署提供了便捷高效的解决方案。本文将深入讲解如何将HuggingFace格式的DeepSeekR1模型转换为Ollama支持的GGUF格式,并实现企业级的高可用部署方案。文章包含完整的量化配置、API服务集成和性能优化技巧。—一、基础环境搭建1.1系统环境要求操作系统:Ubuntu22.04LTS或CentOS8+
Coderabo
·
2025-02-02 00:45
DeepSeek
R1
Ollama
使用Ollama本地化部署DeepSeek
1、Ollama简介Ollama是一个开源的本地化大
模型部署
工具,旨在简化大型语言模型(LLM)的安装、运行和管理。
·
2025-02-01 16:48
大模型llm人工智能
通过
TenSorRT
转换后的engine引擎文件进行验证的脚本
YOLOv8算法验证pt文件的精度脚本一般都很常见,工程项目里面一般会有importwarningswarnings.filterwarnings('ignore')fromultralyticsimportYOLOif__name__=='__main__':model=YOLO('/best.pt')#权重文件路径model.val(data='/data.yaml',#yaml文件路径spl
薇憨
·
2025-02-01 03:28
深度学习-硬件篇
嵌入式硬件
mcu
python
书生浦语第五期
基础作业完成以下任务,并将实现过程记录截图:配置lmdeploy运行环境下载internlm-chat-1.8b模型以命令行方式与模型对话视频链接文档链接基础知识学习
模型部署
在软件工程中,部署通常指的是将开发完毕的软件投入使用的过程
晴斋1216
·
2025-01-31 06:27
语言模型
LLM
模型部署
经验分享
LLM
模型部署
经验分享作者:大连理工大学李凯首先,你需要选择一个合适的部署平台,这可以是本地服务器、云服务提供商(如AWS、Azure、GoogleCloud等)、边缘设备或者特定的部署服务(如HuggingFaceHub
lewis_kai
·
2025-01-31 06:56
阿里云
语言模型
Torchserve服务开发
handler开发1.1.1.context参数1.1.2.data参数1.2.handler调试2.配置文件3.batch推理0.Torchserve介绍0.1.背景TorchServe是PyTorch中推荐的
模型部署
解决方案
qq_27844739
·
2025-01-30 04:26
AI工程化运维
人工智能
pytorch
服务器
大
模型部署
工具 llama.cpp 介绍与安装使用
1.大
模型部署
工具llama.cpp大模型的研究分为训练和推理两个部分。训练的过程,实际上就是在寻找模型参数,使得模型的损失函数最小化,推理结果最优化的过程。
大模型柳儿
·
2025-01-29 18:03
llama
服务器
人工智能
web安全
linux
安全
LLM架构与优化:从理论到实践的关键技术
架构与优化:从理论到实践的关键技术”文章信息摘要:文章探讨了大型语言模型(LLM)开发与应用中的关键技术,包括Transformer架构、注意力机制、采样技术、Tokenization等基础理论,以及
模型部署
XianxinMao
·
2025-01-28 20:14
人工智能
【
TensorRT
】引用了NvInferRuntimeCommon.h仍然报找不到ILogger
如果编译遇到error:‘ILogger’innamespace‘nvinfer1’doesnotnameatype或者error:‘nvinfer1::ILogger’hasnotbeendeclared可能需要显式的添加#include"NvInfer.h"即只includeNvInferRuntimeCommon.h是不够的。
TechBoL
·
2025-01-27 19:46
人工智能
nvdia triton server运行pt文件
tritonserver默认都是
tensorrt
推理。但也会出现有操作不支持,导致无法转模型为engine的情况。可以选择直接运行pytorch的pt文件,以下为操作步骤。
滑稽的柴犬
·
2025-01-26 23:27
神经网络
机器学习
python
InternLM: LMDeploy 量化部署进阶实践
LMDeploy部署模型
模型部署
是将训练好的深度学习模型在特定环境中运行。欢迎使用LMDeploy,支持市面上主流的格式和算法。
dilvx
·
2025-01-25 06:42
机器学习
NVIDIA-
TensorRT
-Python推理
1,前言NVIDIA
TensorRT
进行模型推理的Python实现。
TensorRT
是一个高性能的深度学习推理优化器和运行时,它能够为深度学习模型提供低延迟和高吞吐量的推理能力。
呆呆珝
·
2025-01-25 05:07
推理框架
python
人工智能
开发语言
导出 YOLOv11 模型的详细步骤和说明
以下是关于如何导出YOLOv11模型的详细步骤和说明:1.导出YOLOv11模型的基本步骤YOLOv11模型可以通过Ultralytics提供的接口轻松导出为多种格式,如ONNX、
TensorRT
、CoreML
old_power
·
2025-01-23 19:14
计算机视觉
YOLO
人工智能
计算机视觉
【CUDA-BEVFusion】tool/build_trt_engine.sh 文件解读
exitfi#
tensorrt
version#version=`trtexec|grep-m1
TensorRT
|sed-n"s
old_power
·
2025-01-23 18:37
计算机视觉
计算机视觉
深度学习
SGLang安装教程,部署你的大模型,性能比vllm好,实现张量并行,数据并行,加快推理速度,亲测效果好。
目前大
模型部署
工具主要是vllm,最近出现了SGLang,很多新开源大模型都支持SGLang的部署推理,例如deepseek-R1,Qwen2.5,Mistral,GLM-4,MiniCPM3,InternLM2
张登杰踩
·
2025-01-23 17:03
人工智能
结对编程
python
LLM大
模型部署
实战指南:部署简化流程
LLM大
模型部署
实战指南:Ollama简化流程,OpenLLM灵活部署,LocalAI本地优化,Dify赋能应用开发1.Ollama部署的本地模型()Ollama是一个开源框架,专为在本地机器上便捷部署和运行大型语言模型
汀、人工智能
·
2025-01-23 05:28
AI
Agent
LLM工业级落地实践
人工智能
YOLOv11目标检测
模型部署
到微信小程序上
1.效果YOLOv11目标检测
模型部署
到微信小程序上2.后端主要代码importosimporttimeimportnumpyasnpimporttorchfromflaskimportFlask,request
小阿技术
·
2025-01-23 00:17
YOLO
目标跟踪
人工智能
微信小程序
目标检测
计算机视觉
python
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他