E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
onnx推理
白话DeepSeek-R1论文(三)| DeepSeek-R1蒸馏技术:让小模型“继承”大模型的
推理
超能力
DeepSeek-R1蒸馏技术:让小模型“继承”大模型的
推理
超能力当大模型成为“老师”,小模型也能变“学霸”想象一下,一位经验丰富的数学老师(大模型)将自己解题的思维过程一步步拆解,手把手教给学生(小模型
明哲AI
·
2025-02-02 11:58
AIGC
人工智能
机器学习
深度学习
大模型
Deepseek
算法
蒸馏
开源LLMs导览:工作原理、顶级LLM列表对比
2.1预训练2.2代币化2.3开源LLM的微调2.4输入编码2.5训练与优化2.6
推理
三、开源LLM对组织的好处3.1增强的数据安全和隐私3.2节约成本3.3减少供应商依赖性3.4代码透明度四、哪种LLM
万俟淋曦
·
2025-02-01 23:11
Some
Insights
人工智能
AI
生成式人工智能
大模型
LLM
chatgpt
大语言模型
看深度求索如何思索自己的未来
其公布的训练效率提升数据(30%时间缩短、50%
推理
加速)若经第三方验证,可能重构行业技术标准。对比谷歌TPU+JAX框架实现的20%效率提升,深度求索的技
tuan_zhang
·
2025-02-01 19:11
东方艾艾与探宇计划
绝密芯片计划
战略欺骗
太空探索
人工智能
算法攻坚
工业软件
本地部署 DeepSeek 模型并使用 WebUI 调用
环境准备在开始之前,请确保你的系统满足以下要求:Python3.11或更高版本pip包管理工具DeepSeek模型的本地部署文件GPU支持(可选,用于加速模型
推理
)步骤1:本地部署Deep
我喜欢就喜欢
·
2025-02-01 17:22
技术文档
策略模式
DeepSeek R1 简易指南:架构、培训、本地部署和硬件要求
CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读DeepSeek团队近期发布的DeepSeek-R1技术论文展示了其在增强大语言模型
推理
能力方面的创新实践。
·
2025-02-01 16:49
前端javascript
如何在本地电脑上安装和使用 DeepSeek R-1
一些用户声称,其
推理
能力与OpenAI的o1相当,甚至更好。目前,DeepSeek是免费使用的,这对用户来说是个好消息,但也带来了一些疑问。随着用户量的激增,他们如何管理服务器成本?
知识大胖
·
2025-02-01 15:33
NVIDIA
GPU和大语言模型开发教程
电脑
AI 计算的未来:去中心化浪潮与全球竞争格局重塑
引言人工智能(AI)正以前所未有的速度发展,尤其是大模型训练和
推理
效率的提升,使得AI计算成本迅速下降,呈现出向去中心化演进的趋势。
智识微光Intelligence
·
2025-02-01 09:16
人工智能
机器学习
大数据
什么是知识蒸馏技术?
知识蒸馏(KnowledgeDistillation)是一种模型压缩和加速技术,旨在将大型模型(通常称为教师模型)所学到的知识迁移到小型模型(通常称为学生模型)中,从而让小型模型在减少计算资源消耗和
推理
时间的同时
deepdata_cn
·
2025-02-01 09:41
垂域模型
机器学习
人工智能
知识蒸馏
从 0 到 1,DEEPseek 大模型瞬间 “霸榜” AI 赛道的秘密
deepseek官网传送门:DeepSeek下面就对本文标题来剖析一下:目录一·本篇背景:二.技术实力:突破创新的基石:2.1强大的模型能力:2.1.1高效的训练方法:2.2.2优化的
推理
速度:三·市场策略
羑悻的小杀马特.
·
2025-02-01 08:36
人工智能
deepseek
AI大模型
「DeepSeek接班OpenAI」,最新开源的R1
推理
模型,让AI圈爆了
来源:前沿科技分享圈近日,AI领域迎来了一次重大突破,DeepSeek正式推出了其最新研发的开源
推理
模型——DeepSeek-R1。
人工智能学家
·
2025-02-01 06:23
人工智能
DeepSeek R1:AI领域的新标杆
此外,R1-Zero模型通过强化学习和测试时计算实现了强大的
推理
能力,无需监督微调数据,标志着中国在AI领域的快速崛起,挑战美国的主导地位。AI模型在
推理
能
XianxinMao
·
2025-02-01 06:23
人工智能
模型高效
推理
--剪枝基础
文章目录一、剪枝基础1.剪枝定义2.剪枝时机二、剪枝的分类1.按照剪枝粒度分类(粗➡️细)A.结构化剪枝a.隐藏层剪枝(LayerPruning)b.通道剪枝(ChannelPruning)c.卷积核剪枝(KernelPruning)B.非结构化剪枝a.核内权重剪枝(IntraKernelWeightPruning)b.单个权重剪枝(WeightPruning)C.特殊情况a.Token剪枝(To
绒绒毛毛雨
·
2025-02-01 05:16
大模型算法
剪枝
深度学习
人工智能
用engine引擎文件在Jetson上面进行
推理
(YOLOv8)
1.pt文件,
推理
在Jetson上可以通过predict.py脚本用.pt权重文件进行
推理
脚本如下:importwarningswarnings.filterwarnings('ignore')fromultralyticsimportYOLOif
薇憨
·
2025-02-01 03:29
深度学习-硬件篇
YOLO
python
pycharm
深度学习
pytorch
嵌入式硬件
AI Agent 指南:架构、构建与部署
它犹如一位智能助手,凭借独立
推理
、规划及自主行动能力,在无需用户持续干预的情况下,精准达成既定目标。
大模型之路
·
2025-02-01 01:06
Agent
人工智能
架构
agent
LLM
AI
Agent
AI计算的未来:中心化与去中心化的博弈
最新发布的DeepSeekr1模型,以远低于传统大模型的成本实现了相当水平的
推理
能力,甚至能够在工作站上本地运行。一次突破AI计算正在经历从中心化(云计算)到去中心化(本地
推理
)的重大转变。
智识微光Intelligence
·
2025-01-31 23:51
人工智能
去中心化
区块链
DeepSeek 推出全新
推理
模型 R1-Lite 预览版
DeepSeek全新研发的
推理
模型预览版DeepSeek-R1-Lite现已正式上线网页版。R1系列模型采用强化学习训练,
推理
过程中包含大量反思和验证,思维链长度可达数万字。
三花AI
·
2025-01-31 22:47
三花AI
人工智能
DeepSeek-V3 技术报告
为了实现高效的
推理
和经济高效的训练,DeepSeek-V3采用了多头潜在注意力(MLA)和DeepSeekMoE架构,这些架构在DeepSeek-V2中得到了充分验证。
mingo_敏
·
2025-01-31 20:01
LLM
深度学习
人工智能
DeepSeek-R1:多模态AGI的实践突破与场景革命
一、DeepSeek-R1的核心定位DeepSeek-R1是深度求索(DeepSeek)研发的多模态通用人工智能模型,旨在突破单一模态的局限性,实现文本、图像、语音、视频等跨模态信息的深度理解、
推理
与生成
热爱分享的博士僧
·
2025-01-31 14:09
agi
DeepSeek R1与OpenAI o1深度对比
文章目录引言技术原理DeepSeekR1OpenAIo1性能表现官方数据
推理
任务知识密集型任务通用能力价格对比应用场景科研与技术开发自然语言处理(NLP)企业智能化升级教育与培训数据分析与智能决策部署与集成
码事漫谈
·
2025-01-31 13:01
AI
人工智能
机器学习
本地部署 DeepSeek-R1 大模型
它是一款专注于数学、代码和自然语言
推理
任务的高性能AI
推理
模型。许多用户希望能在本地环境中自由操作这些强大的模型,因为这不仅关乎数据隐私,还能满足定制化部署的需求。这
网络安全我来了
·
2025-01-31 13:57
人工智能
AI
人工智能
简述Caffe、TensorFlow、TensorFlow Lite、
ONNX
、DarkNet、PyTorch 等模型
以下是对Caffe、TensorFlow、TensorFlowLite、
ONNX
、DarkNet和PyTorch等模型的简述:Caffe:Caffe(ConvolutionArchitectureForFeatureExtraction
科学的发展-只不过是读大自然写的代码
·
2025-01-31 12:21
断纱检测
caffe
tensorflow
pytorch
A Survey on Large Language Model Acceleration based on KV Cache Management
基于KV缓存管理的大型语言模型加速研究综述摘要1引言2前言3分类4token级优化5模型级优化6系统级优化7文本和多模态数据集8结论摘要大型语言模型(LLM)因其理解上下文和执行逻辑
推理
的能力,彻底改变了自然语言处理
UnknownBody
·
2025-01-31 12:47
LLM
Daily
Survey
Paper
LLM
Inference
语言模型
人工智能
自然语言处理
MindIE Service整体介绍&快速上手
整体介绍是什么架构介绍MindIEService的安装部署安装部署MindIEService快速上手接口调用精度测试性能测试服务停止MindIEService整体介绍是什么MindIEService是面向通用模型场景的
推理
服务化框架
cc_beolus
·
2025-01-31 11:41
python
人工智能
五类
推理
(逻辑
推理
、概率
推理
、图
推理
、基于深度学习的
推理
)的开源库 (一)
在开发中,有一些开源库可以实现不同类型的
推理
,包括逻辑
推理
、概率
推理
、图
推理
、基于深度学习的
推理
等。
由数入道
·
2025-01-31 09:23
深度学习
开源
人工智能
Deepseek两项关键发现:无需人类专家介入SFT、有自己
ARCPrize基金会对DeepSeek发布的R1-Zero和R1“
推理
”系统的分析。ARCPrize基金是谁?ARCPrize基金会旨在定义、衡量并激励新的AGI(通用人工智能)想法。
极道Jdon
·
2025-01-31 08:13
javascript
reactjs
论文笔记(七十)DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning(二)
IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning(二)文章概括摘要:2.方法2.3.DeepSeek-R1:冷启动强化学习2.3.1.冷启动2.3.2.面向
推理
的强化学习
墨绿色的摆渡人
·
2025-01-31 07:01
文章
论文阅读
DeepSeek-V3模型:软件测试智能化的新篇章与挑战
最近,DeepSeekAI公司推出的DeepSeek-V3模型,凭借其卓越的文本处理能力、高效的
推理
速度以及多任务处理能力,为软件测试行业带来了一场前所未有的智能化变革。
霍格沃兹测试开发学社测试人社区
·
2025-01-31 05:18
测试开发
软件测试
人工智能
使用Ollama和Open WebUI快速玩转大模型:简单快捷的尝试各种llm大模型,比如DeepSeek r1
Ollama本身就是非常优秀的大模型管理和
推理
组件,再使用OpenWebUI更加如虎添翼!
skywalk8163
·
2025-01-31 04:38
人工智能
人工智能
ollama
DeepSeek
我把DeepSeek-R1
推理
能力知识蒸馏到Qwen2,效果真的炸裂!!!
我把DeepSeek-R1
推理
能力知识蒸馏到Qwen2,效果真的炸裂!!!
AI生成曾小健
·
2025-01-31 03:00
自然语言处理
人工智能
Lite.Ai.ToolKit - 一个轻量级的 C++ 工具包
请参阅ModelZoo和
ONNX
Hub、MNNHub、TNNHub、NCNNHub。
小众AI
·
2025-01-31 00:06
AI开源
开源
人工智能
AI编程
算法
Ubuntu交叉编译 arm板子上的TVM
python安装测试是否安装成功可以在安装一些库,用于RPCTracker和auto-tuning交叉编译801arm的TVM交叉编译链下载配置config.cmake编译源码编译的时候可能会遇到错误
ONNX
陈有爱
·
2025-01-30 19:54
TVM
ubuntu
人工智能
Spring AI 在微服务中的应用:支持分布式 AI
推理
1.引言在现代企业中,微服务架构已成为开发复杂系统的主流方式,而AI模型
推理
也越来越多地被集成到业务流程中。
drebander
·
2025-01-30 18:16
AI
编程
springAI
LoongServe论文解读:prefill/decode分离、弹性并行、零KV Cache迁移
LoongServe:EfficientlyServingLong-contextLargeLanguageModelswithElasticSequenceParallelism论文提出了一种支持弹性分配的
推理
框架
04290629
·
2025-01-30 18:13
LLM笔记
transformer
人工智能
算法
深度学习
vLLM源码之分离式架构
一、vLLM分离式架构概述1.基本概念vLLM是一个用于高效地服务大语言模型(LLM)
推理
的库。其分离式架构是一种创新的设计理念,旨在优化LLM的运行效率。
Bj陈默
·
2025-01-30 17:38
架构
使用Python实现文本自动摘要
其中抽取式摘要是从原文中选择一定比例的句子拼凑成一个摘要,而生成式摘要是通过对原文进行解析、理解、
推理
等方式生成摘要。下面我们将介绍如何使用Pyth
UIEdit
·
2025-01-30 17:08
python
人工智能
开发语言
【llm对话系统】大模型 RAG 之回答生成:融合检索信息,生成精准答案
这个过程不仅仅是简单的文本拼接,更需要LLM对检索结果进行理解、
推理
和整合,才能输出准确、流畅且符合用户需求的答案。
kakaZhui
·
2025-01-30 10:09
人工智能
AIGC
chatgpt
llama
大模型问答机器人的智能化程度
大模型、问答机器人、智能化程度、自然语言处理、深度学习、Transformer模型、知识图谱、
推理
能力、对话系统1.背景介绍近年来,人工智能技术取得了飞速发展,特别是深度学习的兴起,为自然语言处理(NLP
AI大模型应用之禅
·
2025-01-30 09:35
AI大模型与大数据
java
python
javascript
kotlin
golang
架构
人工智能
有道子曰
推理
模型“子曰-o1”发布即开源,14B小参数复现OpenAI o1强
推理
效果
根据我搜索到的资料,网易有道于2025年1月22日正式发布了国内首个输出分步式讲解的
推理
模型“子曰-o1”,并宣布其开源。
百态老人
·
2025-01-30 08:55
笔记
子曰-o1:网易有道开源国内首个分步式讲解
推理
模型,支持K12数学教学
微信公众号|搜一搜:蚝油菜花快速阅读功能:子曰-o1是国内首个分步式讲解
推理
模型,支持K12数学教学。技术:采用14B轻量级架构,专为消费级显卡设计,能在低显存设备上稳定运行。
蚝油菜花
·
2025-01-30 08:52
每日
AI
项目与应用实例
人工智能
开源
网易有道开源 “子曰 - o1”
推理
模型
网易有道开源的“子曰-o1”
推理
模型支持消费级显卡,主要通过以下技术实现:轻量级模型设计:“子曰-o1”采用14B参数规模,相比许多对硬件配置要求高的大型
推理
模型,选择了较小的参数规模,从基础上降低了对硬件的性能需求
timer_017
·
2025-01-30 07:19
开源
Hugging Face挑战DeepSeek,AI开源竞赛升级!
订阅:https://rengongzhineng.io/DeepSeek的R1
推理
模型刚刚引发全球轰动,开源AI界的“顶流”HuggingFac
新加坡内哥谈技术
·
2025-01-30 05:03
人工智能
深度学习
语言模型
学习
Torchserve服务开发
Torchserve介绍0.1.背景0.2.API类型1.开发使用1.0.环境部署1.1.handler开发1.1.1.context参数1.1.2.data参数1.2.handler调试2.配置文件3.batch
推理
qq_27844739
·
2025-01-30 04:26
AI工程化运维
人工智能
pytorch
服务器
TorchServe环境构建+模型更新+新模型注册
2.1jdk环境搭建2.2python环境搭建2.3启动服务2.3.1注册模型2.3.2模型查看2.3.3接口调用3进阶功能3.1模型多版本管理3.2新模型注册1.背景由于技术路线调整,需求调整原本的模型
推理
服务
有来有去9527
·
2025-01-30 04:53
torch
深度学习
人工智能
DeepSeek简介
作为国内首个全面对标GPT-4技术架构的AI大模型,DeepSeek系列涵盖从7B到超千亿参数的完整模型矩阵,在数学
推理
、代码生成、多轮对话等核心能力上达到国际领先水平。
RobinDevNotes
·
2025-01-29 20:52
人工智能
逆向工程入门 (二):获取评论/点赞微博的 API
根据我在其中详述的过滤POST方法来抓包互动请求的API接口,可以较容易地
推理
出评论/点赞微博的API接口。
dreadp
·
2025-01-29 18:05
前端
web安全
网络协议
数据分析
wireshark
大模型部署工具 llama.cpp 介绍与安装使用
1.大模型部署工具llama.cpp大模型的研究分为训练和
推理
两个部分。训练的过程,实际上就是在寻找模型参数,使得模型的损失函数最小化,
推理
结果最优化的过程。
大模型柳儿
·
2025-01-29 18:03
llama
服务器
人工智能
web安全
linux
安全
Llama.cpp与Python的完美结合:快速入门指南
本文将介绍如何在Python中使用llama-cpp-python,并结合LangChain框架进行
推理
操作。通过本指南,您将逐步掌握如何安装、配置和使用Llama模型。
nseejrukjhad
·
2025-01-29 17:29
llama
python
开发语言
火出圈的DeepSeeK R1详解
模型特性DeepSeek-R1是一款创新的AI
推理
模型,具有多项独特特性:高性能
推理
能力:在数学、代码和自然语言
推理
等任务上表现出色,性能对标OpenAIo1正式版。
清风AI
·
2025-01-29 17:58
深度学习
人工智能
神经网络
python
计算机视觉
conda
实时数据处理与模型
推理
:利用 Spring AI 实现对数据的
推理
与分析
通过集成SpringAI,我们不仅可以高效地获取实时数据,还可以将这些数据输入到AI模型中进行
推理
与分析,以便生成实时的业务洞察。
drebander
·
2025-01-29 11:54
AI
编程
spring
人工智能
为大模型提供webui界面的利器:Open WebUI 完全本地离线部署deepseek r1
它支持各种LLM运行程序,如Ollama和OpenAI兼容的API,内置RAG
推理
引擎,使其成为一个强大的AI部署解决方案。安装使用pip进行安装:pipinstallopen-w
skywalk8163
·
2025-01-29 11:53
人工智能
人工智能
deepseek
webui
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他