E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
概念图推理
覆盖数学/代码/科学/谜题,高质量
推理
数据集汇总,助力复现 DeepSeek 超强
推理
能力
近期,DeepSeek-R1引发的
推理
模型热潮仍在持续走高——1月31日,OpenAI推出全新
推理
模型o3-mini;2月18日,xAI推出Grok3,包含具备
推理
能力的Grok-3ReasoningBeta
·
2025-03-06 14:22
hyperai
深度学习模型未来可能会在这些领域取得突破性进展
潜在突破:更强的
推理
和抽象能力,解决复杂问题。结合多模态数据(文本、图像、声音等)实现更全面的理解。自我学习和适应能力,减少对大量标注数据的依赖。
xinxiyinhe
·
2025-03-06 13:55
人工智能
深度学习
人工智能
深度学习模型
深度学习
大模型的实践应用30-大模型训练和
推理
中分布式核心技术的应用
大家好,我是微学AI,今天给大家介绍一下大模型的实践应用30-大模型训练和
推理
中分布式核心技术的应用。本文深入探讨了大模型训练和
推理
中分布式核心技术的应用。
微学AI
·
2025-03-06 11:11
大模型的实践应用
分布式
人工智能
大模型
【AI大模型应用开发】【LangChain系列】5. 实战LangChain的智能体Agents模块
在我前面的MetaGPT系列文章中,已经对智能体有了一个认知,重温一下:智能体=LLM+观察+思考+行动+记忆将大语言模型作为一个
推理
引擎。
同学小张
·
2025-03-06 10:03
大模型
人工智能
langchain
python
笔记
agi
gpt
AI-native
【无标题】大模型智能涌现的数学本质与底层机制
语言建模的数学基础大模型的核心任务是基于概率链式法则建模语言序列:P(w1,...,wn)=∏t=1nP(wt∣w10^{11})时出现能力相变相变示例:参数量级涌现能力数学机制10^9基础语法低维流形建模10^11多步
推理
高维空间路径积分
调皮的芋头
·
2025-03-06 07:09
AI编程
神经网络
人工智能
机器学习
AIGC
自然语言模型(NLP)介绍
例如,DeepSeek通过强化学习提升
推理
能力,其混合专家架构(MoE)显著优化了计算效率。二、核心技术解析1.DeepSeek模型架构混合专家模型(MoE):DeepSeek-V3采用Mo
Liudef06
·
2025-03-06 04:11
Stable
Diffusion
自然语言处理
人工智能
阿里巴巴宣布:全面开源旗下视频生成模型万相2.1
据介绍,此次开源基于Apache2.0协议,14B和1.3B两个参数规格的全部
推理
代码和权重全部开源,同时支持文生视频和图生视频任务,全球开发者可在Github、HuggingFace和魔搭社区下载体验
大公产经晚间消息
·
2025-03-06 04:10
娱乐
社交电子
媒体
INA(In-Network Aggregation)技术
In-NetworkAggregation(网络内聚合)是大模型分布式训练或
推理
中优化通信效率的一种技术,核心思想是在网络传输路径中直接完成数据聚合,而非依赖终端节点处理,从而降低通信开销、提升整体效率
一只积极向上的小咸鱼
·
2025-03-06 01:22
人工智能
AI 自动剪视频神器,小白也能轻松上手!
✨软件介绍易剪媒是一款纯净无广告的AI自动剪视频工具,基于DeepSeek对话式AI技术(DS-V3模型)进行分析
推理
。只需根据描述的要求以处理命令的形式交给AI,即可自动输出视频。
6v6-博客
·
2025-03-06 01:50
人工智能
Search-o1:智体搜索增强的大型
推理
模型
大型
推理
模型(LRM)(例如OpenAI-o1)已通过大规模强化学习展示长步
推理
能力。然而,它们的扩展
推理
过程通常会受到知识不足的影响,从而导致频繁出现不确定性和潜在错误。
三谷秋水
·
2025-03-05 22:53
机器学习
大模型
人工智能
人工智能
深度学习
机器学习
一次性了解OpenAI的“草莓”(Strawberry)超强实力
OpenAI预计在秋季推出的代号为“草莓”(Strawberry)的新AI模型,是其在AI
推理
领域的一项重要突破。该项目的成功也将为人类实现通用人工智能(AGI)目标迈出重要一步。
金融街小单纯
·
2025-03-05 22:51
预测模型
生成式人工智能
人工智能
C++使用Onnxruntime/TensorRT模型
推理
onnxruntime和tensorrt是我们常用的两种
推理
方式,下面整理了两个
推理
示例,仅供参考。
奇华智能
·
2025-03-05 16:30
AI
c++
开发语言
人工智能
AI
计算机视觉
基于K8S设计实现机器学习管理调度平台
设计和实现一套基于Kubernetes(K8s)的机器学习管理调度平台,目标是利用K8s的容器化和调度能力,提供高效的资源管理、任务调度、可扩展性及灵活性,适应机器学习(ML)训练、
推理
等不同场景的需求
richenlin
·
2025-03-05 15:56
机器学习
一文看懂 DeepSeek 版本全解析
一)DeepSeek-V1:初露锋芒(二)DeepSeek-V2系列:性能进阶(三)DeepSeek-V2.5系列:能力提升(四)DeepSeek-V3系列:卓越性能(五)DeepSeek-R1系列:
推理
强者三
奔跑吧邓邓子
·
2025-03-05 13:03
项目实战
人工智能
deepseek
版本
DeepSeek 各版本的区别
训练数据:14.8万亿Token预训练,
推理
速度较快(每秒
dushky
·
2025-03-05 12:25
ai
语言模型
AI编程
Efficient Large Language Models: A Survey
高效的大型语言模型综述摘要1引言2模型为中心的方法3数据为中心的方法4LLM框架5结论摘要大型语言模型(LLM)在自然语言理解、语言生成和复杂
推理
等重要任务中表现出了非凡的能力,并有可能对我们的社会产生重大影响
UnknownBody
·
2025-03-05 09:00
Survey
Paper
语言模型
人工智能
自然语言处理
pytorch 模型测试
在使用PyTorch进行模型测试时,一般包含加载测试数据、加载训练好的模型、进行
推理
以及评估模型性能等步骤。以下为你详细介绍每个步骤及对应的代码示例。
小赖同学啊
·
2025-03-05 07:24
人工智能
pytorch
人工智能
python
2025年初-值得关注的几款
推理
模型
1Claude3.7SonnetClaude3.7Sonnet是由AI研究公司Anthropic开发的最新混合
推理
模型,于2025年2月24日发布。
数据分析能量站
·
2025-03-05 01:24
机器学习
人工智能
大语言模型原理与工程实践:大语言模型
推理
工程
推理
加速:算子优化
其中,
推理
(Inference)过程是大语言模型的核心环节之一。然而,随着模型规模的不断扩大,
推理
过程中的计算复杂度和延时也逐渐成为制约模型应用的重要因素。
AI天才研究院
·
2025-03-04 22:32
计算
DeepSeek
R1
&
大数据AI人工智能大模型
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
大模型
推理
速度测评的实战代码
今天给大家带来的文章是大模型
推理
速度测评的实战代码,希望能对学习大模型的同学们有所帮助
herosunly
·
2025-03-04 21:59
大模型
推理速度
人工智能
实战代码
AI边缘处理设备怎么合理分配宽带和运行资源
边缘设备通常面临有限的资源,但需要处理大量的数据流和计算任务,尤其是在AI
推理
和实时数据处理的场景下。
码农的日常搅屎棍
·
2025-03-04 19:42
嵌入式硬件
深度学习
神经网络
Deepseek的底层架构思维构成
通过低秩联合压缩技术,将键(Key)和值(Value)矩阵压缩到潜在空间,显著减少
推理
时的显存占用。例如,MLA可将显存需求降至传统多头注意力(MHA)的个位数百分比。
堕落年代
·
2025-03-04 19:09
AI
架构
人工智能
蚂蚁技术研究院发布
推理
大模型强化学习框架,邀请开发者共同助力 AGI 生态
AReaL源自开源项目ReaLHF,旨在训练每个人都可以复现和贡献的大型
推理
模型(LRM)。AReaL是蚂蚁技术研究院为开发一个完全开放和包容的AGI世界迈出的一步。
·
2025-03-04 10:52
开源开源项目介绍
北大版,86页DeepSeek黑科技手册!比清华版更炸裂(免费下载)
这份文档刚在学术圈炸锅,作为国内首个系统性拆解
推理
大模型(DeepSeek-R1)落地方案的公开资料,其价值不仅在于揭示了一款国产模型的工程实践,更折射出大模型技术从实验室走向产业化的关键路径。
2501_90850230
·
2025-03-04 09:55
素材资源
人工智能
DeepSeek
科技
人工智能
按键精灵找图的原理及影响找图效率的因素
以下是对该原理的详细解释:一、图像像素点的基本
概念图
像是由一个个颜色块组成的,这些颜色块非常小,通常看不出有明显的分块界限。这些带有颜色的小方块就是图像的像素点。
学自动化的小白
·
2025-03-04 07:43
计算机视觉
图像处理
人工智能
小白也能十分钟打造自己的
推理
大模型!unsloth+Colab+DeepSeek-R1-Distill-Llama-8B轻松上手
小白也能十分钟打造自己的
推理
大模型!
AI超元域
·
2025-03-04 07:08
sql
llama
数据库
ai
人工智能
AI编程
私有部署 ChatGLM3-6B
1.在AutoDL平台上租赁GPUGPU型号:RTX4090PyTorch版本:2.5.1**(推荐使用2.0及以上的版本,以获得最佳的
推理
性能)**2.开启学术资源加速source/etc/network_turbo3
张申傲
·
2025-03-04 03:16
langchain
人工智能
aigc
chatgpt
ai
DeepSeek-OpenSourceWeek-第六天-Inference System Overview
开源周的第6天,DeepSeek对DeepSeek-V3/R1
推理
系统进行了深入概述。本文将深入探讨该系统的设计原则、优化策略以及性能统计数据,重点突出在吞吐量和延迟优化方面取得的显著进展。
数据分析能量站
·
2025-03-04 01:57
机器学习
人工智能
DeepSeek-R1:通过强化学习激励大型语言模型的
推理
能力
摘要我们介绍了第一代
推理
模型DeepSeek-R1-Zero和DeepSeek-R1。
AI专题精讲
·
2025-03-03 22:05
大模型专题系列
语言模型
人工智能
自然语言处理
清华「DeepSeek从入门到精通」正式发布!104页超全解析使用教程
还有些用的是chatGPT的训练方式,要知道,DeepSeek和chatGPT是两种模型,一个是
推理
型,一个是指令型,这是驴唇不对马嘴啊。
职场程序猿
·
2025-03-03 18:28
deepseek
ai
数据挖掘与数据分析的区别是什么
从分析的过程来看,数据分析更侧重于统计学上面的一些方法,经过人的
推理
演译得到结论;数据挖掘更侧
中琛源科技
·
2025-03-03 17:24
GPT-4.5
通过扩展无监督学习,GPT-4.5增强了识别模式、建立联系和创造性洞察的能力,尽管它并不是专门为
推理
任务设计的。早期测试者表示,与GPT-4.5交互的
开发者每周简报
·
2025-03-03 15:38
人工智能
本地部署大语言模型-DeepSeek
DeepSeek是国内顶尖AI团队「深度求索」开发的多模态大模型,具备数学
推理
、代码生成等深度能力,堪称"AI界的六边形战士"。
NightReader
·
2025-03-03 15:36
语言模型
人工智能
自然语言处理
DeepSeek-R1 技术报告解读:用强化学习激发大模型的
推理
潜能
文章目录1.背景2.DeepSeek-R1训练流程2.1DeepSeek-R1-Zero:纯强化学习2.2DeepSeek-R1:冷启动+多阶段训练3.蒸馏小模型3.1蒸馏流程与优势3.2蒸馏vs.直接RL4.实验结果4.1主模型表现4.2蒸馏模型表现5.关键创新与思考6.总结参考链接**导读:**DeepSeek-R1是近期发布的一款开源大模型,它将纯强化学习与多阶段训练策略相结合,大幅提升了模
跑起来总会有风
·
2025-03-03 14:04
ai
AI编程
论文阅读
让 DeepSeek 更“聪明”:一键解析 PDF 和 Word 文档的 GUI 小工具,轻松处理复杂文档
DeepSeek-r1:1.5b是一款强大的语言模型,能够根据输入的自然语言进行
推理
和生成,但其原生本地部署环境并不支持直接上传文档进行解析。
Python测试之道
·
2025-03-03 12:10
测试提效
python
python
人工智能
测试用例
在 MacBook 上设置 DeepSeek R1 (8B) 的 3 个步骤
简介DeepSeek最近发布了R1模型,该模型在本地AI
推理
方面表现出色。如果您希望在MacBook上运行它,Ollama提供了一种无缝的方式来下载和管理模型。
知识大胖
·
2025-03-03 11:04
NVIDIA
GPU和大语言模型开发教程
deepseek
ollama
openwebui
测试工程师必备!多格式接口用例结合deepseek生成工具完整实现与实战验证
为了解决这一问题,本文将实现一款基于PyQt5的多格式接口用例生成工具,支持从文档导入到解析、
推理
生成、导出等全流程功能。
Python测试之道
·
2025-03-03 10:00
python
测试提效
python
deepseek
YOLO 中 SPFF 模块的优化与 Focal Modulation 替代研究
FocalModulation替换SPPF4.实验与对比分析4.1代码替换YOLO模型中的SPPF4.2训练对比5.AblationStudy(消融实验)5.1不同模块的对比实验5.2目标尺寸对比分析6.模型部署与
推理
优化
向哆哆
·
2025-03-03 10:57
YOLO
yolov8
DeepSeek-R1:重新定义
推理
性能的开源人工智能
挑战与未来方向影响与愿景2025年1月20日–DeepSeek推出了DeepSeek-R1,这是一款突破性的开源人工智能
推理
模型,旨在与OpenAI的o1等专有对手竞争。该模型在M
知识小报童
·
2025-03-03 08:11
DeepSeek前言内容整理
开源
人工智能
深度学习
机器学习
神经网络
自然语言处理
语言模型
本地部署 DeepSeek-R1-671B 满血版大模型
DeepSeek-R1大模型具备深度思考和
推理
能力,在数学、代码、自然语言
推理
等任务上都有着极大的提升。
Physicaloser
·
2025-03-03 07:05
人工智能
人工智能
语言模型
ai
超越GPT-4o!开源大模型DeepSeek满血版部署实战指南
自2024年12月DeepSeek发布对标GPT-4o的v3版本以来,其数学与代码
推理
能力已实现显著超越;而2025年1月推出的r1版本更是在多项基准测试中与GPT-4o的o1版本平分秋色。
剑圣土豆
·
2025-03-03 07:34
大模型部署
开源
自然语言处理
人工智能
Svelte 开发 AI 应用:高效轻量级前端框架的 AI 集成探索
本文将探讨如何利用Svelte构建高效的AI应用,包括AIAPI集成、前端
推理
优化、可视化分析、Web组件开发等关键
赵大仁
·
2025-03-03 06:57
大语言模型
前端
AI
人工智能
前端框架
DeepSeek R1:揭示适度思考在信息处理中的关键作用
摘要DeepSeekR1是一款先进的大型
推理
模型,研究发现其在信息过载时性能显著下降。当减少过度思考,即不过度分析信息时,DeepSeekR1的计算成本可降低43%。
耶耶Norsea
·
2025-03-03 05:21
网络杂烩
人工智能
大模型隐空间
推理
论文阅读笔记
TrainingLargeLanguageModelstoReasoninaContinuousLatentSpace一.简介机构:Meta代码:任务:特点:方法:1.1摘要现状:大语言模型往往局限在“languagespace"进行
推理
猴猴猪猪
·
2025-03-03 03:57
AIGC
python
实验记录
人工智能
深度学习
《AI大模型开发笔记》DeepSeek技术创新点
革命性的上下文处理机制实现长文本
推理
成本断崖式下降,综合算力需求锐减90%,开启高效AI新纪元!
Richard Chijq
·
2025-03-03 03:57
AI大模型开发笔记
人工智能
笔记
【AI大模型应用开发】精读ToT:论文到源码,看透ToT思维树的实现流程
上篇文章(【AI大模型应用开发】从CoT到ToT,再到ReAct,提升大模型
推理
能力的方式探索(含代码))我们学习了当下提高大模型
推理
能力的几个主要技术,从CoT(ChainofThought)到TOT
同学小张
·
2025-03-03 02:24
大模型
笔记
经验分享
人工智能
AIGC
思维树
大模型
如何掌握deepseek的
推理
思路:3个高级AI指令技巧,小白也能轻松上手!
不是新模型发布,也不是算力升级,而是Deepseek——这类AI学会像人类一样
推理
。但是有时候,Deepseek的
推理
你会觉得还不够?
小机学AI大模型
·
2025-03-03 01:13
小机带您AI入门(提示词)
人工智能
全民AI入门清华大学 deepseek 从入门到精通 pdf 免费下载
•DeepSeek-R1是其开源的
推理
模型,擅长处理复杂任务且可免费商用。下载地址:链接:https://pan.quark.cn/s/b2e0b986332a提取码:4XNy
宇飞林海
·
2025-03-02 23:30
人工智能
pdf
小白也能十分钟打造自己的
推理
大模型!unsloth+Colab轻松上手
简介:DeepSeek-R1-Distill-Llama-8B是一个基于Llama架构的8B参数语言模型,经过深度蒸馏(distillation)处理,旨在提高
推理
效率和精度。
X.Cristiano
·
2025-03-02 23:28
DeepSeek-R1
Llama-8B
sql2text
人工智能
北京大学:2本手册,拓展AI应用深度与广度
深入剖析DeepSeek-R1在复杂逻辑
推理
、数学和编程任务中的优异表现,揭示其在
推理
密集型任务、教育、科研、知识应用和文档分析等领域的独特优势,为AIGC领域的从业者和爱好者提供了深入了解DeepSeek
2501_90766876
·
2025-03-02 21:48
pdf
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他