E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
概念图推理
2025,AI变现有哪些机遇与挑战?
大模型的能力边界在不断拓宽,主流云端大模型普遍具备了多模态
推理
能力。技术路线上,也不再局限于算力堆叠,而是探索强化学习、符号
推理
、类脑计算等新路径。
Imagination官方博客
·
2025-02-27 19:41
人工智能
DeepSeek开源周合集
,核心成就:GPU带宽利用接近理论极限,算力利用效率翻倍;周二:DeepEP,一个高效的MOE架构专家并行通信库:支持高效且优化后的全对全通信使用NVlink和RDMA进行节点内和节点间通信用于训练和
推理
填充的高吞吐量内核用于
推理
解码的低延迟内核原生支持
Vip.Gong
·
2025-02-27 14:03
人工智能
transformer
chatgpt
文心一言
python
scikit-learn
深度学习
深度学习模型大小与模型
推理
速度的探讨
**昨天看到了非常好的两篇文章想在此记录和保存,由于模型的实时
推理
包含很多方面的因素,因而也庆幸能有机会看到这样的文章。
ICUD
·
2025-02-27 09:01
深度学习
人工智能
python
AI 平台技术架构设计方案
二、设计目标高效性:确保在训练和
推理
过程中能够充分利用计算资源,快速处理大量数据,缩短训练时间和
推理
延迟。灵活性:支持多种AI框架、算法和模型,能够适应不同的业务场景和需求变化。
数研妙手
·
2025-02-27 03:11
AI技术实践
人工智能
泛微全面接入DeepSeek大模型,助力组织升级数智化应用场景
在接入DeepSeek大模型后,泛微将借助DeepSeek强大的自然语言处理、机器学习、
推理
等能力,显著提升泛微各项产品
泛微OA办公系统
·
2025-02-27 03:10
泛微
DeepSeek
读心术思维导图
读心术思维导图把自己变成他人贴近对方的肢体行为模仿姿势延迟动作不要过于精确模仿对方的声音模仿面部表情同样的速度和节奏配合对方的精神状态注意对方的精力值,让精力充沛起来的练习言行一致,情绪状态看懂他人,语言、思维方式视觉记忆视觉记忆听觉记忆动觉记忆EAC模型视觉创建视觉回忆听觉创建听觉回忆动觉记忆自言自语(内在的
推理
者
胡西风_foxww
·
2025-02-27 00:15
#
思维导图
读心术
思维导图
模板
markdown
云上玩转DeepSeek系列之五:实测优化16%, 体验FlashMLA加速DeepSeek-V2-Lite
推理
2月25日,DeepSeek-AI面向社区开源了其技术成果FlashMLA(https://github.com/deepseek-ai/FlashMLA),这是一个面向
推理
优化的高效多层注意力(Multi-HeadLatentAttention
·
2025-02-27 00:41
deepseekllm人工智能
深入解析 DeepSeek R1:强化学习如何驱动大模型
推理
能力的进化
引言在AI竞赛日益激烈的时代,DeepSeek-AI推出了DeepSeekR1,试图以强化学习(RL)直接训练
推理
能力,而非仅依赖传统的监督微调(SFT)。
海棠AI实验室
·
2025-02-26 23:07
智元启示录
人工智能
deep
learning
DeepSeek-R1
YOLO11的单独
推理
程序
YOLO11的单独
推理
程序,可以实例化加载一次多次
推理
。YOLO11的单独
推理
程序,可以实例化加载一次多次
推理
。YOLO11的单独
推理
程序,可以实例化加载一次多次
推理
。
AIOT魔法师
·
2025-02-26 23:02
YOLOv5和YOLOv11
python
开发语言
GGUF 文件格式全解析
GGUF(GGMLUniversalFormat)作为一种新兴的二进制文件格式,旨在解决传统GGML及其衍生格式(如GGMF和GGJT)的局限性,为模型
推理
提供更高效、更灵活的解决方案。
Just_Paranoid
·
2025-02-26 22:25
技术流Clip
LLM
GGUF
量化
DeepSeek
技术硬核:突出FP8、3倍速度、90%成本暴降等技术参数,强化可信度
DeepSeek近期开源项目详细分析1.FlashMLA:大模型
推理
效率革命技术特点:首个开源项目FlashMLA是针对英伟达Hopper架构GPU(如H800)优化的高效多头潜在注意力(MLA)解码内核
guzhoumingyue
·
2025-02-26 20:45
AI
python
DeepSeek-V3:最强开源MoE模型的技术解析与使用指南
追求极致的训练效率后训练:从DeepSeek-R1进行知识蒸馏模型下载评估结果基础模型标准基准测试上下文窗口聊天模型标准基准测试(大于67B的模型)开放式生成评估如何使用在线聊天与API平台本地运行指南模型权重转换
推理
示例使用
认识祂
·
2025-02-26 19:10
deepseek
开源
deepseek
AI岗位面试指南:高频文档问题解析与应答策略
应答框架:背景与目标:"项目源于客户需要将文本生成延迟从2秒压缩至800ms以内,同时保证BLEU分数不低于0.82"技术创新点:"采用知识蒸馏+动态量化方案,设计分层注意力裁剪策略"量化成果:"
推理
速度提升
阿三0812
·
2025-02-26 19:07
ai
人工智能
面试
全面分析 DeepSeek 的新开源 FlashMLA
这一进展对于大型语言模型(LLM)来说意义重大,因为大型语言模型在
推理
过程中面临内存和计算方面的挑战,尤其是长序列。
X.Cristiano
·
2025-02-26 19:34
FlashMLA
深度学习
人工智能
支持 40+ 插件,Spring AI Alibaba 简化智能体私有数据集成
RAG通过结合检索技术和生成模型的强大能力,使智能体能够实时从外部数据源获取信息,并在生成过程中增强其知识深度和
推理
能力。通过这种方式,智能体不仅能依赖于模型的预
·
2025-02-26 19:58
云原生
云原生周刊:云原生和 AI
FlashMLA是专为NVIDIAHopper架构GPU(如H100、H800)优化的高效多头潜在注意力(MLA)解码内核,旨在提升大模型
推理
性能,特别是针对可变长度序列进行了优化。
·
2025-02-26 19:58
云计算
DeepSeep开源周,第三天:DeepGEMM是啥?
矩阵乘法(GEMM)是深度学习模型的核心运算(如全连接层、卷积层等),其性能直接影响训练和
推理
效率。
程序员差不多先生
·
2025-02-26 19:33
pytorch
推荐:LangChain — 构建情境感知
推理
应用的利器
推荐:LangChain—构建情境感知
推理
应用的利器langchain⚡BuildingapplicationswithLLMsthroughcomposability⚡项目地址:https://gitcode.com
成婕秀Timothy
·
2025-02-26 19:33
DeepSeek 开源周:DeepEP 项目详解,GPU 压榨计划启动!
本文将详细介绍DeepEP的功能、应用场景以及如何使用它来提升AI训练和
推理
的效率。DeepEP概述功能与作用DeepEP是一个专门针对Mixture-of-Experts(
东方佑
·
2025-02-26 18:29
量子变法
开源
serverless framework 模块化部署
serverless/components源码食用本文使用的示例代码Forkedfromsecond-state/tencent-tensorflow-scf这个仓库可以直接部署成一个Serverless的AI
推理
函数
ice breaker
·
2025-02-26 17:27
Serverless
nodejs
serverless
framework
serverless
ChatGPT版本差异分析大全
o1系列(o1-preview/o1-mini)仅支持纯文本处理,但专注于深度
推理
和分析。GPT-3.5是早期版本,仅支持文本,且性能和上下文理解能力较弱。
爱吃青菜的大力水手
·
2025-02-26 17:26
chatgpt
人工智能
DeepSeek各模型现有版本对比分析
文章目录一、基础模型系列:V1到V3的演进二、专用模型系列:
推理
与多模态三、版本选型与商业化趋势DeepSeek作为最近特别火爆的模型,本文将对DeepSeek现有的主要版本进行对比分析,涵盖参数规模、
墨染夜雨笺
·
2025-02-26 17:22
DeepSeek
AI
DeepSeek 智慧城市应用:交通流量预测(918)
**摘要:**本文探讨了利用DeepSeek技术框架解决城市交通流量预测问题的方法,主要内容包括基于时空图卷积网络(ST-GCN)的预测模型、多传感器数据融合策略以及实时
推理
API服务的搭建,旨在为智慧城市的交通管理提供高效
web13508588635
·
2025-02-26 16:18
面试
学习路线
阿里巴巴
智慧城市
人工智能
使用 LangChain 与 Solar LLM 的快速集成示例
一、技术背景介绍LangChain是一个强大的框架,它可以帮助开发者轻松集成不同的自然语言处理(NLP)模型,并构建复杂的链式
推理
任务。SolarLL
qahaj
·
2025-02-26 16:15
langchain
python
开发语言
使用 Apache Jena 构建 RDF 数据处理与查询服务
本文将通过一个示例项目,展示如何使用ApacheJena实现RDF数据的加载、查询、
推理
、插入和更新操作。二、项目概述本项目的目标是使用Apa
梦落青云
·
2025-02-26 13:23
apache
知识图谱
人工智能
深度求索DeepSeek:AI大模型的全域应用与技术突破
其基于DeepSeek-R1系列大模型的创新架构,以600万美元的超低训练成本(仅为OpenAI同类模型的1/30)3,在自然语言处理、逻辑
推理
、多模
量子纠缠BUG
·
2025-02-26 11:11
DeepSeek部署
DeepSeek
AI
人工智能
easyui
前端
解读 DeepSeek 关键 RL 算法 GRPO
大家不难发现,无论是复杂的自然语言处理任务,还是充满挑战的智能
推理
难题,DeepSeek都能展现出卓越的性能。而这斐然成绩的背后
进一步有进一步的欢喜
·
2025-02-26 08:16
LLM
算法
DeepSeek
GRPO
【形式化】Coq 中的函数式编程基础(长文)
程序与简单数学对象之间的直接联系,既支持形式化的正确性证明,也有助于对程序行为进行合理的非正式
推理
。函数式编程“函数式”的另一层含义是,它强调将函数作为一等
老猿讲编程
·
2025-02-26 08:45
形式化验证
算法
coq
形式化验证
Qwen2.5 技术报告
在预训练方面,将高质量的预训练数据集从之前的7万亿个token扩展到18万亿个token,为常识、专家知识和
推理
能力提供坚实的基础。在后训练方面,用超过100万个样本
三谷秋水
·
2025-02-26 07:11
大模型
机器学习
人工智能
语言模型
机器学习
人工智能
爆发的AI智能体(4):智能体构建与开发
智能体可以被看作是一个系统,它能够感知环境,拥有一定的
推理
能力,并能根据这些信息做出决策和行动。智能体的基本架构通常包括感知模块、
推理
模块和行动模块。
caridle
·
2025-02-26 06:36
人工智能
DeepSeek的开源之路:一文读懂从V1-R1的技术发展,见证从开源新秀到
推理
革命的领跑者
作者:京东科技蔡欣彤一、引言:AI时代的挑战与DeepSeek的崛起在大模型时代,AI技术的飞速发展带来了前所未有的机遇,但也伴随着巨大的挑战。随着模型规模的不断扩大,算力需求呈指数级增长,训练成本飙升,而性能提升的边际收益却逐渐递减,形成了所谓的“ScalingLaw”瓶颈。与此同时,OpenAI、谷歌等巨头通过闭源策略垄断技术,限制了中小企业和研究机构的参与空间。在这样的背景下,DeepSee
·
2025-02-26 05:05
算法
【RAG系列】文字的数字化分身 - 向量嵌入的魔法世界
文字的数字化分身-向量嵌入的魔法世界文字向量编码器数字分身语义空间相似度计算代数运算关系
推理
一、认知革命:文字的数字基因工程1.1文字GPS坐标系想象每个词语都是银河系中的星球,向量坐标就是它们的星际坐标
什么都想学的阿超
·
2025-02-26 04:52
原理概念
#
深度学习
深度学习
人工智能
RAG
DeepSeek技术系列之解析DeepSeek蒸馏技术
大模型落地之痛当前千亿级大模型面临严峻的部署困境:GPT-4级模型的单次
推理
成本高达0.01美元,而工业场景往往要求响应速度<200ms。
小叔技研社
·
2025-02-26 02:37
AIGC
人工智能
深入探索 llama-cpp-python:在 LangChain 中启用本地 LLM
推理
Llama.cpp是一个用于
推理
许多LLM模型的开源库,它的Python绑定——llama-cpp-python提供了在Python中更加便捷的接口。
aehrutktrjk
·
2025-02-26 02:06
llama
python
langchain
GLake:优化GPU内存管理与IO传输的开源项目
GLake:突破GPU内存和IO瓶颈的利器在人工智能快速发展的今天,大模型训练和
推理
正面临着严峻的挑战。
2401_87458718
·
2025-02-26 02:35
开源
DeepSeek技术解析:降本增效的“双刃剑”如何重塑AI产业?
正面影响分析算力需求与成本大幅降低DeepSeek通过算法优化(如稀疏计算、知识蒸馏)和模型压缩技术,将云端训练算力需求降至传统大模型的35%,车端
推理
芯片需求减少至65%。
爱吃青菜的大力水手
·
2025-02-26 01:29
人工智能
突破性能极限:DeepSeek开源FlashMLA解码内核技术解析
引言:大模型时代的
推理
加速革命在生成式AI大行其道的今天,如何提升大语言模型的
推理
效率已成为行业焦点。
Shockang
·
2025-02-25 22:09
DeepSeek
DeepSeek
技术前沿
Python与DeepSeek的深度互联:从开发加速到全栈赋能的实战指南
在AI重构编程范式的2025年,DeepSeek凭借其轻量化、高效
推理
与垂直领域优化,成为开发者提升生产力的利器。
夏末之花
·
2025-02-25 18:07
python
开发语言
图的存储方式(上)
文章目录图的相关
概念图
的类型图的常见存储方式边集数组邻接矩阵邻接表图的相关概念对于图的相关概念实在太多,请移步,【图论】图的概念和基本术语(顶点、边、度、路径等)图的类型按照类型对图进行分类可以分为以下几种
2402_87224981
·
2025-02-25 17:04
数据结构
算法
数据结构
图论
MoBA:LLM长文本救星!月之暗面开源新一代注意力机制:处理1000万token能快16倍,已在Kimi上进行验证
Moonshot突破性方案:千万token
推理
速度提升16倍!」大家好,我是蚝油菜花。当同行还在为以下问题头疼时——32k上下文跑批处
蚝油菜花
·
2025-02-25 15:53
人工智能
开源
人工智能开源
【多语言生态篇三】【DeepSeek×Go:高并发
推理
服务设计】
第一章:项目背景与选型考量1.1DeepSeek
推理
服务的业务挑战日均请求量突破1.2亿次(峰值QPS达38万)典型请求特征:50ms超时限制|10KB输入+2KB响应流量特征:工作日周期性波动(早10
再见孙悟空_
·
2025-02-25 14:11
「2025
DeepSeek技术全景实战」
人工智能
深度学习
DeepSeek
DeepSeek
GO
DeepSeek
高并发
DeepSeek
推理服务
DeepSeek
服务设计
Deepseek 手搓资源全集
DeepSeek基本信息2025年1月20日,杭州深度求索人工智能基础技术研究有限公司发布高性能AI
推理
模型DeepSeek-R1,对标OpenAI的o1正式版。
赤胜骄阳
·
2025-02-25 14:09
大模型
知识库
人工智能
deepseek
DeepSeek预测2030年:全球 50% 的白领工作将由 AI Agent 辅助完成,金融、医疗等专业渗透率超 70%
:一、人工智能技术的革命性突破低成本高性能模型的普及DeepSeek-R1等国产大模型通过混合专家架构(MoE)和算法优化,以OpenAI1/70的训练成本实现同等性能,推动AI开发从“重训练”向“重
推理
未来AI编程
·
2025-02-25 13:03
DeepSeek入门到精通
人工智能
金融
使用 DistilBERT 进行资源高效的自然语言处理
DistilBERT通过缩小模型规模并加快
推理
速度来解决这
真智AI
·
2025-02-25 06:43
自然语言处理
人工智能
联邦学习与边缘模型优化赋能医疗诊断新路径
与此同时,边缘计算节点部署将模型
推理
能力延伸至诊疗终端,CT影像实时分析响应时间缩短62%,显著提升急诊场景下的决策效率。建议医疗机构在部署联邦学习系统时,优先采用差分隐私与同态
智能计算研究中心
·
2025-02-25 03:26
其他
DeepSeek高能AI:低成本高效应用突破
该系统整合自然语言处理与视觉语言理解的双通道架构,使文本生成、图像解析和跨模态
推理
形成协同效应。
智能计算研究中心
·
2025-02-25 03:25
其他
Ollama Open WebUI
OpenWebUI支持多种语言模型运行器(如Ollama和OpenAI兼容API),并内置了用于检索增强生成(RAG)的
推理
引擎,使其成为强大的AI部署解决方案。
alden_ygq
·
2025-02-25 03:51
#
大模型运维基础工具
人工智能
还不会用DeepSeek?看这篇就懂啦
它开源的
推理
模型DeepSeek-R1非常厉害,性能和OpenAI-o1正式版相当,而且可以免费商用
t0_54coder
·
2025-02-25 02:17
【AI】人工智能实用技术
人工智能
部署 Llama 3.1 405B:分步指南,深入研究 Llama 最新模型 Llama 3.1 4050 亿参数模型的部署。这个强大的模型需要大量的 VRAM,特别是 4 位量化版本需要 231 G
推荐文章《使用DSPy、Qdrant和Llama3对复杂问题进行多跳检索和
推理
,利用DSPy的无提示框架进行复杂的LLM
知识大胖
·
2025-02-25 02:47
NVIDIA
GPU和大语言模型开发教程
llama
ai
轻量级网络设计原理与代码实战案例讲解
然而,大规模模型在计算资源、存储空间以及
推理
速度方面提出了更高的要求,这在移动设备、嵌入式系统等资源受限的环境中尤为明显。为了解决这一问题,轻量级网络设计应运而生。1.2研
AI天才研究院
·
2025-02-25 00:00
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
计算
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他