E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
图谱推理
主流开源大模型能力对比矩阵
模型名称核心优势主要局限Llama2/3✅多语言生态完善✅Rotary位置编码✅GQA
推理
加速⚠️数据时效性差⚠️隐私保护不足Qwen✅千亿参数规模✅中文语境优化✅复杂文本生成⚠️需高性能硬件⚠️领域知识需二次训练
时光旅人01号
·
2025-03-16 12:09
人工智能
开源
python
深度学习
pytorch
AGI的学习与适应能力
与狭义人工智能(NarrowAI)专注于特定领域和特定任务不同,AGI旨在模拟人类整体认知能力,包括感知、
推理
、学习、计划、创造力和自我意识等。1.2AGI的重要性和
AGI大模型与大数据研究院
·
2025-03-16 08:14
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
基于 KTransformers的DeepSeek-R1 本地部署方案,成本骤降32倍!
本文将深入探讨DeepSeek-R1部署中的挑战,并介绍一款创新框架KTransformers,它能够显著降低大规模模型部署的成本并提高
推理
效率,从而帮助更多中小企业有效部署此类高级AI模型。
爱科技Ai
·
2025-03-16 07:38
LLM
人工智能
程序员必看!DeepSeek全栈开发指南:从代码生成到分布式训练的黑科技解析
一、DeepSeek技术新突破:程序员必须掌握的MoE架构实战2025年2月25日,DeepSeek开源了专为MoE模型设计的DeepEP通信库,这项技术革新直接影响了分布式训练和
推理
效率。
AI创享派
·
2025-03-16 06:00
后端
【奇点时刻】通义千问开源QwQ-32B技术洞察报告(扫盲帖)
本报告将从模型背景与定位、核心技术、性能表现与对比、部署与使用方式,以及未来潜力与可能的影响五个维度,帮助读者更好地了解这一新兴且备受瞩目的开源
推理
模型。
碣石潇湘无限路
·
2025-03-16 03:37
开源
人工智能
TensorRT-LLM保姆级教程-快速入门
随着大模型的爆火,投入到生产环境的模型参数量规模也变得越来越大(从数十亿参数到千亿参数规模),从而导致大模型的
推理
成本急剧增加。
大模型八哥
·
2025-03-16 02:34
笔记
agi
ai
大模型
ai大模型
LLM
Transformer
rapidocr-onnxruntime库及在open-webui上传PDF 图像处理 (使用 OCR)应用
背景rapidocr-onnxruntime是一个跨平台的OCR库,基于ONNXRuntime
推理
框架。目前已知运行速度最快、支持最广,完全开源免费并支持离线快速部署的多平台多语言OCR。
原野AI
·
2025-03-16 02:31
大模型部署
pdf
ocr
深度学习
open-webui
NPU的应用场景:从云端到边缘
NPU的应用场景非常广泛,主要包括以下几个方面:1.云计算与数据中心AI
推理
服务:在云端提供高效的AI
推理
服务,例如图像识别、语音识别。
绿算技术
·
2025-03-16 02:29
NPU架构介绍
缓存
人工智能
科技
深度学习
模型可解释性:基于因果
推理
的反事实生成与决策可视化
1.技术原理与数学公式1.1因果
推理
基础结构方程模型(SEM):X=fX(PaX,UX)X=f_X(Pa_X,U_X)X=fX(PaX,UX)其中PaXPa_XPaX为父节点集合,UXU_XUX为外生变量反事实定义
燃灯工作室
·
2025-03-15 23:43
Ai
人工智能
数学建模
学习
机器学习
推理
流水线DAG调度:多模型组合执行优化方案
一、技术原理与数学模型1.1DAG调度核心公式设
推理
流水线由n个模型节点组成,定义:V={v1,v2,...,vn}V=\{v_1,v_2,...,v_n\}V={v1,v2,...,vn}为节点集合E
燃灯工作室
·
2025-03-15 23:12
Ai
人工智能
数学建模
学习
机器学习
计算机视觉
Crawl4AI 与 BrowserUseTool 的详细对比
技术实现、适用场景等核心维度:1.核心定位对比工具Crawl4AIBrowserUseTool类型专为AI优化的网络爬虫框架浏览器自动化工具(模拟人类操作浏览器)核心目标高效获取结构化数据供AI训练/
推理
处理需要浏览器交互的动态网页任务典型应用大规模数据抓取
燃灯工作室
·
2025-03-15 23:42
Lmplement
人工智能
学习
数学建模
基于时间序列预测的
推理
服务弹性扩缩容实战指南:(行业案例+数学推导+源码解析)
技术原理(数学公式)整体架构请求量预测→扩缩容决策→资源配置动态调整三阶段闭环,周期为5-30分钟核心预测模型(时间序列预测)LSTM预测公式(CSDN兼容格式):$$h_t=\text{LSTM}(x_t,h_{t-1})\\\hat{y}_{t+1}=W_h\cdoth_t+b_h$$其中Wh∈Rd×1W_h\in\mathbb{R}^{d\times1}Wh∈Rd×1为权重矩阵,ddd为隐藏
燃灯工作室
·
2025-03-15 23:12
Ai
计算机视觉
语音识别
目标检测
机器学习
人工智能
向量存储与检索器
它们对于应用程序来说非常重要,这些应用程序需要获取数据以作为模型
推理
的一部分进行
推理
,就像检索增强生成(
小码农0912
·
2025-03-15 22:05
AI应用开发
向量存储与检索器
向量存储
检索器
langchain
《今日AI-人工智能-编程日报》-源自2025年2月28日
技术突破OpenAI发布GPT-4.5:OpenAI正式推出新一代大模型GPT-4.5,语言理解、情商及逻辑
推理
能力显著增强,幻觉问题大幅减少,计算效率较GPT-4提升超10倍,已逐步向用户开放试用。
小亦编辑部
·
2025-03-15 22:59
每日AI-人工智能-编程日报
人工智能
OpenCV 深度学习模块 cv2.dnn 与其他深度学习框架的优缺点对比及适用场景
OpenCV提供了一个深度学习模块cv2.dnn,让开发者能够在计算机视觉项目中轻松加载和
推理
深度学习模型。
白.夜
·
2025-03-15 21:26
深度学习
opencv
深度学习中的 blob 格式:与普通 image 的区别及转换原因
在深度学习模型
推理
过程中,我们经常会用到cv2.dnn.blobFromImage函数将普通图像转换为blob格式。那么,blob格式到底是什么?它和普通image有什么区别?
白.夜
·
2025-03-15 21:25
深度学习
人工智能
DeepSeek多语言智能创作引擎解析
尤为突出的是,其分层参数激活策略将
推理
成本降低至传统密集模型的38%,同时维持了95%以上的任务完成精度。行业分析机构
智能计算研究中心
·
2025-03-15 20:22
其他
python 基于混合式推荐算法的学术论文投稿系统
基于混合式推荐算法的学术论文投稿系统是一个结合多种推荐技术(如基于内容的推荐、协同过滤、知识
图谱
等)来为研究者推荐合适期刊或会议投稿的系统。以下是实现该系统的关键步骤和Python代码示例。
mosquito_lover1
·
2025-03-15 17:25
python
知识图谱
模型的秘密武器:利用注意力改善长上下文
推理
能力
【导语】在大语言模型(LLM)不断刷新各项任务记录的今天,很多模型宣称能处理超长上下文内容,但在实际
推理
过程中,复杂问题往往因隐性事实的遗漏而败下阵来。
步子哥
·
2025-03-15 16:51
人工智能
自然语言处理
深度学习
语言模型
大型语言模型与强化学习的融合:迈向通用人工智能的新范式——基于基础复现的实验平台构建
1.引言大型语言模型(LLM)在自然语言处理领域的突破,展现了强大的知识存储、
推理
和生成能力,为人工智能带来了新的可能性。
(initial)
·
2025-03-15 16:17
大模型科普
人工智能
强化学习
模型量化 (Model Quantization) 算法 (Model Quantization Algorithms)
1模型量化的必要性:降低模型大小、加速
推理
、减少资源消耗随着深度学习模型的日益复杂和庞大,其在资源受限的设备(如移动端、嵌入式设备)上的部署面临着巨大的挑战。
(initial)
·
2025-03-15 13:24
大模型科普
算法
人工智能
量化
解码数字基因:数据架构如何重塑企业核心竞争力?——全面解析数据架构的战略价值与实践路径
摘要:数据架构作为企业数字化转型的“基因
图谱
”,通过整合业务需求与IT实现,构建起数据流动的规则体系。
领码科技
·
2025-03-15 07:01
产业篇
央国企
技能篇
数据架构
数据模型
数据资产目录
企业数字化转型
TOGAF
认知科学:解决复杂问题的5个关键策略
这些策略包括:模式识别规则抽取
推理
和逻辑
推理
知识表示和知识
图谱
多模态处理我们将在接下来的部分中详细讨论这些策略,并提供代码实例和数学模型公
AI天才研究院
·
2025-03-15 06:25
AI大模型应用入门实战与进阶
大数据
人工智能
语言模型
AI
LLM
Java
Python
架构设计
Agent
RPA
人工智能:重塑未来生活与工作的科技力量
最初,AI的研究主要集中在逻辑
推理
、机器学习和自然语言处理等领域,目标是使机器能够模拟人类的智能行为。尽管在早期的探索中,AI遭遇了诸多挑战和瓶颈,但其发展潜力逐渐被认可,并在随后几十年中得到了迅速的
Geektec
·
2025-03-15 06:54
问答专栏
人工智能
应用创新
Anthropic 的模型
Anthropic的模型(特别是Claude系列)之所以在性能和
推理
能力上表现强劲,可以从技术设计、研究理念、训练方法以及应用优化等多个方面进行详细分析。
调皮的芋头
·
2025-03-15 06:50
深度学习
神经网络
机器学习
人工智能
DeepSeek R1有什么不同
订阅:https://rengongzhineng.io/深度思考实验室(DeepSeek)最近发布了全新的
推理
模型R1,声称该模型不仅性能超越目
新加坡内哥谈技术
·
2025-03-15 06:18
人工智能
深度学习
机器人
科技
DeepSeek开源:FlashMLA深度解析:Hopper架构上的大模型
推理
革命
2025年2月24日,DeepSeek以「开源周」首日发布的FlashMLA技术,重新定义了Hopper架构GPU在AI
推理
领域的性能极限。
花生糖@
·
2025-03-15 03:55
AIGC学习资料库
AI·未来
DeepSeek
实用集
开源
架构
FlashMLA
DeepSeek
技术
AI
AIGC
LLM
推理
和优化(1):基本概念介绍
一、LLM
推理
的核心过程:自回归生成LLM(如DeepSeek、ChatGPT、LLaMA系列等)的
推理
本质是自回归生成:从初始输入(如[CLS]或用户prompt)开始,逐token预测下一个词,直到生成结束符
AndrewHZ
·
2025-03-14 23:50
AI算法工程师面试指北
算法
LLM
语言模型
推理优化
KVCache
DeepSeek
注意力机制
1章5节:大模型术语解读与从生成到
推理
的演进
本篇文章将深入剖析大模型相关的核心术语,探讨其内涵、应用及发展趋势,并回顾大模型从生成到
推理
的演进历程,解析全球科技巨头与国内前沿企业在这一领域的竞争与创新。
DAT|R科学与人工智能
·
2025-03-14 22:08
人工智能
云原生周刊:基于 KubeSphere LuBan 架构打造DeepSeek 插件
开源项目推荐KubeAIKubeAI是一个K8s上的AI
推理
操作器,旨在简化在生产环境中部署和管理大型语言模型(LLM)、向量嵌入和语音处理等机器学习模型。
·
2025-03-14 22:37
云计算
从零到一:Transformer模型的原理与实战之旅
1.2自注意力机制的核心1.3Transformer的结构2.实战:构建Transformer模型2.1任务目标2.2环境准备2.3数据准备2.4模型构建2.5模型训练3.
推理
实战:完整示例与输出结果3.1
樽酒ﻬق
·
2025-03-14 21:06
AI
transformer
深度学习
人工智能
【vLLM 学习】使用 TPU 安装
vLLM是一款专为大语言模型
推理
加速而设计的框架,实现了KV缓存内存几乎零浪费,解决了内存管理瓶颈问题。
HyperAI超神经
·
2025-03-14 17:26
vLLM
学习
人工智能
vLLM
深度学习
TPU
机器学习
教程
AI大模型
推理
加速:技术与实践详解
然而,大模型的
推理
速度却成为其落地应用的瓶颈。本文将详细探讨AI大模型
推理
加速的技术手段和实践经验,并结合具体案例进行分析。
AI大模型学习者
·
2025-03-14 15:43
人工智能
推理
大模型:技术解析与未来趋势全景
1.
推理
大模型的定义
推理
大模型(ReasoningLLMs)是专门针对复杂多步
推理
任务优化的大型语言模型,具备以下核心特性:输出形式创新展示完整逻辑链条(如公式推导、多阶段分析)任务类型聚焦擅长数学证明
时光旅人01号
·
2025-03-14 15:10
深度学习
人工智能
python
pytorch
神经网络
【AI论文】TPDiff:时序金字塔视频扩散模型
基于这一洞见,我们提出了TPDiff,一个统一的框架,用于提高训练和
推理
效率。通过将扩散过程分为几个阶段,我们的框架在扩散过程中逐步增加帧率,仅在最后阶段采用全帧率,从而优化计算效率。
东临碣石82
·
2025-03-14 14:31
人工智能
算法
Stable Diffusion/DALL-E 3图像生成优化策略
分块
推理
(TiledDiffusion):将图像分割为512×512区块,逐块生成后无缝拼接,支持4096×40
云端源想
·
2025-03-14 12:16
stable
diffusion
11B模型拿下开源视频生成新SOTA!仅用224张GPU训练,训练成本省10倍
同时,此次发布全面开源模型权重、
推理
代码及分布式训练全流程,开发者们可以看过来!GitH
·
2025-03-14 04:12
量子位
【自学笔记】讯飞星火基础知识点总览-持续更新
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录讯飞星火基础知识点总览一、讯飞星火简介二、核心功能1.语音识别2.自然语言处理3.知识
图谱
4.星火API三、基础概念1.AI模型2
Long_poem
·
2025-03-14 02:08
笔记
QwQ-32B企业级本地部署:结合XInference与Open-WebUI使用
QwQ-32B是阿里巴巴Qwen团队推出的一款
推理
模型,拥有320亿参数,基于Transformer架构,采用大规模强化学习方法训练而成。
大势下的牛马
·
2025-03-14 00:56
搭建本地gpt
RAG
知识库
人工智能
QwQ-32B
【大模型新书】基于RAG的生成式AI:使用LlamaIndex、Deep Lake和Pinecone构建自定义的检索增强生成管道
利用嵌入式向量数据库和集成的人类反馈来实现检索增强生成(RAG)购买本书的纸质版或Kindle版即包含免费的PDF格式电子书主要特点实现RAG的可追溯输出,将每个响应与其源文档链接,构建可靠的多模态对话智能体在管道中集成RAG、实时人类反馈改进和知识
图谱
AI大模型-大飞
·
2025-03-13 23:18
人工智能
大模型学习
AI产品经理
语言模型
大模型
RAG
大模型教程
轻量级多模型部署实践:Ollama 与 vLLM 快速构建高效 AI 工作流20250306
轻量级多模型部署实践:Ollama与vLLM快速构建高效AI工作流本文将详细介绍如何在MacOS与Ubuntu环境下使用Ollama与vLLM进行轻量级多模型部署,包括模型并行
推理
、安全与性能优化的实践经验
Narutolxy
·
2025-03-13 20:55
智浪初航
人工智能
Neo4j笔记整理CQL大全
工作需要用到知识
图谱
,学习一下Neo4jCQL常规操作查询关系的父节点match(n)-[r:likes]-()returnn查询节点名称为person的前25条结点记录和查询后25条结点记录match
Kugua-F
·
2025-03-13 19:49
Neo4j
Neo4j
图形数据库
大模型相关知识学习随记
2024/3/151,概念解释:通义千问,是阿里云推出的一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑
推理
、多模态理解、多语言支持。
m0_65156252
·
2025-03-13 18:16
语言模型
人工智能
自然语言处理
【LLM大模型】大模型涌现能力及 Prompt Engineering提示词
作为概率模型,大语言模型甚至不知道数字代表的真实含义,模型只是在学习了无数的语料之后,发现了一些数学结论之间的潜在概率关系,才最终涌现出了数学运算或者复杂
推理
的能力。但是“涌现能力
Langchain
·
2025-03-13 18:15
prompt
人工智能
llama
langchain
ai大模型
LLM
seq2seq
推理
模块设计
代码:#loadcheckpoints,如何上线model=Sequence2Sequence(len(src_word2idx),len(trg_word2idx))model.load_state_dict(torch.load(f"./best.ckpt",weights_only=True,map_location="cpu"))classTranslator:def__init__(se
何仙鸟
·
2025-03-13 18:40
PyTorch
深度学习
人工智能
LLM Weekly(2025.03.03-03.09)
研究人员推出了QwQ-32B,这是一个拥有320亿参数的模型,它利用强化学习来提升
推理
能力。尽管参数较少,但通过整合类似智能体的
推理
和反馈机制,QwQ-32B的表现可与更大规模的模型相媲美。
UnknownBody
·
2025-03-13 16:29
LLM
Daily
LLM
Weekly
语言模型
人工智能
支持 40+ 插件,Spring AI Alibaba 简化智能体私有数据集成
RAG通过结合检索技术和生成模型的强大能力,使智能体能够实时从外部数据源获取信息,并在生成过程中增强其知识深度和
推理
能力。通过这种方式,智能体不仅能依赖于模型的预
阿里云云原生
·
2025-03-13 16:29
人工智能
spring
数据挖掘
SaaS+AI应用架构:业务场景、智能体、大模型、知识库、传统工具系统
本节将详细介绍其五个核心层次:业务场景层:发现和确定业务场景智能体层:构建可复用的智能应用大模型层:采用最合适的大模型,作为思考
推理
的核心知识库:管理企业的核心知识资产传统工具:传统的运营工具和业务系统业务场景层
公众号-AI架构师汤师爷
·
2025-03-13 16:26
后端
架构设计
Java
SaaS
本地部署时,如何通过硬件加速(如 CUDA、TensorRT)提升 DeepSeek 的
推理
性能?不同显卡型号的兼容性如何测试?
本地部署DeepSeek模型的硬件加速优化与显卡兼容性测试指南一、硬件加速技术实现路径CUDA基础环境搭建版本匹配原则:根据显卡架构选择CUDA版本(如NVIDIARTX50系列需CUDA12+,V100需CUDA11.x),并通过nvcc--version验证安装。GPU加速验证:运行以下代码检查硬件加速状态:importtensorflowastfprint("可用GPU数量:",len(tf
百态老人
·
2025-03-13 14:43
人工智能
科技
算法
vscode
【图像去噪】论文复现:TPAMI 2025!全面提升单图像去噪泛化性!像素级零样本去噪方法Pixel2Pixel的Pytorch源码复现,跑通源码,修改各种报错,框架详解,注释详细!
本文亮点:跑通Pixel2Pixel全部源码,包含数据集准备、制作像素库(PixelBank)、训练和
推理
等,
十小大
·
2025-03-13 14:11
pytorch
人工智能
python
深度学习
计算机视觉
图像处理
图像去噪
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他