E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
推理结论
deepseek具体应用场景
以下是基于证据的详细总结:金融领域DeepSeek在金融领域的应用表现突出,例如通过其大语言模型(如DeepSeekLLM67Bt)提供数学、逻辑
推理
等能力,帮助金融机构提升服务效率。
ahyouxiang
·
2025-03-20 06:06
人工智能
【AI Agent教程】各种Agent开发框架都是如何实现ReAct思想的?深入源码学习一下
ReAct方式是AIAgent最常用的实现思路之一,它强调在执行任务时结合
推理
(Reasoning)和行动(Acting)两个方面,使得Agent能够在复杂和动态的环境中更有效地工作。
同学小张
·
2025-03-20 05:29
大模型
人工智能
学习
笔记
经验分享
AIGC
AI
Agent
ReAct
Tree of Thought Prompting(思维树提示)
TreeofThoughtPrompting(思维树提示)是一种新兴的提示工程技术,旨在通过模拟人类解决问题时的多步
推理
过程,提升大型语言模型(LLM)在复杂任务中的表现。
大数据追光猿
·
2025-03-20 02:28
大模型
人工智能
大数据
深度学习
语言模型
计算机视觉
【FPGA教程案例31】通信案例1——基于FPGA的ASK调制信号产生
----------------------------------------------------------目录1.软件版本2.ASK调制原理3.ASK调制过程的FPGA实现4.操作步骤与仿真
结论
fpga和matlab
·
2025-03-19 23:03
★教程2:fpga入门100例
fpga开发
FPGA教程
ASK调制
verilog
Deepseek的本地化部署软件工具包
选择模型版本参数规模硬件要求(最低)适用场景1.5B/7B8GB内存,无专用GPU文本处理、简单问答14B16GB内存+12GB显存代码生成、逻辑
推理
32B/70B24GB显存+32GB内存企业级复杂任务执行命令
哈拉少12
·
2025-03-19 20:14
人工智能
使用LangChain实现大规模语言模型自发现
推理
结构
使用LangChain实现大规模语言模型自发现
推理
结构在现代自然语言处理(NLP)的研究中,大规模语言模型(LLMs)已经展示了强大的能力。然而,在应对复杂的
推理
问题时,传统的提示方法常常力不从心。
VYSAHF
·
2025-03-19 20:43
langchain
语言模型
人工智能
python
现在的AI,到底是背答案的高手,还是真正的会思考
这让我也产生了一个疑问:现在的AI究竟是背答案的复读机呢,还是真会
推理
的最强大脑?于是我搜索了很多资料来了解这件事。毕竟这事儿可不单单跟作业有关系——它对未来的AI起着决
沐凡资源
·
2025-03-19 19:06
人工智能
A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的训练后优化综述——第9部分——应用
应用尽管预训练为大型语言模型(LLMs)赋予了强大的基础能力,但在部署于专业领域时,LLMs仍经常遇到持续的限制,包括上下文长度受限、容易产生幻觉(hallucination)、
推理
能力欠佳和固有的偏见
王金-太想进步了
·
2025-03-19 19:31
语言模型
人工智能
自然语言处理
知识蒸馏:从软标签压缩到
推理
能力迁移的工程实践(基于教师-学生模型的高效压缩技术与DeepSeek合成数据创新)
知识蒸馏通过迁移教师模型(复杂)的知识到学生模型(轻量),实现模型压缩与性能平衡。核心在于利用教师模型的软标签(概率分布)替代独热编码标签,学生模型不仅学习到教师模型输出数据的类别信息,还能够捕捉到类别之间的相似性和关系,从而提升其泛化能力核心概念知识蒸馏的核心目标是实现从教师模型到学生模型的知识迁移。在实际应用中,无论是大规模语言模型(LLMs)还是其他类型的神经网络模型,都会通过softmax
AI仙人掌
·
2025-03-19 17:20
人工智能
AI
人工智能
深度学习
语言模型
机器学习
KV 缓存简介
KV缓存是Transformer架构(如GPT、LLaMA等大模型)在自回归生成任务(如文本生成)中,用于加速
推理
过程的核心技术。
dev.null
·
2025-03-19 17:49
AI
缓存
探索AI知识库的无限潜力:定义、应用与未来展望
它不仅包含了大量的结构化、半结构化和非结构化数据,还具备智能检索、
推理
分析、自我学习和优化等高级功能。
·
2025-03-19 16:15
知识库知识库管理知识库软件
GPT-4o mini小型模型具备卓越的文本智能和多模态
推理
能力
GPT-4omini在学术基准测试中,无论是在文本智能还是多模态
推理
方面,都超越了GPT-3.5Turbo和其他小型模型,并支持与GPT-4o相同的语言范围。
FlowUs息流使用宝典
·
2025-03-19 14:55
GPT-4o
mini
推理
速度超快!vLLM本地部署Mistral-Small 3.1+全方位测试多模态大模型!超越Gemma3.1,最适合企业项目的大模型!中文OCR能力也不弱
本篇笔记所对应的视频https://www.bilibili.com/video/BV1Q9XLYiEwD/MistralAI最新推出的MistralSmall3.1模型无疑是近期科技界的一大亮点。这款由法国AI实验室MistralAI开发的开源多模态模型,以其卓越的性能和灵活性,为开发者、企业和研究人员带来了全新的可能性。凭借24B参数、对文本与图像的处理能力,以及在多个关键指标上的突破,Mis
AI超元域
·
2025-03-19 12:14
ocr
人工智能
ai
AI编程
aigc
未来5年AI人工智能与信息技术领域发展趋势
以Transformer为核心的序列建模技术持续迭代,字节跳动云雀模型通过动态结构优化,在保持语言理解能力的同时将参数量压缩至GPT-4的1/10,
推理
速度提升3倍。
海宁不掉头发
·
2025-03-19 11:03
人工智能
软件工程
人工智能
人工智能
软件工程
笔记
chatgpt
使用 DeepSeek-R1 为 RAG 运行本地 Gradio 应用程序
第1步:先决条件在深入研究实现之前,我们确保已安装以下工具和库:Python3.8+Python3.8+版Langchain:用于构建由大型语言模型()LLMs提供支持的应用程序的框架,支持轻松检索、
推理
和工具集成
呱牛 do IT
·
2025-03-19 10:53
人工智能
deepseek
OctoTools:一个具有复杂
推理
可扩展工具的智体框架
解决复杂的
推理
任务可能涉及视觉理解、域知识检索、数值计算和多步骤
推理
。现有方法使用外部工具增强大语言模型(LLM),但仅限于专业领域、有限的工具类型或需要额外的训练数据。
三谷秋水
·
2025-03-19 09:09
智能体
大模型
机器学习
人工智能
语言模型
机器学习
【大模型开发】ONNX 格式的大模型在 Android 上的部署与测试
最后会给出一些针对在移动设备上部署ONNX
推理
的优化方法和未来建议。
云博士的AI课堂
·
2025-03-19 08:05
大模型技术开发与实践
哈佛博后带你玩转机器学习
深度学习
android
大模型部署
本地推理引擎
大模型开发
机器学习
边缘设备
Node.js 包与 npm 详解:概念、作用及完整使用指南
npm项目步骤2:编写index.js步骤3:在另一个项目中使用这个包4.安装和使用第三方npm包安装lodash使用lodash5.全局安装包与命令行工具6.发布自己的npm包创建npm账号发布包7.
结论
在
还是鼠鼠
·
2025-03-19 08:04
node.js
node.js
npm
前端
vscode
web
MySQL数据库外键约束:打开与关闭的艺术
MySQL数据库外键约束:打开与关闭的艺术基本概念和作用说明示例一:开启外键约束示例二:关闭外键约束示例三:性能优化与外键约束示例四:外键约束与数据一致性示例五:排查外键约束引发的问题
结论
与讨论引发点在数据库的世界里
master_chenchengg
·
2025-03-19 07:28
sql数据库
数据库
mysql
Linux中部署DeepSeek R1
DeepSeek-R1本地部署硬件需求表模型规模GPU需求CPU需求内存需求存储需求备注1.5B-GTX16504GB(可选)四核i5/Ryzen3000+16GBDDR450GBSSD需4-bit量化,CPU
推理
延迟约
Java探索者 °
·
2025-03-19 07:26
linux
服务器
语言模型
Spring Boot中@Valid 与 @Validated 注解的详解
SpringBoot中@Valid与@Validated注解的详解引言@Valid注解功能介绍使用场景代码样例@Validated注解功能介绍使用场景代码样例@Valid与@Validated的区别
结论
引言在
jiajia651304
·
2025-03-19 05:33
spring
boot
后端
java
MySQL常用函数详解及SQL代码示例
MySQL常用函数详解及SQL代码示例引言当前日期和时间函数字符串函数数学函数聚合函数
结论
引言MySQL作为一种广泛使用的关系型数据库管理系统,提供了丰富的内置函数来简化数据查询、处理和转换。
星河浪人
·
2025-03-19 05:02
mysql
sql
android
自建智能算力中心 vs 第三方算力租赁:AI企业的算力博弈与最优解
从ChatGPT到DeepSeek,从自动驾驶到智能医疗,AI模型的训练和
推理
需求呈现指数级增长。在这场技术革命中,算力已成为企业竞争的“命脉”。
·
2025-03-19 03:50
RAG 在多模态数据处理中的应用探索:结合图像与文本生成
目录引言多模态数据处理的挑战与需求数据异质性与融合难题多样化应用场景的需求RAG在图像与文本生成中的应用架构图像检索与文本生成协同跨模态特征融合与生成关键技术与实现细节图像特征提取与表示文本检索与语义理解跨模态生成模型训练应用案例分析智能设计辅助医疗影像报告生成
结论
引言随着信息技术的飞速发展
hy098543
·
2025-03-18 22:40
AIGC
理解深度学习1-简介
它覆盖了众多方法,涵盖了基于逻辑、搜索和概率
推理
的技术。机器学习是AI的一个分支,它通过对观测数据进行数学模型拟合来学习决策制定。这个领域近年来迅猛发展,现在几乎(虽不完全准确)与AI同义。
shangjg3
·
2025-03-18 21:35
PyTorch深度学习实战
深度学习
人工智能
【Python】Flask与Django对比详解:教你如何选择最适合你的Web框架
了解更多AI内容
结论
:
小芬熊
·
2025-03-18 21:33
面试
学习路线
阿里巴巴
python
flask
django
程序员必看!DeepSeek全栈开发实战指南:从代码生成到性能优化
这两项技术突破对程序员群体意义重大:通信效率飞跃:DeepEP通过NVLink优化实现GPU间158GB/s传输速度,后端开发者训练大模型时可节省60%集群资源
推理
性能突破:R1模型在H
AI创享派
·
2025-03-18 20:59
后端
【后端】【django】抛弃 Django 自带用户管理后,能否使用 `simple-jwt`?
一、
结论
是的,即使抛弃了Django自带的用户管理(AbstractUser或AbstractBaseUser),仍然可以使用django-rest-framework-simplejwt(简称simple-jwt
患得患失949
·
2025-03-18 19:52
django知识
django
sqlite
数据库
五、AIGC大模型_05模型的vLLM部署与LangChain调用
0、概述要搭建一个大模型应用服务,通常需要包含以下五层结构,即:基础环境、模型层、
推理
层、对外接口、外挂应用在了解了模型的微调训练之后,本文将以vLLM、OpenAI、LangChain为例,介绍大模型的
推理
部署以及对外接口开放调用
学不会lostfound
·
2025-03-18 19:20
AI
人工智能
langchain
openai
vLLM
AIGC
3D-AFFORDANCELLM: HARNESSING LARGE LANGUAGE MODELS FOR OPEN-VOCABULARY AFFORDANCE DETECTION
为了解决这些限制,我们将传统的可及性检测范式重新定义为指令
推理
可及性分割(IRAS)任务。该任务旨在根据查询
推理
文本输出可及性掩码区域,避免了输入标签的固定类别。相应地,我们提出了
UnknownBody
·
2025-03-18 16:00
LLM
Daily
3d
语言模型
人工智能
yolov4
从数据层面和网络设计层面来进行改善消融实验,感觉能做的都让他给做了,这工作量不轻全部实验都是单GPU完成,不用太担心设备了Bagoffreebies(BOF)只增加训练成本,但是能显著提高精度,并不影响
推理
速度数据增强
zzh-
·
2025-03-18 16:28
笔记
llama.cpp 和 LLM(大语言模型)
它通过海量文本数据训练,能够生成连贯、语义丰富的文本,完成问答、创作、
推理
等任务。特点:参数规模大:如GPT-3(1750亿参数)、Llama-65B(650亿参数)等。
这个懒人
·
2025-03-18 14:12
llama
语言模型
人工智能
Elasticsearch:为
推理
端点配置分块设置
推理
端点对一次可处理的文本量有限,具体取决于模型的输入容量。分块(Chunking)是指将输入文本拆分成符合这些限制的小块的过程,在将文档摄取到semantic_text字段时会进行分块。
Elastic 中国社区官方博客
·
2025-03-18 13:35
Elasticsearch
AI
Elastic
elasticsearch
大数据
搜索引擎
人工智能
全文检索
数据库
ai
Yolov11目标检测(ultralytics)
Yolov11目标检测(ultralytics)1.克隆仓库2.安装环境依赖3.训练、验证、
推理
以及onnx模型导出1.克隆仓库从官网下载Yolov11到本地。
@M_J_Y@
·
2025-03-18 13:02
目标检测
YOLO
目标检测
人工智能
TorchServe详解和应用
TorchServer是PyTorch的一个组件,它是一个轻量级的服务框架,用于部署和管理PyTorch模型,以便在生产环境中提供高效、可扩展的
推理
服务。
易之阴阳
·
2025-03-18 11:43
机器学习
人工智能
深度学习
python
Torchserver
Flink流式计算系统
本文将以这些概念为基础,逐一介绍Flink的发展背景、核心概念、时间
推理
与正确性工具、安装部署、客户端操作、编程API等内容,让开发人员对Flink有较为全面的认识并拥有一些基础操作与编程能力。
xyzkenan
·
2025-03-18 07:13
Flink
大数据
大数据开发
ChatGPT
推理
模型&通用模型大解析!
很多人知道通用模型和
推理
模型了,那么ChatGPT的哪些模型是通用模型,哪些又是
推理
模型呢?
即兴小索奇
·
2025-03-18 00:38
ChatGPT&
AI
人工智能
chatgpt
【技术解密】本地部署 DeepSeek-V3:完整指南
目录引言运行环境需求下载与安装
推理
部署总结参考资源引言随着人工智能的快速发展,开源大模型正逐步改变着技术生态。
海棠AI实验室
·
2025-03-17 22:54
“智元启示录“
-
AI发展的深度思考与未来展望
人工智能
深度学习
DeepSeek
【大模型实战篇】使用GPTQ量化QwQ-32B微调后的
推理
模型
低精度运算(如INT8)在GPU等硬件上计算效率更高,
推理
速度可提升2~4倍。我们的任务是,将QwQ-32B微调后的
推理
模型,也就是bf16的精度,通过量化,压缩到int4。
源泉的小广场
·
2025-03-17 21:19
大模型
大模型量化
推理模型量化
量化
qwq32b
gptq量化
大模型推理
性能调优
DIFFERENTIAL TRANSFORMER
差分Transformer摘要1引言2差分Transformer3实验4
结论
摘要Transformer倾向于将注意力过度分配到无关的上下文中。
UnknownBody
·
2025-03-17 21:44
LLM
Daily
深度学习
人工智能
transformer
LLM-PowerHouse: 一站式大型语言模型定制训练与
推理
指南
LLM-PowerHouse:解锁大型语言模型的潜力在人工智能和自然语言处理领域,大型语言模型(LargeLanguageModels,LLMs)正在掀起一场革命。随着GPT、BERT等模型的出现,LLMs展现出了惊人的能力,可以执行各种复杂的语言任务。然而,如何有效地训练和使用这些强大的模型仍然是一个挑战。针对这一需求,GitHub上的LLM-PowerHouse项目应运而生,为开发者、研究人员
Nifc666
·
2025-03-17 21:43
语言模型
人工智能
自然语言处理
whisper
langchain
gpt
开源软件
s1K 数据集:是一个用于提升语言模型
推理
能力的高质量数据集。
2025-02-07,由斯坦福大学、华盛顿大学等研究机构创建了s1K数据集,该数据集包含1,000个精心挑选的问题,并配以
推理
轨迹和答案,为语言模型
推理
能力的提升提供了重要的数据基础。
·
2025-03-17 14:37
数据集
Ollama 基本概念
Ollama是一个本地化的、支持多种自然语言处理(NLP)任务的机器学习框架,专注于模型加载、
推理
和生成任务。通过Ollama,用户能够方便地与本地部署的大型预训练模型进行交互。
Mr_One_Zhang
·
2025-03-17 13:47
学习Ollama
ai
【go从入门到精通】探秘struct结构体转json为什么需要首字母大写?
目录作者简介:问题抛出分析
结论
作者简介:高科,先后在IBMPlatformComputing从事网格计算,淘米网,网易从事游戏服务器开发,拥有丰富的C++,go等语言开发经验,mysql,mongo,redis
前网易架构师-高司机
·
2025-03-17 13:47
golang从入门到精通
golang
json
go
结构体首字母大写
golang从入门到精通
go从入门到精通
DeepSeek 在代码生成方面的优势解析
文章将详细解析DeepSeek在代码生成方面的优势,包括模型架构、数据训练、优化策略、编程语言支持、
推理
效率等核心技术点。1.DeepSeek-Coder的模型架构优化DeepSeek-Code
草莓屁屁我不吃
·
2025-03-17 08:15
人工智能
ai
chatgpt
Google Gemini 大模型技术架构剖析
Gemini系列包括Ultra、Pro和Nano三种尺寸,适用于从复杂的
推理
任务到设备内存受限的应用场景。GeminiUltra是最强大的模型,可在各种高度复杂的任务(包括
推理
和多
musicml
·
2025-03-17 08:15
人工智能
文心一言提前免费,高性能大模型全面入局该咋看?
文心大模型4.5作为首个原生多模态大模型,在多模态理解、文本和逻辑
推理
能力上的显著提升,使其在多项测试中表现优于GPT4.5,这体现了百度在AI技术研发上的深厚积累。同时,文心大模型X1作为深度思
江瀚视野
·
2025-03-17 07:06
人工智能
机器人
DeepSeek-R1模型1.5b、7b、8b、14b、32b、70b和671b有啥区别?
码笔记mabiji.com分享:1.5B、7B、8B、14B、32B、70B是蒸馏后的小模型,671B是基础大模型,它们的区别主要体现在参数规模、模型容量、性能表现、准确性、训练成本、
推理
成本和不同使用场景
facaixxx2024
·
2025-03-17 06:01
AI大模型
人工智能
算法
深度学习
A survey on instance segmentation: state of the art——论文笔记
实例分割的发展从粗略的对象分类逐步演变为更精细的像素级别
推理
,广泛应用于自动驾驶、机器人等领域。论文为研究人员提供了对实例分割领域的全面了解和有价值的参考。
栀子清茶
·
2025-03-17 06:54
1024程序员节
论文阅读
计算机视觉
人工智能
笔记
学习
MindSpore:华为全场景AI框架的技术全景与生态实践
作为华为昇腾AI生态的基石,MindSpore支持端、边、云全场景覆盖,并深度融合昇腾处理器的算力特性,提供从模型开发、训练到
推理
部署的端到端能力。
彩旗工作室
·
2025-03-17 05:44
人工智能
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他