E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLM专题
LLM
中 最后一个词语的表征(隐藏状态)通常会融合前面所有词语的信息吗?
LLM
中最后一个词语的表征(隐藏状态)通常会融合前面所有词语的信息吗?
ZhangJiQun&MXP
·
2025-07-12 15:44
教学
2024大模型以及算力
2021
AI
python
机器学习
算法
深度学习
人工智能
LLM
的表征做减法的是什么,自然语言是一个矩阵,怎么进行减法的
LLM
的表征做减法的是什么,自然语言是一个矩阵,怎么进行减法的有个假设:就是最后一个词语融合了前面词语的信息减法操作主要用于提取模型内部表征中的"诚实性"概念向量。
ZhangJiQun&MXP
·
2025-07-12 14:40
教学
2024大模型以及算力
2021
AI
python
计算机视觉
人工智能
机器学习
算法
深度学习
LLM
-生成器判别器的实现
总结首先,使用GPT模型获取每个词的生成概率pLLMp_{
LLM
}pLLM。
·
2025-07-12 12:23
利用本地
LLM
、MCP、DeepSeek 集成构建您自己的 AI 驱动工具
在本指南中,我将引导您构建一个具有本地运行的大型语言模型(
LLM
)和MCP集成的AI工具-让您以类似的方式自动执行利用MCP的工具您喜欢的任务。
知识大胖
·
2025-07-12 11:51
NVIDIA
GPU和大语言模型开发教程
人工智能
mcp
deepseek
使用 Ollama 、 DeepSeek和QWEN的模型上下文协议 (MCP) ,使用本地
LLM
教程的 MCP 服务器
MCP或模型上下文协议由Anthropic去年发布,它可以帮助
LLM
连接软件并对其进行控制。
知识大胖
·
2025-07-12 11:51
NVIDIA
GPU和大语言模型开发教程
服务器
运维
人工智能
qwen2vl
deepseek
在 Obsidian 中本地使用 DeepSeek — 无需互联网!
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地
LLM
?如果是,那么本指南适合您!
知识大胖
·
2025-07-12 11:21
NVIDIA
GPU和大语言模型开发教程
人工智能
deepseek
Llama-Omni会说话的人工智能“语音到语音
LLM
” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式(教程含源码)
——史蒂夫·乔布斯近年来,人机交互领域发生了重大变化,尤其是随着ChatGPT、GPT-4等大型语言模型(
LLM
)的出现。
知识大胖
·
2025-07-12 11:50
NVIDIA
GPU和大语言模型开发教程
llama
人工智能
nvidia
llm
OpenWebUI系列之 如何通过docker自动将其更新到OpenWebUI最新版本
它支持各种
LLM
运行器,包括Ollama和OpenAI兼容API。如何通过docker自动将其更新到OpenWebUI最新版本?
知识大胖
·
2025-07-12 11:20
NVIDIA
GPU和大语言模型开发教程
docker
llm
openwebui
AnythingLLM教程系列之 12 AnythingLLM 上的 Ollama 与 MySQL+PostgreSQL
简介一款全栈应用程序,可让您将任何文档、资源或内容转换为上下文,任何
LLM
都可以在聊天期间将其用作参考。此应用程序允许您选择要使用的
LLM
或矢量数据库,并支持多用户管理和权限。
知识大胖
·
2025-07-12 11:20
NVIDIA
GPU和大语言模型开发教程
mysql
postgresql
数据库
anythingllm
ollama
AnythingLLM教程系列之 09 AnythingLLM 支持自定义音频转录提供程序
您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序,该应用程序基本上是一个具有许可的完整ChatGPT,但具有任何
LLM
、嵌入模型或矢量数据库。
知识大胖
·
2025-07-12 11:50
NVIDIA
GPU和大语言模型开发教程
llama3
anythingllm
llm
AnythingLLM教程系列之 04 AnythingLLM 允许您以正确的格式导出聊天日志,以构建 GPT-3.5 和 OpenAI 上其他可用模型的微调模型(教程含安装步骤)
您需要为您的企业或组织提供一款完全可定制、私有且一体化的AI应用程序,该应用程序基本上是一个具有许可的完整ChatGPT,但具有任何
LLM
、嵌入模型或矢量数据库。
知识大胖
·
2025-07-12 11:20
NVIDIA
GPU和大语言模型开发教程
llama3
ai
anythinllm
llama
【AI大模型】
LLM
模型架构深度解析:BERT vs. GPT vs. T5
理解它们的差异是
LLM
开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
我爱一条柴ya
·
2025-07-12 10:10
学习AI记录
ai
人工智能
AI编程
python
LLM
大模型学习必知必会系列(十三):基于SWIFT的VLLM推理加速与部署实战
LLM
大模型学习必知必会系列(十三):基于SWIFT的VLLM推理加速与部署实战1.环境准备GPU设备:A10,3090,V100,A100均可.
汀、人工智能
·
2025-07-12 10:09
LLM技术汇总
人工智能
自然语言处理
LLM
Agent
vLLM
AI大模型
大模型部署
【实战AI】macbook M1 本地ollama运行deepseek
请自行;2.设备macbookM132G下载ollamaOllama是一款跨平台推理框架客户端(MacOS、Windows、Linux),专为无缝部署大型语言模型(
LLM
)(如Llama2、Mistral
东方鲤鱼
·
2025-07-12 08:24
chat
AI
macos
ai
llama
AIGC
chatgpt
思维链革命:让大模型突破“机器思考”的边界
思维链技术深度解析文章(原文链接)的博客化重构,融合技术本质与应用实践:思维链革命:让大模型突破“机器思考”的边界——解析ChainofThought技术体系与下一代推理架构一、从黑箱到透明思考:CoT的核心突破传统
LLM
John Song
·
2025-07-12 07:13
AI
人工智能
思维链2.0
CoT
多模态思维链
元认知优化
LLM
Agent在多模态任务中的推理机制详解
文章目录一、引言二、多模态LLMAgent的基本架构2.1系统组成2.2工作流程图三、多模态表示与对齐3.1跨模态嵌入空间3.2模态对齐技术四、多模态推理策略4.1基于提示的推理(Prompt-basedReasoning)4.2多模态思维链(CoT)推理4.3多模态工具使用五、实现案例:多模态问答系统5.1系统架构5.2示例应用六、高级多模态推理技术6.1多模态递归推理6.2多模态记忆与检索6.
·
2025-07-12 06:12
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库,目标是在各种硬件上实现
LLM
推断,保持最小设置和最先进性能。
·
2025-07-12 06:41
LLaMA-Omni 深度解析:打开通往无缝人机语音交互的大门
LLaMA-Omni不仅实现了低至226ms的惊人交互延迟,还能同时生成高质量的文本与语音回复,真正意义上让大语言模型(
LLM
)具备了“听说”的能力。
kakaZhui
·
2025-07-12 06:41
前沿多模态大模型:论文与实战
llama
交互
LLM
TTS
语音识别
语音合成
人工智能
在
LLM
快速迭代时代构建持久AI应用:架构设计与实施策略
引言:技术浪潮下的开发困境大型语言模型(
LLM
)的发展速度令人瞠目:从GPT-3到GPT-4,从Claude1到Claude3,从Llama1到Llama3,迭代周期正在从"年"缩短到"月"。
·
2025-07-12 02:44
大型语言模型(
LLM
, Large Language Models)基模和 Chat 模型之间的区别
一、概述最近看大模型相关的知识,有看到大模型都有基础模型(base)和对话模型(chat),不太清楚什么时候用到基础模型,什么时候用到对话模型,故有此文。通过了解,最简单的概述就是基于基础模型会训练出一个对话(Chat)模型,对话模型主要用于对话场景,基础模型主要做文本生成,没有上下文对话的能力。在模型命名上也能看出来区别,例如:Qwen-72B和Qwen-72B-ChatChatGLM3-6B-
·
2025-07-12 01:37
SpringBoot集成LangChain4j:构建智能AI应用全解析
在企业级应用中融入大语言模型(
LLM
)能力已成为趋势,而LangChain4j作为专为Java设计的
LLM
集成框架,与SpringBoot的结合为开发者提供了强大而灵活的解决方案。
java干货仓库
·
2025-07-12 00:58
八股文汇总
Spring
大模型
spring
boot
人工智能
后端
专题
:2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载
原文链接:https://tecdat.cn/?p=42935关键词:2025,云计算,AI技术,市场趋势,深度学习,公有云,研究报告云计算和AI技术正以肉眼可见的速度重塑商业世界。过去十年,全球云服务收入激增8倍,中国云计算市场规模突破6000亿元,而深度学习算法的应用量更是暴涨400倍。这些数字背后,是企业从“自建机房”到“云原生开发”的转型,是AI从“实验室”走向“产业级应用”的跨越。本报告
·
2025-07-11 23:23
专题
:2025供应链数智化与效率提升报告|附100+份报告PDF、原数据表汇总下载
全文链接:https://tecdat.cn/?p=42926在全球产业链重构与数字技术革命的双重驱动下,供应链正经历从传统经验驱动向数据智能驱动的范式变革。从快消品产能区域化布局到垂类折扣企业的效率竞赛,从人形机器人的成本优化到供应链金融对中小企业的赋能,技术创新与模式重构正在重塑行业价值网络。本报告洞察基于《灼识咨询:2025中国供应链金融科技行业蓝皮书》《中国银河证券:折扣业态供应链效率深度
拓端研究室
·
2025-07-11 22:20
php
开发语言
基于 esp32-s3,结合私有化大模型,集asr语音识别、
llm
大模型、tts语音合成,设计一个技术方案,要求用websocket保持长链接,
以下方案演示了如何基于ESP32-S3,通过私有化大模型组合ASR(语音识别)、
LLM
(语言大模型)和TTS(语音合成)来构建一个语音交互系统,并且通过WebSocket保持与服务器的长连接通讯。
·
2025-07-11 20:03
详解LLMOps,将DevOps用于大语言模型开发
为了有效应对这些挑战,数据科学家们转向了一种新型的DevOps实践
LLM
-OPS,专为大型语言模型的开发和维护而设计。
·
2025-07-11 19:01
代码与 AI 的交响乐:探索 avante.nvim 的智能编程革命
本文将带你走进avante.nvim的世界,探索它如何通过大语言模型(
LLM
)和上下文感知机制,重新定义编程的艺术与科学。从灵感火花到代码现实:AI驱动的编程新时代想象一下,你正在编写一个复杂的P
步子哥
·
2025-07-11 18:48
人工智能
零代码玩转大模型!LLaMA Factory:你的专属模型精修师
你是否曾对大语言模型(
LLM
)的强大能力心驰神往,却苦于以下难题?想定制专属模型?微调代码看不懂,环境配置太复杂…硬件资源有限?动辄需要数张A100,普通设备望而却步…中文任务不给力?
jane_xing
·
2025-07-11 17:41
人工智能
llama
掌握
LLM
工程课,让你的AI之旅充满惊喜
掌控AI时代的密码:深入
LLM
工程课程在人工智能迅猛发展的今天,对大语言模型(
LLM
)的深入理解和应用能力已经成为引领技术潮流的重要基石。
·
2025-07-11 15:31
Dify小白入门指南:通过官方文档学习工作流编排和API调用
Dify小白入门指南:通过官方文档学习工作流编排和API调用一、Dify平台简介与核心功能Dify是一个开源的
LLM
应用开发平台,被设计为一个"生成式AI应用创新引擎",它提供了从Agent构建到AI工作流编排
伟大无须多言
·
2025-07-11 12:39
学习
dify
ai
大模型 Agent(智能体)技术简介
大模型Agent(智能体)技术是当前人工智能领域的前沿方向,它赋予大型语言模型(
LLM
)自主感知、规划、决策和行动的能力,使其不再局限于“被动应答”,而是能主动完成复杂任务。
北京地铁1号线
·
2025-07-11 11:35
自然语言处理与大语言模型
大模型
语言模型
Agent
机器学习深度学习驱动在光子学设计中的应用与未来【
专题
培训会议邀您共探科技前沿】
二、会议亮点由北京软研国际信息技术研究院主办的“智能算法驱动的光子学设计与应用”
专题
培训会议,将深入探讨以下核心内容:光子器件的逆向设计:利用深度学习优化多参数光子器件设计。
软研科技
·
2025-07-11 10:52
信息与通信
信号处理
量子计算
人工智能
【算法
专题
】双指针算法之18. 四数之和(力扣)
欢迎来到CILMY23的博客本篇主题为:双指针算法之18.四数之和(力扣)个人主页:CILMY23-CSDN博客系列专栏:Python|C++|C语言|数据结构与算法|贪心算法|Linux|算法
专题
|代码训练营感谢观看
CILMY23
·
2025-07-11 08:37
算法专题
算法
leetcode
双指针算法
c++
四数之和
专题
:2025大模型2.0:GPT到DeepSeek技术演进与产业落地报告|附200+份报告PDF汇总下载
原文链接:https://tecdat.cn/?p=42738当OpenAI在2023年推出ChatGPT时,业界或许未曾预料到,短短两年后大模型会以“2.0”形态重塑产业逻辑。本报告汇总解读基于国家工业信息安全发展研究中心与联想集团联合发布的《2025大模型2.0产业发展报告》,以及哈工大计算学部人工智能学院关于DeepSeek系列模型的技术白皮书,深入剖析大模型从“技术验证”向“商业落地”跃迁
拓端研究室
·
2025-07-11 03:11
pdf
专题
:2025数据资产AI价值化:安全、战略与应用报告|附400+份报告PDF、原数据表汇总下载
原文链接:https://tecdat.cn/?p=42885在数字经济加速渗透的今天,数据作为核心生产要素的价值愈发凸显。上市公司作为经济高质量发展的微观主体,其数据价值化进程不仅关乎企业自身竞争力,更折射出中国产业数字化转型的深度与广度。本报告洞察基于《上海数据交易所:上市公司数据价值化研究报告(2025)》《绿盟科技:全球云上数据泄露风险分析报告(第五期)》《DigitalRealty:全球
拓端研究室
·
2025-07-11 03:10
人工智能
大数据
大模型的温度?解读Temperature
LLM
温度是一个参数,它控制着
LLM
预测的下一个单词的概率分布。它通过改变下一个单词被选中的可能性,为
LLM
的输出增加了一些随机性或多样性。
半吊子全栈工匠
·
2025-07-11 02:31
大模型服务的推理优化探索
本文尝试讨论将
LLM
推理服务更改为高吞吐量引擎的挑战与应对方法。1.大模型服务面临的挑战大模型的能力令人惊叹,但其
半吊子全栈工匠
·
2025-07-11 02:31
人工智能-基础篇-28-模型上下文协议--MCP请求示例(JSON格式,客户端代码,服务端代码等示例)
不过,在某些AI工具链和
LLM
开发框架中,确实出现了以“MCP”命名的内部通信机制,尤其是在与语言模型代理(LLMAgent)和工具调用接口相关的系统中。
weisian151
·
2025-07-10 23:42
人工智能
人工智能
json
网络
揭秘12-Factor Agents:打造可靠
LLM
应用的秘诀
探索12-FactorAgents:构建生产级
LLM
应用的新范式在AI飞速发展的时代,构建真正能够投入生产使用的大型语言模型(
LLM
)驱动的软件变得尤为重要。
人工智能我来了
·
2025-07-10 21:30
人工智能
AI
人工智能
【GitHub开源项目实战】
LLM
-Cookbook 中文大模型工程手册全解析:多场景落地应用与技术优化路径深度实践
GitHub开源实战|
LLM
-Cookbook中文大模型工程手册全解析:多场景落地应用与技术优化路径深度实践关键词
LLM
-Cookbook,中文大模型,Datawhale,大模型实战,LangChain
·
2025-07-10 21:59
1. RAG 权威指南:从本地实现到生产级优化的全面实践
1.RAG权威指南:从本地实现到生产级优化的全面实践大型语言模型(
LLM
)的知识受限于其训练数据,这是一个众所周知的痛点。
·
2025-07-10 19:22
javascript
AI技术正在深度重构全球产业格局,其影响已超越工具属性,演变为推动行业变革的核心引擎。
一、AI如何重塑AI的工作与行业(AI助手领域)能力升级理解与生成:基于
LLM
(大语言模型),AI能处理开放式问题、撰写报告、翻译代码,替代部分人类知识工作。
·
2025-07-10 18:43
[论文阅读] 人工智能 + 软件工程 | 当
LLM
写代码时,它的 “思考过程” 靠谱吗?—— 揭秘 CoT 质量的那些事儿
当
LLM
写代码时,它的“思考过程”靠谱吗?——揭秘CoT质量的那些事儿论文标题:AreTheyAllGood?
张较瘦_
·
2025-07-10 18:42
前沿技术
论文阅读
人工智能
软件工程
【2025B卷
专题
】华为OD机试2025B卷统一考试题库清单,时间紧张就刷这个
专栏导读本专栏收录于《华为OD机试(JAVA)真题(B卷+A卷+C卷+D卷+E卷)》。刷的越多,抽中的概率越大,私信哪吒,备注华为OD,加入华为OD刷题交流群,每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景,发现新题目,随时更新,全天CSDN在线答疑。2025年5月12日,华为官方已经将华为OD机试(A卷)切换为B卷。目前正在考的是B卷,按照华
·
2025-07-10 17:32
【2025B卷
专题
】华为OD机试2025B卷统一考试题库清单,时间紧张就刷这个(Python/JS/C/C++)
专栏导读本专栏收录于《华为OD机试真题(Python/JS/C/C++)》。刷的越多,抽中的概率越大,私信哪吒,备注华为OD,加入华为OD刷题交流群,每一题都有详细的答题思路、详细的代码注释、3个测试用例、为什么这道题采用XX算法、XX算法的适用场景,发现新题目,随时更新。2025年5月12日,华为官方已经将华为OD机试(A卷)切换为B卷。目前正在考的是B卷,按照华为OD往常的操作,B卷题目是由往
哪 吒
·
2025-07-10 17:32
搬砖工逆袭Java架构师
华为od
python
javascript
华为OD机试
2025B卷
Camera相机人脸识别系列
专题
分析之十六:人脸特征检测FFD算法之libcvface_api.so数据结构详细注释解析
【关注我,后续持续新增
专题
博文,谢谢!!!】
一起搞IT吧
·
2025-07-10 15:51
数码相机
算法
数据结构
人工智能
android
图像处理
计算机视觉
从零开始:构建支持上下文窗口的AI原生应用实战指南
从零开始:构建支持上下文窗口的AI原生应用实战指南关键词:大语言模型(
LLM
)、上下文窗口、AI原生应用、token管理、对话状态保持、向量检索、记忆压缩摘要:本文从AI原生应用的核心需求出发,系统讲解支持上下文窗口的应用构建全流程
AI天才研究院
·
2025-07-10 15:49
AI人工智能与大数据
AI-native
ai
深入剖析开源AI阅读器项目Saga Reader基于大模型的文本转换与富文本渲染优化方案
本文将介绍SagaReader项目中如何利用大型语言模型(
LLM
)进行网页内容抓取、智能优化和富文本渲染,特别是如何通过精心设计的提示词(prompt)引导
LLM
生成样式丰富的HTML内容,提升用户阅读体验
魑魅丶小鬼
·
2025-07-10 14:44
人工智能
实操 SpringBoot+MCP!
引言随着人工智能的飞速发展,大语言模型(
LLM
)正在革命性地重塑用户与软件的交互范式。
清风孤客
·
2025-07-10 14:13
spring
boot
后端
java
人工智能
构建你的AI应用开发平台:如何在Ubuntu上使用Docker部署Dify
Dify是一款开源的大语言模型(
LLM
)应用开发平台。它融合了后
kaixin_啊啊
·
2025-07-10 12:57
商业合作
cpolar
人工智能
ubuntu
docker
vLLM 优化与调优:提升模型性能的关键策略
在当今人工智能领域,大语言模型(
LLM
)的应用日益广泛,而优化和调优这些模型的性能成为了至关重要的任务。vLLM作为一种高效的推理引擎,提供了多种策略来提升模型的性能。
强哥之神
·
2025-07-10 11:51
人工智能
深度学习
计算机视觉
deepseek
智能体
vllm
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他