E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLM
【AI论文】超越80/20规则:高熵少数令牌驱动
LLM
推理的有效强化学习
摘要:具有可验证奖励的强化学习(RLVR)已经成为一种增强大型语言模型(
LLM
)推理能力的强大方法,但其机制尚未得到很好的理解。
东临碣石82
·
2025-06-06 22:49
人工智能
LLM
多平台统一调用系统-LiteLLM概述
概述在当今快速发展的AI领域,大语言模型(
LLM
)已成为技术创新的核心驱动力。
一 铭
·
2025-06-06 16:43
大模型(LLM)
开发语言
大模型
人工智能
LLM
MCP协议在
LLM
系统中的架构与实现原理研究
MCP协议的角色和功能定位模型上下文协议(ModelContextProtocol,MCP)是由Anthropic公司(Claude模型的发布方)提出的一种开放协议,旨在标准化大型语言模型(
LLM
)与外部数据源
ImNIk
·
2025-06-06 11:38
GenAI
架构
AI-native
【AI大模型通关秘籍】我的提示词工程19式进阶笔记 (萌新也能懂的保姆级教程)
自从一脚踏入大语言模型(
LLM
)这个神奇的世界,我就像打开了新世界的大门,每天都被它的强大所震撼。但同时,我也曾困惑于如何与这个“最强大脑”更好地沟通,让它真正为我所用。
昨日嘉靖(学习LLM版)
·
2025-06-06 10:03
人工智能
笔记
RAG入门之数据导入
LangChain是什么LangChain是一个用于构建基于大语言模型(
LLM
)应用的开源框架。它提供了一套工具和抽象,让开发者能够轻松构建复杂的AI应用。
·
2025-06-06 10:49
人工智能ai开发
LLM
提示词大赛冠军 Co-STAR 模型
CO-STAR模型根据新加坡提示工程大赛的获胜框架CO-STAR,来构建完整和有效的提示词:-C-Context(清楚的背景信息)-O-Objective(明确的目标设定)-S-Style(生成文字的风格)-T-Tone(生成文字的语调)-A-Audience(目标受众的描述)-R-Response(回应的类型,如表格、段落数量等)具体的构建方法是这样的首先,我提供了一个我经营的背景。接着,我设定
修昔底德
·
2025-06-06 08:42
人工智能
语言模型
【论文解读】MemGPT: 迈向为操作系统的
LLM
1stauthor:CharlesPackerpaperMemGPT[2310.08560]MemGPT:TowardsLLMsasOperatingSystemscode:letta-ai/letta:Letta(formerlyMemGPT)isthestatefulagentsframeworkwithmemory,reasoning,andcontextmanagement.这个项目现在已
vlln
·
2025-06-06 07:07
transformer
人工智能
深度学习
自然语言处理
从零教你做一个mcp服务端和客户端,真正理解什么是mcp(保姆级教程+代码),智能体和大模型的高效落地就靠mcp了。
无数开发者在探索如何让AI模型(比如
LLM
)更智能、更高效地与外部世界互动时,都遇到了瓶颈。传统的API调用方式,往往显得笨拙、低效,甚至有点“智障”。但是,想象一下…
AI人工智能时代
·
2025-06-06 02:08
人工智能
大语言模型学习笔记
一、大型语言模型(
LLM
)概念1、
LLM
定义、特点、核心:处理海量文本,多者可以具备数百亿参数,理解语言深度,展现涌现能力它的核心是注意力机制:通过注意力机制,transformer能够聚焦于输入序列中的重要部分
wyzgq0515
·
2025-06-05 10:21
语言模型
学习
笔记
【学习笔记6】论文SQLfuse: Enhancing Text-to-SQL Performance through Comprehensive
LLM
Synergy
AbstractText-to-SQL转换是一项关键创新,简化了从复杂SQL语句到直观自然语言查询的转换,尤其在SQL在各类岗位中广泛应用的情况下,这一创新显得尤为重要。随着GPT-3.5和GPT-4等大型语言模型(LLMs)的兴起,这一领域得到了极大的推动,提供了更好的自然语言理解能力和生成细致入微的SQL语句的能力。然而,在Text-to-SQL应用中,开源LLMs的潜力尚未得到充分挖掘,许多
||Φ|(|T|Д|T|)|Φ||/
·
2025-06-05 07:59
sql
[论文阅读笔记] Learning Transferable Visual Models From Natural Language Supervision
Abstract将
LLM
带来的语言zero-shot能力扩展到图像领域,让图像pretrain不再局限于由数据集定义的类别,从而大幅度提升在downstream任务zero-shot的精度。
Heartache Doctor
·
2025-06-05 07:28
笔记
论文阅读
笔记
【大模型入门指南 10】大模型推理部署:vLLM和llama.cpp
【大模型入门指南】系列文章:【大模型入门指南01】深度学习入门【大模型入门指南02】
LLM
大模型基础知识【大模型入门指南03】提示词工程【大模型入门指南04】Transformer结构【大模型入门指南05
青松ᵃⁱ
·
2025-06-05 06:18
LLM入门系列
llama
OpenAI ChatGPT 与 Google Gemini 特性深度对比分析
最近,ChatGPT和Gemini一直是
LLM
的主要话题,并且有很多关于它们功能的比较。在本文中,我们比较了该领域的两个领先者:OpenAI的ChatGPT和GoogleGemini。
KompasAI
·
2025-06-05 05:15
chatgpt
人工智能
RAG架构中用到的模型学习思考
前言RAG(Retrieval-AugmentedGeneration,检索增强生成)架构结合了检索和生成能力,通过引入外部知识库来提升大语言模型(
LLM
)的回答准确性和可靠性。
勤奋的知更鸟
·
2025-06-05 05:40
架构
AI系统提示词:Grok 3 Chat Assistant
系统提示词的作用与意义在大型对话模型(
LLM
)中,系统提示词(SystemPrompt)相当于为AI设定的“行为准则”与“角色定位说明”,决定了模型在具体交互场景下的身份设定、可用工具、回答策略与限制条件
德育处主任Pro
·
2025-06-04 22:45
人工智能
【AI News | 20250331】每日AI进展
AIRepos1、MCP-Chinese-Getting-Started-Guide模型上下文协议(MCP)是一个创新的开源协议,旨在标准化大语言模型(
LLM
)与外部数据源及工具的连接方式,类似AI应用的
三道杠卷胡
·
2025-06-04 15:22
AI
Daily
News
人工智能
python
github
语言模型
AIGC
WeClone项目v0.1.2版本发布:声音克隆与聊天机器人集成
数字克隆/数字分身/
LLM
/大语言模型/微信聊天机器人/LoRA项目地址:https://gitcode.com/gh_mirrors/we/WeCloneWeClone是一个专注于AI克隆技术的开源项目
单盼晔
·
2025-06-04 13:07
一文看懂 MCP 大模型架构:从事件驱动到智能涌现,全链路实战解构!
):1、认知迭代:认知智能体在流程自动化、决策辅助等领域的颠覆性2、场景淬炼:通过“需求探矿-场景验证-价值量化”三阶模型3、工程落地:构建Agent的完整技术栈企业要真正跑通“大模型”,不是单靠一个
LLM
AI大模型-小涂
·
2025-06-04 12:28
架构
AI大模型
大模型入门
大模型学习
MCP
人工智能
LLM
Spring AI系列之使用 Mistral AI API 实现函数调用
1.概述利用大型语言模型(
LLM
),我们可以检索大量有用的信息。我们可以学习关于任何事物的许多新知识,并基于互联网上已有的数据获得答案。我们可以让它们处理输入数据并执行各种操作。
@@@八爪鱼
·
2025-06-04 08:56
人工智能
spring
java
【大模型技术】怎么用agent和prompt工程实现用户的要求?
使用Agent和Prompt工程是实现用户需求的一种强大方法,尤其是在基于大语言模型(
LLM
)的应用中。以下是一个详细的步骤指南,帮助您理解如何结合Agent和Prompt工程来满足用户的需求。
大数据追光猿
·
2025-06-04 05:30
大模型
prompt
microsoft
数据库
Prompt提示工程上手指南:基础原理及实践(四)-检索增强生成(RAG)策略下的Prompt
前言此篇文章已经是本系列的第四篇文章,意味着我们已经进入了Prompt工程的深水区,掌握的知识和技术都在不断提高,对于Prompt的技巧策略也不能只局限于局部运用而要适应
LLM
大模型的整体框架去进行改进休整
fanstuck
·
2025-06-04 04:59
一文速学-人工智能项目实战
prompt
人工智能
机器学习
LLM
AIGC
【大模型框架】
LLM
大模型开源RAG框架汇总
前言本文搜集了一些开源的基于
LLM
的RAG(Retrieval-AugmentedGeneration)框架,旨在吸纳业界最新的RAG应用方法与思路。
RAG知识库
·
2025-06-04 00:29
开源
人工智能
LLM
大模型
AI大模型
RAG
本地化部署
模块化设计:构建可扩展的
LLM
应用架构
引言模块化设计与
LLM
应用架构概述在当今信息技术飞速发展的时代,人工智能(AI)技术的进步尤为引人注目。
AI天才研究院
·
2025-06-03 23:48
ChatGPT
计算
java
python
javascript
kotlin
golang
架构
人工智能
从零开始构建
LLM
智能代理:基础架构和关键组件
从零开始构建
LLM
智能代理:基础架构和关键组件作者:禅与计算机程序设计艺术1.背景介绍1.1
LLM
智能代理的兴起近年来,大型语言模型(
LLM
)在自然语言处理领域取得了显著的进展,展现出惊人的文本生成、理解和推理能力
AI智能应用
·
2025-06-03 22:48
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
大语言模型(
LLM
)入门 - (2) 模型构建
文章来自:大语言模型(
LLM
)小白入门自学项目-TiaoYu-1GitHub-tiaoyu1122/TiaoYu-1:ForPeople!ForFreedom!ForPeople!
小鸡吃石子
·
2025-06-03 18:47
TiaoYu-1
语言模型
人工智能
自然语言处理
大语言模型(
LLM
)入门 - (18) 梯度消失与梯度爆炸
文章来自:大语言模型(
LLM
)小白入门自学项目-TiaoYu-1GitHub-tiaoyu1122/TiaoYu-1:ForPeople!ForFreedom!ForPeople!
小鸡吃石子
·
2025-06-03 18:47
语言模型
人工智能
自然语言处理
大语言模型(
LLM
)入门 - (20) 人类反馈强化学习
文章来自:大语言模型(
LLM
)小白入门自学项目-TiaoYu-1GitHub-tiaoyu1122/TiaoYu-1:ForPeople!ForFreedom!ForPeople!
小鸡吃石子
·
2025-06-03 18:47
语言模型
人工智能
自然语言处理
大语言模型(
LLM
)入门 - (1) 相关概念
文章来自:大语言模型(
LLM
)小白入门自学项目-TiaoYu-1GitHub-tiaoyu1122/TiaoYu-1:ForPeople!ForFreedom!ForPeople!
小鸡吃石子
·
2025-06-03 18:13
TiaoYu-1
语言模型
人工智能
自然语言处理
AiPy自动化数学题生成实战,修复表弟暑假“太闲.bug”
官方网站:https://www.aipyaipy.com/AiPy是知道创宇发布的开源框架,是一款融合
LLM
与Python生态的自动化工具平台,以“Python-Use”范式重新定义AI任务执
·
2025-06-03 17:56
大模型、AI人工智能:核心技术与发展趋势
引言近年来,人工智能(AI)技术迅猛发展,尤其是大语言模型(
LLM
)如ChatGPT、DeepSeek、Claude等的崛起,正在改变我们的生活和工作方式。
milk_yan
·
2025-06-03 17:04
AI大模型
人工智能
语言模型
深入学习
LLM
开发 第十九章:模型服务化开发(FastAPI集成与异步处理)
针对下面的文章形成一个封面的文生图提示词,要求能体现出LangServe、FastAPI,要求具备科技感基于LangChain与FastAPI的模型服务化开发方案一、技术架构概述LangChain是一个专为大语言模型(
LLM
沙子可可
·
2025-06-03 14:18
学习
fastapi
langchain
人工智能
LightRAG vs GraphRAG:两种RAG系统实体与关系提取提示机制的深度比较
概述LightRAG实体与关系提取提示GraphRAG实体与关系提取提示深度对比分析提示设计复杂度功能覆盖与输出格式可定制性与扩展性性能与成本考量场景适用性与选型建议结论与展望引言随着大规模语言模型(
LLM
gs80140
·
2025-06-03 12:34
AI
rag
AI Agent工程实践:从提示词到自主智能
AIAgent技术——工程侧的应用与提示词设计从工程和应用的视角看,AIAgent不再仅仅是一个抽象概念,它是一套通过精心设计的提示词(PromptEngineering)和外部执行框架,将大型语言模型(
LLM
由数入道
·
2025-06-03 11:26
架构智能体
人工智能
智能体
提示词工程
在本地基于deepseek和Dify平台构建私有化知识库平台
Dify开源的
LLM
应用开发平台,提供可视化界面和API集成能
勤奋的知更鸟
·
2025-06-03 03:31
AI大模型
knowledge
RAG
RAGFlow从理论到实战的检索增强生成指南
六、未来展望:RAGFlow的进化方向前言在AI大模型时代,如何让
LLM
(大型语言模型)摆脱“幻觉”并输出可信内容?答案藏在RAG(检索增强生成)技术中
勤奋的知更鸟
·
2025-06-03 03:01
AI大模型
rag
认识GraphRAG
GraphRAG(Graph-basedRetrieval-AugmentedGeneration)是微软提出的新一代检索增强生成技术,其核心创新在于将知识图谱与大语言模型(
LLM
)深度融合,突破传统RAG
勤奋的知更鸟
·
2025-06-03 03:01
AI大模型
graphrag
自动驾驶大模型---小米&华科的ORION端到端方案
背景关于大模型/端到端,笔者也已经写了一个系列,其中主要包括以下几篇(持续更新):《大模型---DeepseekLLM大语言模型原理》《大模型---一文看懂视觉语言大模型VLM》《大模型实战---人人都可以部署
LLM
智能汽车人
·
2025-06-03 03:30
自动驾驶
人工智能
机器学习
FlashAttention(flash_attn) 的高效注意力机制实现库学习,与 torch.nn.MultiheadAttention 在数学上是完全相同
它通过减少显存占用和加速计算,显著提升大模型(如
LLM
、视觉Transformer)的训练和推理效率。
Hali_Botebie
·
2025-06-03 00:09
学习
大语言模型生成式AI学习笔记——2. 1.4
LLM
指令微调——多任务指令微调
Multi-taskinstructionfine-tuning(多任务指令微调)Multitaskfine-tuningisanextensionofsingletaskfine-tuning,wherethetrainingdatasetiscomprisedofexampleinputsandoutputsformultipletasks.Here,thedatasetcontainsexa
预见未来to50
·
2025-06-02 23:57
机器学习
深度学习(ML/DL)
算法
AI Agent: AI的下一个风口 大模型时代狂飙猛进
自2017年以来,transformer模型的出现,以及大规模语言模型(
LLM
)和多模态模型的兴起,极大地推动了AI的发展。
AI天才研究院
·
2025-06-02 20:38
AI
Agent
应用开发
AI大模型企业级应用开发实战
大厂Offer收割机
面试题
简历
程序员读书
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
Java
Python
架构设计
Agent
程序员实现财富自由
LLM
的工作原理详解
文章目录1.
LLM
的核心概念1.1什么是token?
我就是全世界
·
2025-06-02 18:22
大模型技术与应用
人工智能
本地模型+MCP实践
可以参考实现本地模型的部署或者是使用其他方式文章链接:LMStudio本地部署大模型-CSDN博客什么是MCPMCP(ModelContextProtocol,模型上下文协议)是由Anthropic公司推出的开放标准协议,旨在为大型语言模型(
LLM
t梧桐树t
·
2025-06-02 15:32
python
ai
本地部署dify+ragflow+deepseek ,结合小模型实现故障预测,并结合本地知识库和大模型给出维修建议
Dify则旨在降低大型语言模型(
LLM
)应用开发的门槛,提供低代码甚至无代码的开发体验,适合快速构建和部署多种AI应用。因此文档处
算法小菜鸟成长心得
·
2025-06-02 15:00
语言模型
Svelte 5 在跨平台 AI 阅读助手中的实践:轻量化前端架构的极致性能优化
作为一个典型的前端开发者,去年在为公司调研Rust前端工具链、
LLM
应用开发技术体系的时候,对这类技术领域产生了浓厚的兴趣,也是出于早期曾经是一名Android移动应用个人开发者角色的经历,习惯性的给自己设定了一个工具主题的产品
Sopaco
·
2025-06-02 13:48
人工智能
前端
架构
如何利用大语言模型生成特定格式文风的报告类文章
在这个算法渗透万物的时代,我们不再仅仅满足于大语言模型(
LLM
)能“写”,更追求它能“写出精髓,写出风格”。
由数入道
·
2025-06-02 03:36
提示词工程
语言模型
人工智能
自然语言处理
BitNet:让1-bit大语言模型飞速运转
这就是我们现代大语言模型(
LLM
)面对的挑战:它们需要处理海量的文本数据,并且要尽可能快地理解、生成并输出语言。传统的
LLM
,就像拿着一支粉笔在黑板上拼命书写的老师,虽然效率不低,但总有点力不从心。
步子哥
·
2025-06-02 02:29
AGI通用人工智能
语言模型
人工智能
自然语言处理
它包括一个成熟的全文搜索引擎、矢量数据库、
LLM
界面和更多实用程序
它包括一个成熟的全文搜索引擎、矢量数据库、
LLM
具有行动计划和推理功能的接口、用于根据数据编写和运行您自己的自定义代理的JavaScript运行时,以及更多实用程序。
struggle2025
·
2025-06-01 23:08
人工智能
python
rust
源码解析(一):GraphRAG
原文技术博客GraphRAG是一种结构化的、分层的检索增强生成(RAG)方法,它利用知识图谱来增强
LLM
的输出,用于推理私有数据集中的复杂信息。
汪汪汪侠客
·
2025-06-01 21:51
源码解析
graphrag
大模型
算法
面试
rag
Spring Ai 从Demo到搭建套壳项目(一)初识与实现与deepseek对话模式
前言为什么说Java长青,主要是因为其生态圈完善,Spring又做了一款脚手架,把对接各个
LLM
厂商的sdk做了一遍,形成一系列的spring-ai-starter-**的依赖。
·
2025-06-01 20:56
推理模型与普通模型的思考逻辑到底有什么不一样
1.推理模型:AI界的“思考者”1.1从蒙眼猜拳到步步为营传统
LLM
像是蒙着眼睛的拳击手,输入问题后直接挥拳(输出答案),可能一击制胜也可能打偏。
TGITCIC
·
2025-06-01 20:13
AI-大模型的落地之道
大模型推理
推理模型
reasoning
model
DeepSeek
深度搜索
deepsearch
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他