E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLm
本地大模型编程实战(25)用langgraph实现基于SQL数据构建的问答系统(4)
使大语言模型(
LLM
)查询结构化数据与非结构化文本数据有所不同。查询非结构化数据时,通常需要将待查询的文本嵌入到向量数据库中;而查询结构化数据的方法则是让
LLM
编写和执行DSL(例如SQL)进行查询。
火云牌神
·
2025-03-01 14:47
AI编程实战
sql
langgraph
LLM
deepseek
qwen
Meta:基于数据关系的
LLM
高效预训练
标题:Data-EfficientPretrainingwithGroup-LevelDataInfluenceModeling来源:arXiv,2502.14709摘要数据高效的预训练已显示出提高缩放定律的巨大潜力。本文认为有效的预训练数据应该在组级别进行管理,将一组数据点作为一个整体而不是独立的贡献者。为此,我们提出了一种新的数据高效预训练方法GroupLevelDataInfluenceMo
大模型任我行
·
2025-03-01 12:37
大模型-模型训练
人工智能
自然语言处理
语言模型
论文笔记
提升AI测试效率:如何通过RAG技术优化
LLM
输出质量
用ChatGPT做软件测试随着人工智能(AI)和大规模语言模型(
LLM
)在软件测试领域的应用日益广泛,测试效率和质量的提升成为业界关注的焦点。
测试者家园
·
2025-03-01 12:05
人工智能
软件测试
质量效能
人工智能
RAG
软件测试
软件研发
质量效能
自动化测试
LLM
AI大模型-提示工程学习笔记21-图提示 (Graph Prompting)
目录1.图提示的核心思想(1)传统提示的局限性(2)GraphPrompting的解决方案2.GraphPrompting的工作流程(1)图构建(2)图选择/子图提取(3)图编码(4)提示构建(5)
LLM
9命怪猫
·
2025-03-01 12:30
AI
人工智能
学习
大模型
ai
prompt
**LangChain 核心概念与架构详解**
简介LangChain是一个强大的框架,专注于构建基于大语言模型(
LLM
)的应用。本文将深入介绍LangChain的核心架构、关键组件以及其特性。
dgay_hua
·
2025-03-01 09:05
langchain
架构
python
借助知识图谱和Llama-Index实现基于大模型的RAG
对于
LLM
中的幻觉问题,知识图谱是一个比向量数据库更好的解决方案。知识图谱为L
爱吃牛油果的璐璐
·
2025-03-01 08:32
知识图谱
llama
oracle
语言模型
chatgpt
transformer
人工智能
全网国内外总结Prompt&
LLM
论文,开源数据&模型,AIGC应用(持续更新,收藏查看)
全网国内外总结Prompt&
LLM
论文,开源数据&模型,AIGC应用(持续更新,收藏查看)目录顺序如下国内外,垂直领域大模型Agent和指令微调等训练框架开源指令,预训练,rlhf,对话,agent训练数据梳理
代码讲故事
·
2025-03-01 07:54
智能工具
Prompt
LLM
AIGC
模型
开源
数据集
深度学习
[LangChain 学习资源大集合]
在构建语言模型应用(
LLM
)时,LangChain是当前备受关注的框架之一。无论是初学者还是进阶用户,丰富的学习资源可以帮助我们高效掌握LangChain的核心概念、工具和最佳实践。
qahaj
·
2025-03-01 06:39
langchain
学习
人工智能
python
MCP模型上下文协议集锦
MCP模型上下文协议简介MCP模型上下文协议(Model-Context-Protocol,MCP),能够实现大型语言模型(
LLM
)应用程序与本地或远程资源之间的安全、可控的交互。
galileo2016
·
2025-03-01 06:09
人工智能
Open WebUI:开源AI交互平台的全面解析
提供直观的聊天界面设计跨平台响应式设计:完美适配桌面/移动端即时响应:毫秒级响应速度富文本支持:代码语法高亮完整Markdown/LaTeX渲染语音输入支持(支持静音自动提交)模型管理多模型切换:支持不同
LLM
·
2025-03-01 06:17
大语言模型
LLM
原理篇_图解大模型从用户输入prompt到
llm
输出答案的流程原理
大模型席卷全球,彷佛得模型者得天下。对于IT行业来说,以后可能没有各种软件了,只有各种各样的智体(Agent)调用各种各样的API。在这种大势下,笔者也阅读了很多大模型相关的资料,和很多新手一样,开始脑子里都是一团乱麻,随着相关文章越读越多,再进行内容梳理,终于理清了一条清晰的脉络。笔者写原理篇时心情是有些惴惴不安的,因为毕竟对大模型的研究有限,缺乏深度。但是,还是觉得有必要记录一下学习理解心得,
喝不喝奶茶丫
·
2025-03-01 05:01
prompt
人工智能
自然语言处理
语言模型
javascript
大模型
LLM
开发基于提示工程的大语言模型(
LLM
)应用——学习笔记
本文是学习笔记。学习通过提示工程与大语言模型进行程序化的交互。将从最基本的开始,比如使用哪些模型,以及如何向它们发送提示词并查看响应。将逐步构建更复杂的提示词,并学习LangChain为我们提供的、用于与大语言模型交互的丰富工具。Langchain链核心是运行时(runnable),它们能以多种方式组合的为工作流。如何创建LangChain链 fromlangchain_nvidia_ai_end
ricky_fan
·
2025-03-01 05:31
人工智能
python
《AI大模型开发笔记》——提示词工程
1.什么是提示工程提示工程(PromptEngineering),也被称为上下文学习,是指通过精心设计的提示技术来引导
LLM
行为,而无需更改模型权重。其目标是使模型输出与给定任务的人类意图一致。
Richard Chijq
·
2025-03-01 04:27
AI大模型开发笔记
前端
服务器
运维
[论文笔记]
LLM
大模型剪枝篇——2、剪枝总体方案
https://github.com/sramshetty/ShortGPT/tree/mainMy剪枝方案(暂定):剪枝目标:1.5B—>100~600M剪枝方法:层粒度剪枝1、基于BI分数选择P%的冗余层,P=60~802、对前N%冗余层,直接删除fulllayer。N=20(N:剪枝崩溃临界点,LLaMA2在45%,Mistral-7B在35%,Qwen在20%,Phi-2在25%)对后(P
心心喵
·
2025-03-01 04:25
论文笔记
剪枝
算法
机器学习
GitHub每日最火火火项目(2.28)
olmocr项目介绍:olmocr是由allenai开发的一款用于将PDF文件线性化,以适配大语言模型(
LLM
)数据集和训练的工具包。在大语言模型的训练过程中,数据的格式和预处理极为关键。
FutureUniant
·
2025-03-01 03:50
github日推
github
人工智能
计算机视觉
音视频
ai
GitHub 星标10W+的大模型书籍:《轻松入门大模型应用开发:GPT-4 和 ChatGPT 实战指南》,25年一书通关
LLM
大模型
当下大模型这么火,还有人很多人想加入进来,但是不知道怎么去学习,那么今天我就给大家分享一本适合所有人的一本神仙级入门大模型的书籍,小白也能学会。它是由奥利维耶·卡埃朗和玛丽-艾丽斯·布莱特合著的一本《大模型应用开发极简入门:基于GPT-4和ChatGPT》,为初学者提供一份清晰、全面的“可用知识”,帮助读者快速了解GPT-4和ChatGPT的工作原理及优势。此书使用流行的Python编程语言来构建
程序员丸子
·
2025-03-01 03:19
人工智能
语言模型
自然语言处理
大模型
AI
LLM
大模型应用
大模型研究:DeepSeek三个版本(初级中级高级)资源要求说明
以下是DeepSeek-
LLM
7BChat、DeepSeek-V3、DeepSeek-
LLM
6.7B三个版本模型所需硬件资源的介绍:DeepSeek-
LLM
6.7B最小最基础版本1.内存(RAM)非量化运行时
程序猿学长
·
2025-03-01 01:08
大模型
人工智能
语言模型
Open WebUI:开源AI交互平台的全面解析
提供直观的聊天界面设计跨平台响应式设计:完美适配桌面/移动端即时响应:毫秒级响应速度富文本支持:代码语法高亮完整Markdown/LaTeX渲染语音输入支持(支持静音自动提交)模型管理多模型切换:支持不同
LLM
·
2025-03-01 01:42
一文看懂 Claude 3.7 Sonnet,为什么是第一个融合推理模式的 AI 模型
传统的大语言模型(
LLM
)通常有两种工作方式
董董灿是个攻城狮
·
2025-02-28 22:45
人工智能
【
llm
对话系统】大模型源码分析之 LLaMA 模型的 Masked Attention
在大型语言模型(
LLM
)中,注意力机制(AttentionMechanism)是核心组成部分。
kakaZhui
·
2025-02-28 20:03
llama
人工智能
AIGC
chatgpt
python
饿了么算法工程师-AIGC岗内推
1、紧跟业界最新自然语言处理技术动态,深入研发并努力创新,特别是在
LLM
、多模态理解和LLMAgent领域。
飞300
·
2025-02-28 15:26
AIGC
业界资讯
2025年,值得关注的
LLM
大趋势
面对这些变化,2025年
LLM
的大趋势值得我们关注。
LLM
的新兴应用:不仅仅是聊天机器人回想起最初我们用ChatGPT来生成代码或修改文本时,可能没有意
AI小白熊
·
2025-02-28 15:25
人工智能
产品经理
python
开发语言
学习
ai
大模型
DeepSeek掘金——DeepSeek R1架构和训练过程图解
它目前在
LLM
领域很流行,并且表现优于开源和闭源模型。为了让一切变得简单,我们将使用手绘流程图和简单的计算来帮助从头开始澄清DeeoSeek-R1的核心概念。事实上,我们将在整个博客
不二人生
·
2025-02-28 12:09
DeepSeek掘金指南
人工智能
大模型
大模型调优方法:提示工程、RAGs 与微调对比
就算是强大的预训练
LLM
也可能无法直接满足项目中的特定需求。
AI大模型探索者
·
2025-02-28 11:03
人工智能
机器学习
深度学习
ai
语言模型
【有啥问啥】深入了解 FlashMLA:Hopper GPU 的高效 MLA 解码内核
深入了解FlashMLA:HopperGPU的高效MLA解码内核简介在人工智能(AI)领域,特别是大型语言模型(
LLM
)领域,对计算效率和速度的需求持续增长。
有啥问啥
·
2025-02-28 09:12
大模型
行业调研
科普
算法
语言模型
DeepSeek R1 简单指南:架构、训练、本地部署和硬件要求
DeepSeek推出的
LLM
推理新策略DeepSeek最近发表的论文DeepSeek-R1中介绍了一种创新的方法,通过强化学习(RL)提升大型语言模型(
LLM
)的推理能力。
爱喝白开水a
·
2025-02-28 07:52
人工智能
AI大模型
DeepSeek
R1
DeepSeek
算法
人工智能训练
大模型部署
Empowering LLMs with Logical Reasoning: 从“语言大师”到“逻辑大师”的进化之路
比如,某顶尖
LLM
在回答以下问题时出现了自相矛
步子哥
·
2025-02-28 07:19
人工智能
GPT-4提示词冠军如何写 prompt:CO-STAR 框架、文本分段、系统提示
©上下文:为任务提供背景信息通过为大语言模型(
LLM
)提供详细的背景信息,可以帮助它精确理解讨论的具体场景,确保提供的反馈具有相关性。
天涯倦客的美丽人生
·
2025-02-28 04:58
prompt
数据库
游戏语音趋势解析,社交互动有助于营造沉浸式体验
语音交互的新架构出现2024年标志着对话语音AI取得了突破,出现了结合STT→
LLM
→TTS模型来聆听、推理和回应对话的协同语音系统。
网易数智
·
2025-02-28 03:22
IM即时通讯
游戏
人工智能
音视频
实时音视频
信息与通信
语音识别
大模型替代程序猿?不可能,绝对不可能!进化路线来了来!!!
大模型后端开发面试指南:技术体系构建与实践路线一、背景说明随着大模型(
LLM
)技术进入工业化落地阶段,行业对大模型后端开发工程师的需求呈现爆发式增长。
XiaoDuofCSDN
·
2025-02-28 03:48
算法
leetcode
职场和发展
java
分布式
深度学习
神经网络
通过vLLM部署
LLM
模型到生产环境中
文章目录1使用vLLM部署模型2部署过程2.1准备GPU环境2.2安装vLLM依赖项3使用vLLM部署模型并启动服务3.1部署开源模型3.2部署微调模型4测试服务是否正常运行5评估服务性能1使用vLLM部署模型本地部署模型主要包含下载模型、编写模型加载代码和发布为支持API访问的应用服务这三个步骤。这个过程通常伴随较高的人工部署成本,vLLM可以用来简化这一流程。它是一个专为大模型推理设计的开源框
MichaelIp
·
2025-02-28 01:04
人工智能实验室
大语言模型
人工智能
python
AIGC
自然语言处理
语言模型
prompt
llama
UnionLLM——通过统一接口调用国内外所有
LLM
的Python开源工具包
最近忙里偷闲和公司前端小伙伴一起撸了一个Python开源项目——UnionLLM。这是一个通过与OpenAI兼容的统一方式调用各种国内外各种大语言模型和Agent编排工具的轻量级开源工具包。我们开发它的起因是因为在实际项目中,经常需要调用多个大语言模型的API,但是国内每个大语言模型的接口和参数都不一样,这给我们的工作带来了很大的困扰和额外的成本。UnionLLM的目标是通过统一且容易扩展的方式连
everfly
·
2025-02-28 00:57
python
github
手把手教你用Docker部署Dify平台,打造可视化
LLM
应用环境
“Dify是一款开源的大语言模型(
LLM
)应用开发平台。它融合了后端即服务(BackendasService)和LLMOps的理念,使开发者可以快速搭建生产级的生成式AI应用。
脱泥不tony
·
2025-02-27 22:40
自然语言处理
AI大模型
LLM
人工智能
大语言模型
语言模型
Dify
微调
LLM
(RLHF + DPO)
微调
LLM
(RLHF+DPO)使用强化学习(RL)根据人类反馈微调大语言模型(即RLHF)的方法,以及一种更有效的改进方法(即DPO)。
·
2025-02-27 21:56
人工智能
让
LLM
来评判 | 设计你自己的评估 prompt
设计你自己的评估prompt这是让
LLM
来评判系列文章的第三篇,敬请关注系列文章:基础概念选择
LLM
评估模型设计你自己的评估prompt评估你的评估结果奖励模型相关内容技巧与提示通用prompt设计建议我总结的互联网上通用
·
2025-02-27 21:49
人工智能llmprompt
探索 LangChain: 架构、组件和应用
介绍每个组件及其用途:1.ModelModel组件是LangChain的核心,它抽象并提供了大语言模型(
LLM
)的接口。
田猿笔记
·
2025-02-27 17:23
LangChain
langchain
人工智能
大数据最全大模型入门到应用——LangChain:索引(Indexes)-[文本分割器
总目录LangChain系列文章:基础知识快速入门安装与环境配置链(Chains)、代理(Agent:)和记忆(Memory)快速开发聊天模型模型(Models)基础知识大型语言模型(LLMs)基础知识
LLM
2401_84182507
·
2025-02-27 17:22
程序员
langchain
大模型入门到应用——LangChain:索引(Indexes)-[文本分割器(2)
快速入门安装与环境配置链(Chains)、代理(Agent:)和记忆(Memory)快速开发聊天模型模型(Models)基础知识大型语言模型(LLMs)基础知识
LLM
的异步API、自定义
LLM
包装器、虚假
2301_78399616
·
2025-02-27 17:21
程序员
langchain
LangChain:Models、Prompts、Indexes、Memory、Chains、Agents。MaxKB
Models(模型):指代各类大语言模型(
LLM
),是提供语言处理和生成能力的基础。如
ZhangJiQun&MXP
·
2025-02-27 16:21
2021
AI
python
2024大模型以及算力
教学
langchain
人工智能
自然语言处理
语言模型
神经网络
自编大模型系列之 01 使用 Python 从头构建 LLaMA 3 编写您自己的十亿参数
LLM
(教程含源码)
我之前在Medium上写过一篇博客,介绍如何使用LLaMA架构从头开始创建一个具有超过230万个参数的
LLM
。现在LLaMA-3已经发布,我们将以更简单的方式重新创建它。
知识大胖
·
2025-02-27 10:33
NVIDIA
GPU和大语言模型开发教程
python
llama
开发语言
基于OneAPI+ChatGLM3-6B+FastGPT搭建
LLM
大语言模型知识库问答系统
搭建大语言模型知识库问答系统部署OneAPI拉取镜像bash复制代码dockerpulljustsong/one-api创建挂载目录bash复制代码mkdir-p/usr/local/docker/oneapi启动容器bash复制代码dockerrun--nameone-api-d--restartalways-p3001:3000-eTZ=Asia/Shanghai-v/usr/local/do
闯江湖50年
·
2025-02-27 09:31
oneapi
语言模型
人工智能
llama
langchain
gpt
自然语言处理
大语言模型(
LLM
)入门学习路线图,附资源汇总,收藏这篇就够了
Github项目上有一个[大语言模型学习路线笔记]“大语言模型学习路线笔记”),它全面涵盖了大语言模型的所需的基础知识学习,
LLM
前沿算法和架构,以及如何将大语言模型进行工程化实践。
AI小白熊
·
2025-02-27 06:34
语言模型
学习
人工智能
ai
transformer
深度学习
LLMs之ReACT-Agent:ReACT-Agent简介、实现及其使用方法(MReACT/AutoReACT)、案例应用(比如采用ReAct框架让
LLM
稳定输出JSON格式数据)之详细攻略
LLMs之ReACT-Agent:ReACT-Agent简介、实现及其使用方法(MReACT/AutoReACT)、案例应用(比如采用ReAct框架让
LLM
稳定输出JSON格式数据)之详细攻略目录相关文章
一个处女座的程序猿
·
2025-02-27 00:46
RAG_Agent
NLP/LLMs
资深文章(前沿/经验/创新)
Agent
ReACT
【Python大语言模型系列】如何在LangChain中使用ReAct构建AI Agent(案例+源码)
一、引言========当前,在各个大厂纷纷卷
LLM
的情况下,各自都借助自己的
LLM
推出了自己的AIAgent,比如字节的Coze,百度的千帆等,还有开源的Dify。你是否想知道其中的原理?
脱泥不tony
·
2025-02-27 00:12
人工智能
python
语言模型
自然语言处理
AI大模型
LangChain
Agent
GGUF 文件格式全解析
随着大语言模型(
LLM
)的广泛应用,如何高效地存储和加载这些复杂的模型成为一个亟待解决的问题。
Just_Paranoid
·
2025-02-26 22:25
技术流Clip
LLM
GGUF
量化
DeepSeek
ThinkJSON:通过强化学习让大型语言模型(
LLM
)严格遵守JSON模式
标题:ThinkInsidetheJSON:ReinforcementStrategyforStrictLLMSchemaAdherence作者:BhavikAgarwal,IshanJoshi,ViktoriaRojkova机构:MasterControlAIResearch链接:arXiv:2502.14905v1本文提出了一种轻量级强化学习框架,通过合成数据、多奖励函数和GRPO优化,显著提
AI仙人掌
·
2025-02-26 20:17
人工智能
深度学习
全面分析 DeepSeek 的新开源 FlashMLA
这一进展对于大型语言模型(
LLM
)来说意义重大,因为大型语言模型在推理过程中面临内存和计算方面的挑战,尤其是长序列。
X.Cristiano
·
2025-02-26 19:34
FlashMLA
深度学习
人工智能
Google搜索免费API访问
背景最近做Agent相关的内容,想利用
LLM
结合搜索的能力,然后根据自定义functioncall输出答案。
X.Cristiano
·
2025-02-26 19:04
ai
搜索引擎
DeepSeep开源周,第三天:DeepGEMM是啥?
对开发者的用处性能提升优化计算密集型任务(如
LLM
训练/推理),降低延迟,提升吞吐量。支持混合精度计算
程序员差不多先生
·
2025-02-26 19:33
pytorch
推荐:LangChain — 构建情境感知推理应用的利器
BuildingapplicationswithLLMsthroughcomposability⚡项目地址:https://gitcode.com/gh_mirrors/la/langchainLangChain,一款专为开发基于大型语言模型(
LLM
成婕秀Timothy
·
2025-02-26 19:33
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他