E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLm
“大语言模型微调”(Fine-tuning)与“大语言模型应用”(
LLM
Applications)之间的区别
1.概念与定义大语言模型微调微调指的是在一个经过大规模预训练的通用语言模型基础上,利用针对性较强的小规模数据集对模型进行进一步训练,从而使模型在特定领域或任务上表现得更优秀。目标:使模型更好地适应特定任务(如医疗问答、法律咨询、编程辅助等),提高准确性和专业性。方法:可以是全参数微调,也可以采用参数高效微调(如LoRA、Adapter、PrefixTuning等),后者只调整部分参数而保持原有权重
AI Echoes
·
2025-03-11 09:06
人工智能
机器学习
深度学习
【大模型开发】大模型背后的基础组件与生态概览
支撑大模型开发与部署的关键组件与生态系统当今大模型(
LLM
,LargeLanguageModel)在工业与学术界的应用日益广泛,从ChatGPT、BERT到DeepSeek等新兴模型,背后离不开一整套成熟的技术生态和工具链支持
云博士的AI课堂
·
2025-03-11 08:56
深度学习
哈佛博后带你玩转机器学习
大模型技术开发与实践
大模型开发
Hugging
Face
DeepSpeed
大模型生态
机器学习
深度学习
大模型技术栈
LangChain 发布政策详解
技术背景介绍LangChain是一个用于构建和部署大型语言模型(
LLM
)应用的生态系统。
VYSAHF
·
2025-03-11 08:25
langchain
人工智能
深度学习
python
领域大模型之微调技术和最佳实践
在本指南中,您将了解
LLM
架构、微调过程以及如何为NLP任务微调自己的预训练模型。-介绍-大型语言模型(
LLM
)的特别之处可以概括为两个关键词——大型和通用。
程序员莫玛
·
2025-03-11 07:17
人工智能
深度学习
语言模型
金融
LangChain大模型应用开发指南-大模型Memory不止于对话
【一一AGI大模型学习所有资源获取处一一】①人工智能/大模型学习路线②AI产品经理资源合集③200本大模型PDF书籍④超详细海量大模型实战项目⑤
LLM
大模型系统学习
喝不喝奶茶丫
·
2025-03-11 06:45
langchain
人工智能
大模型
大模型应用
AI大模型
Memory
大语言模型
如何对大模型进行微调?从原理到实战全解析
随着大语言模型(
LLM
)的快速发展,微调(Fine-tuning)已成为将通用模型转化为垂直领域专家的核心技术。
挣扎与觉醒中的技术人
·
2025-03-11 05:32
人工智能
外包转型
集成学习
chatgpt
gpt-3
软件工程
【RAG 论文】Program-of-Thoughts(PoT)提示:让
LLM
生成 Python 代码来解决复杂的数字计算问题
论文:ProgramofThoughtsPrompting:DisentanglingComputationfromReasoningforNumericalReasoningTasks⭐⭐⭐⭐TMLR2023Code:Program-of-Thoughts|GitHub论文速读文章提出了PoTPrompting方法,PoT可以看作是CoT(Chain-of-Thoughts)的改进,该方法通过生
yubinCloud
·
2025-03-11 03:12
LLM
Research
自然语言处理
人工智能
语言模型
算法
LLM
论文笔记 20: How to think step-by-step: A mechanistic understanding of chain-of-thought reasoning
Arxiv日期:2024.5.16机构:IIT关键词CoT本质
LLM
推理本质核心结论1.CoT推理的功能组件尽管不同阶段的推理任务具有不同的推理需求,模型内部的功能组件几乎是相同的(共享而非独享)不同的神经算法实际上是由类似归纳头
Zhouqi_Hua
·
2025-03-11 03:10
大模型论文阅读
人工智能
chatgpt
论文阅读
机器学习
深度学习
语言模型
《ChatGPT Prompt Engineering for Developers》课程-提示词原则
编写Prompt的原则本章的主要内容为编写Prompt的原则,在本章中,我们将给出两个编写Prompt的原则与一些相关的策略,你将练习基于这两个原则来编写有效的Prompt,从而便捷而有效地使用
LLM
。
evil-tomato
·
2025-03-11 02:09
LLM
chatgpt
人工智能
python
ai
如何添加示例到提示中进行查询分析
在我们的查询分析变得越来越复杂时,
LLM
(大型语言模型)可能难以理解在某些场景下到底应该如何响应。为了提升性能,我们可以在提示中添加示例来指导
LLM
。
dgay_hua
·
2025-03-11 02:39
windows
python
linux
LLM
Weekly(2025.02.17-02.23)
本文是
LLM
系列文章,主要是针对2025.02.17-02.23这一周的
LLM
相关新闻与文章、GitHub资源分享。网络新闻Grok3Beta——推理代理的时代。
UnknownBody
·
2025-03-11 01:59
LLM
Daily
LLM
Weekly
人工智能
自然语言处理
大语言模型(
LLM
)入门学习路线图,从零基础到精通,理论与实践结合的最佳路径!
Github项目上有一个大语言模型学习路线笔记,它全面涵盖了大语言模型的所需的基础知识学习,
LLM
前沿算法和架构,以及如何将大语言模型进行工程化实践。
ai大模型应用开发
·
2025-03-10 22:39
语言模型
学习
人工智能
机器学习
AI
自然语言处理
大模型好书推荐 -挖到宝了,500页RAG神书几乎把RAG讲得透透的
《基于大模型的RAG应用开发与优化——构建企业级
LLM
应用》是一本专注于RAG(Retrieval-AugmentedGeneration,检索增强生成)技术应用的书籍。
脱泥不tony
·
2025-03-10 14:07
人工智能
语言模型
自然语言处理
LLM
RAG
大模型入门
大模型
大模型系列——Spring AI Advisor 指南
我们正在广泛实现各种RAG应用和提示API,并使用
LLM
创建令人印象深刻的项目。借助SpringAI,我们可以更快、更稳定地完成这些任务。
猫猫姐
·
2025-03-10 14:06
大模型
人工智能
spring
java
Spark-TTS:基于大模型的文本语音合成工具
GitHub:https://github.com/SparkAudio/Spark-TTSSpark-TTS是一个先进的文本到语音系统,它利用大型语言模型(
LLM
)的强大功能进行高度准确和自然的语音合成
CITY_OF_MO_GY
·
2025-03-10 13:35
魅力语音
语音识别
深度学习
人工智能
Claude更新王炸功能:一键生成、评估、优化提示词!
类似地,要想让
LLM
模型或生成式AI工具更好的为你服务,你得先学会“写提示词”。提示词就是敲开AI大门的那把钥匙,相同的任务目标,不同的提示词得到的结果可能截然不同。
AI信息Gap
·
2025-03-10 10:46
人工智能
chatgpt
gpt
ai
OpenAI
Process-based Self-Rewarding Language Models 论文简介
基于过程的自奖励语言模型:
LLM
优化的新范式引言大型语言模型(
LLM
)在多种任务中展现出了强大的能力,尤其是在使用人工标注的偏好数据进行训练时。
ZHOU_CAMP
·
2025-03-10 08:31
deepseek
related
论文
人工智能
深度学习
Prompt Engineering 指南
但是大预言模型(
LLM
)的作用不仅于此,使用它构建业务系统或者给业务系统赋能的能力现阶段还未完全开发出来,我相信在不久之后,尤其是国产
LLM
成熟、相关监管法规落实之后,
陈小龙丶呐喊
·
2025-03-10 06:16
人工智能
【OpenAI官方课程】第一课:GPT-Prompt 的构建原则指南
本课程将教您如何通过OpenAIAPI有效地利用大型语言模型(
LLM
)来创建强大的应用程序。
euffylee
·
2025-03-10 06:12
ChatGPT
Prompt官方课程
gpt
prompt
人工智能
如何高效使用LangChain实现复杂任务:全面功能指南
LangChain是一个强大的工具集,它为开发基于大语言模型(
LLM
)的应用提供了丰富的组件和功能支持。
shuoac
·
2025-03-10 04:00
langchain
前端
python
什么是MCP协议?AI Agent时代如何选择MCP协议?
摘要在人工智能(AI)迅猛发展的今天,如何让大型语言模型(
LLM
)充分利用外部数据和工具已成为关键问题。
猫头虎
·
2025-03-10 04:29
人工智能
MCP
AI编程
ide
agi
AIGC
AI-native
使用LangChain构建大语言模型(
LLM
)应用程序: 基础入门
使用LangChain构建大语言模型(
LLM
)应用程序:基础入门在这个教程中,我们将了解如何使用LangChain快速上手并构建一个基本的大语言模型(
LLM
)应用。
bavDHAUO
·
2025-03-10 04:57
langchain
语言模型
服务器
python
使用LangChain构建简单的
LLM
应用
在这篇快速入门教程中,我们将向您展示如何使用LangChain构建一个简单的
LLM
(大型语言模型)应用程序。
fgayif
·
2025-03-10 02:12
langchain
java
数据库
python
《DeepSeek+Langchain落地实操:RAG知识增强检索和智能体实战开发》
它的设计理念在于简化和加速利用大型语言模型(
LLM
)和对话模型构建应用程序的过程。这个框架提供了一套全面的工具、组件和接口,旨在简化基于大型语言模型和对话模型的应用程序开发过程。
AI周红伟
·
2025-03-09 21:25
langchain
【简单记录】RAG与
LLM
的交互流程
一、流程名称该流程旨在通过结合用户查询、相关知识源和大型语言模型(
LLM
),生成一个增强上下文的文本响应。
努力努力再努力呐
·
2025-03-09 19:14
RAG
LLM
RAG
LLM
Manus:通用型Agent的技术革新与多元应用场景
其核心理念独树一帜,旨在为大语言模型(
LLM
)赋予“手”的能力,使其借助工具调用与任务执行,将抽象知识转化为切实可行的实际操作,开启人工智能应用的崭新时代。
蚂蚁质量
·
2025-03-09 16:16
其他
python
深度学习
【论文阅读】LayoutPrompter: Awaken the Design Ability of Large Language Models
本文提出Layout-Prompter,利用大型语言模型(
llm
)通过上下文学习来解决上述问题。LayoutPr
进击的乔洋
·
2025-03-09 16:40
论文阅读
语言模型
人工智能
大规模语言模型构建流程
大规模语言模型1.大语言模型大规模语言模型(LargeLanguageModels,
LLM
),也称大语言模型,是一种由包含数百亿以上参数的深度神经网络构建的语言模型,通常使用自监督学习方法通过大量无标注文本进行训练
人工智能技术笔记
·
2025-03-09 15:34
语言模型
人工智能
自然语言处理
LLM
时代的小模型思考:《What is the Role of Small Models in the
LLM
Era: A Survey》论文笔记
ImperialCollegeLondonAbstract问题:扩大模型大小会导致计算成本和能耗呈指数级增长,这使得这些模型对于学术研究人员和资源有限的企业来说不切实际小型模型(SMs)经常用于实际环境中,引发了关于小模型在
LLM
FrancisQiu
·
2025-03-09 14:02
learning
nlp
paper
reading
论文阅读
OpenManus:快速复刻Manus项目的技术路径与实施策略
这种设计使得复刻项目时能够快速剥离非必要模块,例如:模块替换:通过修改config.toml的
llm
配置段,可在1小时内完成从GPT-4到Claude3的模型切换功能裁剪:删除vision模块相关代码及配置项即可实现
花生糖@
·
2025-03-09 12:15
manus
openmanus
AI
开源
人工智能
【快速入门】本地知识库部署:FastGPT与Dify轻松上手全指南!
本文主要内容本地部署Dify、FastGPT、OllamaDify、FastGPT对接一些目前免费的
LLM
大语言AI模型Dify、FastGPT对接Ollama本地模型大家好,我是一名喜欢在家折腾本地部署的开发者
大模型老炮
·
2025-03-09 11:33
大模型入门
大模型
人工智能
产品经理
大模型学习
知识库部署
AI
LLM
大模型安全概述
引言2022年底以来,以ChatGPT为代表的大模型飞速发展,正在成为#驱动新质生产力发展#的新动能、人类探索未知的新工具.在显著提升人工智能(artificialintelligence,AI)模型通用理解和生成能力的同时,也带来了前所未有的安全风险.大模型的能力与风险生成式大模型因其强大的智能能力和巨大的应用潜力吸引了众多研究者和企业的关注.从智能能力的角度来看,研究人员观测到:当训练数据和参
LLM教程
·
2025-03-09 06:06
安全
人工智能
chatgpt
embedding
langchain
llama
在 VSCode 中本地运行 DeepSeek,打造强大的私人 AI
步骤1:在VSCode中安装Ollama和CodeGPT要在本地运行DeepSeek,我们首先需要安装Ollama,它允许我们在我们的机器上运行
LLM
,以及CodeGPT,它是集成这些模型以提供编码辅助的
csdn_aspnet
·
2025-03-08 23:19
DeepSeek
Visual
Studio
vscode
DeepSeek
大模型RAG入门到实战基础教程(非常详细),大模型RAG入门到精通,收藏这一篇就够了!
写在前面大模型(LargeLanguageModel,
LLM
)的浪潮已经席卷了几乎各行业,但当涉及到专业场景或行业细分域时,通用大模型就会面临专业知识不足的问题。
AI程序猿人
·
2025-03-08 18:56
人工智能
AI大模型
AI
RAG
LLM
大语言模型
大模型入门
研究发现,
LLM
基于数据的内在含义进行表示,并以其主导语言推理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行!订阅:https://rengongzhineng.io/【本周AI新闻:Deepseek崛起背后:AI智能代理时代正式到来?】https://w
新加坡内哥谈技术
·
2025-03-08 16:21
人工智能
自然语言处理
语言模型
深度学习
copilot
解锁 Hugging Face 的 smolagents:AI 代理的革命性突破!
AI代理的崛起随着大型语言模型(
LLM
)推理能力的增强,AI代理成为了当前最热门的话题。这些代理不仅能够独立做出决策,还能根据用户输入执行任务。
真智AI
·
2025-03-08 13:27
人工智能
python
开发语言
机器学习
pandas
Ollama:让大型语言模型触手可及
Ollama:让大型语言模型触手可及导语:近年来,大型语言模型(
LLM
)发展迅猛,但对于普通用户而言,搭建和使用
LLM
仍有一定门槛。
步子哥
·
2025-03-08 12:15
AGI通用人工智能
语言模型
人工智能
自然语言处理
DeepSeek掘金——vLLM和ollama综合对比
欢迎来到我们深入研究
LLM
推理框架的最后一部分!在第一部分和第二部分中,我们分别探讨了Ollama和vLLM,了解了它们的架构、功能和基本性能特征。
不二人生
·
2025-03-08 10:12
DeepSeek掘金指南
大模型
DeepSeek
人工智能
打卡代码随想录第17天:LeetCode654.最大二叉树 、 617.合并二叉树、 700.二叉搜索树中的搜索、98.验证二叉搜索树
学习资料:代码随想录文中含
LLM
生成内容,不一定对654.最大二叉树力扣题目地址思路:不断寻找该部分的最大值去切割数组,不断递归,到在左闭右开区间不成立时,返回空节点。
jingjingjing1111
·
2025-03-08 07:26
算法
数据结构
打卡代码随想录第15天:LeetCode 110.平衡二叉树 257. 二叉树的所有路径 404.左叶子之和
学习资料:代码随想录文中含
LLM
生成内容110.平衡二叉树力扣题目链接思路:逐层返回当前节点的最大高度,比较各节点的左右孩子高度后续方法遍历,因为‘中’是比较环节,要在左右之后/***Definitionforabinarytreenode
jingjingjing1111
·
2025-03-08 07:24
leetcode
打卡代码随想录算法训练营第11天: 150. 逆波兰表达式求值 239. 滑动窗口最大值 347.前 K 个高频元素
代码随想录文中含
LLM
回答内容150.逆波兰表达式求值力扣题目链接思路K:先理解逆波兰表达式是啥,是把运算符放在了两个要运算的数字的后边,又叫后缀表达式。
jingjingjing1111
·
2025-03-08 07:51
leetcode
山海鲸接入DeepSeek~赋予AI 3D感知“超能力”
山海鲸震撼升级,一键直连DeepSeek、通义千问等主流大模型,融合前沿3D-
LLM
算法,赋予AI3D感知“超能力”,让数字孪生生产力全面爆发,开启无限可能!
山海鲸可视化
·
2025-03-08 06:03
数字孪生
数字孪生
AI
DeepSeek
通义千问
3D
NL2SQL技术方案系列(5):金融领域NL2SQL技术方案以及行业案例实战讲解3--非
LLM
技术方案
NL2SQL技术方案系列(5):金融领域NL2SQL技术方案以及行业案例实战讲解3NL2SQL基础系列(1):业界顶尖排行榜、权威测评数据集及
LLM
大模型(SpidervsBIRD)全面对比优劣分析[Text2SQL
汀、人工智能
·
2025-03-08 03:00
LLM工业级落地实践
prompt
人工智能
大语言模型
NL2SQL
Text2SQL
NL2SQL技术方案系列(1):NL2API、NL2SQL技术路径选择;
LLM
选型与Prompt工程技巧,揭秘项目落地优化之道
NL2SQL技术方案系列(1):NL2API、NL2SQL技术路径选择;
LLM
选型与Prompt工程技巧,揭秘项目落地优化之道NL2SQL基础系列(1):业界顶尖排行榜、权威测评数据集及
LLM
大模型(SpidervsBIRD
汀、人工智能
·
2025-03-08 03:59
LLM工业级落地实践
prompt
人工智能
大语言模型
NL2SQL
Text2SQL
AI大模型
自然语言处理
NL2SQL进阶系列(2):DAIL-SQL、DB-GPT开源应用实践详解[Text2SQL]
NL2SQL进阶系列(2):DAIL-SQL、DB-GPT开源应用实践详解[Text2SQL]NL2SQL基础系列(1):业界顶尖排行榜、权威测评数据集及
LLM
大模型(SpidervsBIRD)全面对比优劣分析
汀、人工智能
·
2025-03-08 03:58
LLM工业级落地实践
gpt
人工智能
深度学习
大语言模型
sql
NL2SQL
Text2SQL
Spring AI简单使用
Java大模型应用开发,微服务整合DeepSeek,LangChain大型语言模型
LLM
实战-尚硅谷文
NaughtyBo
·
2025-03-08 01:40
记录
spring
CentOS 7中安装Dify
Dify是一个开源的
LLM
应用开发平台。其直观的界面结合了AI工作流、RAG管道、Agent、模型管理、可观测性功能等,让您可以快速从原型到生产。
laolitou_1024
·
2025-03-07 22:04
CentOS
Docker
AI
centos
运维
人工智能
Agentic Security:开源
LLM
漏洞扫描器
AgenticSecurity:开源
LLM
漏洞扫描器项目地址:https://gitcode.com/gh_mirrors/ag/agentic_security项目介绍AgenticSecurity是一款开源的大型语言模型
袁立春Spencer
·
2025-03-07 13:06
LLM
辅助编程:代码自动生成与优化
LLM
,代码生成,代码优化,编程辅助,AI编程,自然语言处理,深度学习1.背景介绍随着软件开发的日益复杂化,程序员面临着越来越高的开发压力和效率要求。
AI智能涌现深度研究
·
2025-03-07 05:54
计算机软件编程原理与应用实践
DeepSeek
R1
&
大数据AI人工智能
java
python
javascript
kotlin
golang
架构
人工智能
【大模型技术】LlamaFactory 的原理解析与应用
LlamaFactory是一个基于LLaMA系列模型(如LLaMA、LLaMA2、Vicuna等)的开源框架,旨在帮助开发者和研究人员快速实现大语言模型(
LLM
,LargeLanguageModel)的微调
大数据追光猿
·
2025-03-07 00:32
大模型
transformer
人工智能
语言模型
python
github
docker
机器学习
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他