E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
llm
Ubuntu 服务器Llama Factory 搭建DeepSeek-R1微调训练环境
1.首先了解一下什么是
LLM
微调
LLM
微调指的是在已经预训练好的大型语言模型基础上,使用特定的任务数据或领域数据,通过进一步的训练来调整模型的参数,使其在特定任务或领域上能够表现得更好。
大鱼>
·
2025-04-16 16:40
AI
大模型
llama
deepseek
大模型微调
LangChain4j 工具调用详解:从基础到高级的实战指南
它允许
LLM
在必要时调用一个或多个可用的工具,这些工具通常由开发人员定义。工具可以是任何东西:网络搜索、调用外部API,或者执行一段特定的代码等。LLMs本身并不能实际调用工具;相反,它们会在响应
泰山AI
·
2025-04-16 16:37
精品专栏
java
springboot
langchain4j
tools
mcp
ai
llm
Spring AI使用tool Calling和MCP
深入探索SpringAISpringAI版本1.0.0.M6在人工智能与软件开发深度融合的时代,SpringAI作为一个强大的框架,持续为开发者提供着高效且便捷的工具,以实现与大语言模型(
LLM
)的无缝交互
_沉浮_
·
2025-04-16 13:18
spring
人工智能
java
检索增强生成(RAG):利用Python、LangChain和OpenAI实现前沿的自然语言处理技术
检索增强生成(RAG):利用Python、LangChain和OpenAI实现前沿的自然语言处理技术引言在自然语言处理(NLP)的领域中,随着大型语言模型(
LLM
)的发展,我们已经见证了许多突破性的进展
m0_57781768
·
2025-04-16 09:25
python
langchain
自然语言处理
【自动驾驶轨迹规划之大模型】
欢迎大家关注我的B站:偷吃薯片的Zheng同学的个人空间-偷吃薯片的Zheng同学个人主页-哔哩哔哩视频(bilibili.com)目录1.引入
LLM
的背景2.文章架构3.国内外研究现状4.方法本篇博客以
无意2121
·
2025-04-16 05:27
自动驾驶轨迹规划算法
人工智能
自动驾驶
算法
长上下文时代:RAG的块大小为何仍需克制?
一、技术矛盾:长与短的博弈1.1
LLM
的"长"与RAG的"短"当
LLM
的上下文窗口突破64K甚至128Ktokens时,开发者常陷入直觉误区——认为RAG的拆分块也应"同步升级"。
TGITCIC
·
2025-04-16 03:16
AI-大模型的落地之道
RAG
RAG增强检索
MCP大全
YOLO
大模型开发
AI
AGENT
AI编程
AI Agent开发大全第二十八课-MCP实现本地命令调用怎么做的?
当下的AIAgent特别是MCP以充当
LLM
的手和脚为趋势已经越来越多的在实际生活和工作中
TGITCIC
·
2025-04-16 03:14
AI
Agent开发大全
MCP
大模型MCP
AI
MCP
MCP协议
AI
Agent
MCP执行
MCP如何执行
Inference: Parallel
LLM
Generation via Concurrent Attention
推理:通过并发注意力实现并行
LLM
生成目录介绍顺序
LLM
生成的挑战Hogwild推理方法用于协作推理的缓存布局旋转位置嵌入协作提示实验结果涌现的协作行为局限性和未来方向结论介绍大型语言模型(
LLM
)彻底改变了自然语言处理
Alexguantp
·
2025-04-15 19:23
AI
Papers
LLM
大语言模型的技术发展历程,从N-gram到DeepSeek-R1
介绍各个模型的思路和创新点,聚焦NLP经典模型和技术突破的理解,不深入数学推导过程前言根据整个自然语言处理NLP领域的技术发展,可以将其分为四个技术阶段:统计语言模型,神经网络模型,预训练语言模型PLM,大型语言模型
LLM
TARO_ZERO
·
2025-04-15 18:18
语言模型
自然语言处理
深度学习
gpt
MCP(模型上下文协议)保姆级教程实战篇(三)----MCP服务器端搭建
一、MCP服务器的概念MCP服务器(ModelContextProtocolServer)是一种轻量级程序,旨在将大型语言模型(
LLM
)与外部数据源和工具无缝集成。
菜鸟模型
·
2025-04-15 18:46
人工智能
python
BERT - 直接调用transformers.BertModel, BertTokenizerAPI不进行任何微调
1.加载预训练模型和分词器fromtransformersimportBertTokenizer,BertModelmodel_path="/Users/azen/Desktop/
llm
/models/
风筝超冷
·
2025-04-15 17:13
人工智能
深度学习
bert
centos-
LLM
-生物信息-BioGPT-使用1
参考:GitHub-microsoft/BioGPThttps://github.com/microsoft/BioGPTBioGPT:用于生物医学文本生成和挖掘的生成式预训练转换器|生物信息学简报|牛津学术—BioGPT:generativepre-trainedtransformerforbiomedicaltextgenerationandmining|BriefingsinBioinfor
淀粉肠狂热粉
·
2025-04-15 17:09
生物信息学
centos
linux
生信
生物信息
AIGC
大模型RAG系列:什么是RAG?RAG是如何解决问题的?RAG的未来发展趋势!
一、什么是RAG所谓RAG,检索增强生成(RetrievalAugmentedGeneration),简称RAG,已经成为当前最火热的
LLM
应用方案。
大模型微调部署
·
2025-04-15 15:28
人工智能
LLM
AI大模型
大模型
ai
agi
RAG
深度剖析现阶段的多模态大模型做不了医疗
导读在人工智能的这波浪潮中,以ChatGPT为首的大语言模型(
LLM
)不仅在自然语言处理(NLP)领域掀起了一场技术革命,更是在计算机视觉(CV)乃至多模态领域展现出了令人瞩目的潜力。
AI程序猿人
·
2025-04-15 15:27
人工智能
ai大模型
大语言模型
医疗大模型
多模态大模型
计算机技术
AGI
从 0 到 1 构建高效 RAG 问答系统:LangChain+Ollama+Chroma 实战指南
一、引言:突破
LLM
知识边界的RAG技术在企业级AI应用中,大语言模型(
LLM
)常面临两大痛点:知识时效性不足(如训练数据截止到2023年)和领域知识缺失(如企业内部文档未被模型学习)。
佑瞻
·
2025-04-15 10:29
RAG
langchain
RAG
ollama
chroma
AI Agents新手入门到精通:从零开始,手把手教你打造自己的Agent!
今日主题:当什么是Agent,与
LLM
的区别又是啥这一天,你的女朋友问你(假设我们有女朋友),宝宝,什么是Agent啊,Agent和
LLM
有什么区别呀,最近大家都在说的Agent究竟是什么,包括很多文章都在写的
程序员辣条
·
2025-04-15 08:43
人工智能
chatgpt
学习
大模型
AI大模型
Agent
AI
AI Agents新手指南:从零开始,打造属于自己的AI Agent!
今日主题:当什么是Agent,与
LLM
的区别又是啥这一天,你的女朋友问你(假设我们有女朋友),宝宝,什么是Agent啊,Agent和
LLM
有什么区别呀,最近大家都在说的Agent究竟是什么,包括很多文章都在写的
AI大模型-王哥
·
2025-04-15 08:41
人工智能
chatgpt
大模型
AI
DeepSeek
Agent
AI大模型
MCP(Model Context Protocol,模型上下文协议)
MCP(ModelContextProtocol,模型上下文协议)是大语言模型领域由Anthropic公司于2024年11月推出的开放协议,旨在通过标准化接口实现
LLM
(大语言模型)与外部数据源、工具及服务的高效安全集成
C7211BA
·
2025-04-15 06:00
大语言模型
llm
mcp
大语言模型应用指南:图像生成
近年来,随着深度学习技术的快速发展,基于大语言模型(LargeLanguageModel,
LLM
)的图像生成技术取得了突破性的进展。这些技术能够根据自然语言描述生成高质量的图像,为
AI智能涌现深度研究
·
2025-04-14 22:05
DeepSeek
R1
&
大数据AI人工智能
Python入门实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
基于Qwen2/Lllama3等大模型,部署团队私有化RAG知识库系统的详细教程(Docker+AnythingLLM)
自ChatGPT发布以来,大型语言模型(LargeLanguageModel,
LLM
,大模型)得到了飞速发展,它在处理复杂任务、增强自然语言理解和生成类人文本等方面的能力让人惊叹,几乎各行各业均可从中获益
大耳朵爱学习
·
2025-04-14 19:11
人工智能
语言模型
大模型
大语言模型
Lllama
RAG
知识库
这样的可观测数据平面让AI自动诊断故障
AI,特别是大模型(
LLM
)的崛起,为自动化故障诊断带来了新的曙光。然而,要充分释放AI在可观测性领域的潜力,我们需要一个全新的、为AI量身打造的数据平面。APO(
·
2025-04-14 16:11
运维
让
LLM
来评判 | 技巧与提示
这是让
LLM
来评判系列文章的第六篇,敬请关注系列文章:基础概念选择
LLM
评估模型设计你自己的评估prompt评估你的评估结果奖励模型相关内容技巧与提示
LLM
评估模型已知偏差及缓解措施:缺乏内部一致性:同一
·
2025-04-14 16:38
llm人工智能
检索增强生成技术:让大模型回答更精准可靠
检索增强生成技术:让大模型回答更精准可靠一、技术原理深度剖析痛点定位:大模型的知识局限与质量失控当前大语言模型(
LLM
)在实际应用中面临两大核心痛点:知识局限性和回答质量不可控。
CodePatentMaster
·
2025-04-14 14:44
人工智能
大型语言模型中的工具调用(Function Calling)技术详解
一、引言随着大型语言模型(
LLM
)能力的飞速发展,它们在自然语言理解、文本生成、对话交互等方面展现出了令人惊叹的表现。
大树~~
·
2025-04-14 14:41
AI
数据库
SpringAI
ai
FunctionCalling
提示词工程-Prompt Engineering
引言prompt(提示词)是我们和
LLM
互动最常用的方式,我们提供给
LLM
的Prompt作为模型的输入,并希望
LLM
反馈我们期待的结果。
苍墨穹天
·
2025-04-14 11:20
大模型
prompt
深入学习
LLM
开发 第十四章:LangGraph介绍(上)
LangGraph是LangChain生态系统中的一个重要组件,专门用于构建和管理复杂的有状态、多步骤应用。它通过图形化编程的方式,帮助开发者设计、调试和执行包含循环、分支和状态转移的工作流程,尤其适合需要长期记忆和动态决策的AI应用场景。计划用三个章节进行介绍:第一部分介绍基本功能,第二部分介绍基于LangGraph的应用构建,第三部分介绍一些高级特性。本周是第一部分的内容(万字长文)。Lang
沙子可可
·
2025-04-14 09:41
学习
java
大数据
大模型在边缘部署可行吗?一文解析边缘AI的落地路径
引言:边缘AI的热潮随着人工智能技术的不断突破,尤其是在大语言模型(
LLM
)、计算机视觉、语音识别等领域的广泛应用,越来越多的企业和开发者开始关注“边缘AI”的潜力。
moppol
·
2025-04-14 09:08
人工智能
云计算
别再搞混了!MCP真的需要Function Calling吗?Cline源码揭秘
是不是一定要
LLM
具备FunctionCalling能力,才能有效利用MCP与外部工具交互呢?答案可能和你想象的不一样。
that's boy
·
2025-04-14 05:14
人工智能
midjourney
AI编程
MCP
AI写作
AI作画
chatgpt
常见
LLM
大模型概览与详解
以下是一些常见的大模型的详细介绍,包括LLaMA2、LLaMA3、BLOOM、BERT、Falcon180B、Mistral7B、OpenHermes、GPT-NeoX-20B、Pythia、OpenLLaMA、OlMA、GPT-4系列、Claude-3、GLM-4、文心一言、通义千问、Abad6、qwen等模型。1.LLaMA2定义和来源:LLaMA2是LLaMA(LargeLanguageMo
夏沫の梦
·
2025-04-14 05:41
AI技术总览
人工智能
llama
chatgpt
深度学习
《多Agent自动选择与链式执行方案技术白皮书》 大纲
《多Agent自动选择与链式执行方案技术白皮书》大纲1.引言背景与挑战:随着大语言模型(
LLM
)的广泛应用,单一智能体(Agent)已难以满足复杂任务的需求。
大霸王龙
·
2025-04-14 05:41
行业+领域+业务场景=定制
系统分析业务
python
深度学习
agent
agent调度
LLM
辅助软件测试:提高代码质量的新方法
《
LLM
辅助软件测试:提高代码质量的新方法》关键词:
LLM
(大型语言模型)软件测试自动化测试缺陷检测性能测试摘要:本文深入探讨了
LLM
(大型语言模型)在软件测试中的应用,阐述了
LLM
如何通过自然语言处理技术辅助自动化测试
AI天才研究院
·
2025-04-13 15:10
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
大厂Offer收割机
面试题
简历
程序员读书
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
Java
Python
架构设计
Agent
程序员实现财富自由
论文阅读:NeurIPS Workshop Weakly Supervised Detection of Hallucinations in
LLM
Activations
总目录大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328WeaklySupervisedDetectionofHallucinationsinLLMActivationshttps://arxiv.org/pdf/2312.02798https://www.doubao.com/chat/28880219940718
CSPhD-winston-杨帆
·
2025-04-13 13:00
论文阅读
Spring AI 结构化输出详解
一、SpringAI结构化输出的定义与核心概念SpringAI提供了一种强大的功能,允许开发者将大型语言模型(
LLM
)的输出从字符串转换为结构化格式,如JSON、XML或Java对象。
大树~~
·
2025-04-13 06:42
AI
spring
人工智能
java
格式化输出
对话记忆(Conversational Memory)
一、引言在与大型语言模型(
LLM
)交互的场景中,对话记忆(ConversationalMemory)指的是模型能够在多轮对话中保留、检索并利用先前上下文信息的能力。
大树~~
·
2025-04-13 06:40
AI
spring
java
后端
SGLang实战:从KV缓存复用到底层优化,解锁大模型高效推理的全栈方案
在当今快速发展的人工智能领域,大型语言模型(
LLM
)的应用已从简单对话扩展到需要复杂逻辑控制、多轮交互和结构化输出的高级任务。面对这一趋势,如何高效地微调并部署这些大模型成为开发者面临的核心挑战。
SYC_MORE
·
2025-04-13 05:06
缓存
SGLang
实战
高效推理
解码ChatBI技术形态:独立对话框、插件式与IM集成模式的技术优劣
ChatBI的形态之争随着大语言模型(
LLM
)技术的成熟,**对话式商业智能(ChatBI)**正成为企业数据分析的新范式。
zandy1011
·
2025-04-13 03:21
衡石BI技术文档
IM
ChatBI
场景交互
sql
crm
AI爬虫 :Crawl4AI的安装和详细使用案例(开源
LLM
友好型网络爬虫)
更多内容请见:爬虫和逆向教程-专栏介绍和目录文章目录1.Crawl4AI概述1.1Crawl4AI介绍1.2Crawl4AI做什么?1.3Crawl4AI的核心理念1.4Crawl4AIv0.5.0新功能2.Crawl4AI的安装和第一个案例2.1Crawl4AI的安装2.2初始设置2.3诊断2.4第一个案例2.5高级安装(可选)3.基本配置4.生成Markdown输出5.简单数据提取(基于CSS
数据知道
·
2025-04-13 00:34
爬虫和逆向教程
人工智能
爬虫
python
数据采集
微调和蒸馏:详细技术全解_蒸馏 微调
前言
LLM
已经彻底改变了人工智能,特别是具有数十亿到数百亿参数的模型,使其在各种自然语言处理(NLP)任务中实现了最先进的表现。然而,它们庞大的体量带来了计算效率、适应性和部署可行性方面的挑战。
慕烟疏雨
·
2025-04-12 22:56
ai
人工智能
编程
程序员
计算机
AI部署架构:A100、H100、A800、H800、H20的差异以及如何选型?开发、测试、生产环境如何进行AI大模型部署架构?
本文的原始文章传送门尼恩:
LLM
大模型学习圣经PDF的起源在40岁老架构师尼恩的读者交流群(50+)中,经常性的指导小伙伴们改造简历。
45岁资深老架构师尼恩
·
2025-04-12 22:21
人工智能
架构
如何使用少量样本(Few-Shot)示例提升大语言模型性能
如何使用少量样本(Few-Shot)示例提升大语言模型性能引言在使用大语言模型(
LLM
)时,我们经常需要引导模型生成特定格式或风格的输出。一种简单而有效的方法是使用少量样本(Few-Shot)示例。
sjufgwgfhoia
·
2025-04-12 19:35
语言模型
服务器
java
python
智能体平台终极对决:Dify、Coze、FastGPT深度评测,谁是开发者与企业的最优解?
背景介绍智能体技术浪潮下的平台化竞赛在生成式AI与大语言模型(
LLM
)技术驱动下,2023-2025年全球智能体(AIAgent)开发平台迎来爆发式增长。
敲代码的AI玩家
·
2025-04-12 15:41
AI智能体开发全栈实战
AIGC
人工智能
langchain
ai
AI编程
java
python
谁才是AI王者? DeepSeek、Grok、千问、ChatGPT、Claude大模型终极PK
随着2025年初DeepSeek在国内外火爆出圈,全球大语言模型(
LLM
)的竞争愈发激烈,几乎到了白热化。2月18日,马斯克推出了他的用20万张GPU训练的最新的“地表最强”的大模型Grok3。
qweqwety
·
2025-04-12 15:10
chatgpt
人工智能
ChatGPT、DeepSeek 与 Grok:三大 AI 模型的优势与劣势对比
1.引言随着人工智能技术的飞速发展,大语言模型(
LLM
)在智能问答、代码生成、数据分析等领域的应用日益广泛。ChatGPT、DeepSeek和Grok作为当下三大主流AI模型,各具特色。
慌ZHANG
·
2025-04-12 14:08
AI模型
人工智能
AI大模型之提示词工程进阶版(二)
1.零样本提示如今,经过⼤量数据训练并调整指令的
LLM
能够执⾏零样本任务。prompt="""将文本分类为中性、负面或正面。文本:我认为这次假期一般。情感:"""#prompt="中国的首都是哪里?"
程序员搞AI
·
2025-04-11 22:44
人工智能
语言模型
AI
经验分享
python
java
LLM
Weekly(2025.02.03-02.09)
本次主要是针对2.3-2.9之间的
LLM
论文和相关新闻进行摘要总结。1新闻Gemini2.0现已对所有人开放。
UnknownBody
·
2025-04-11 20:59
LLM
Weekly
LLM
Daily
语言模型
人工智能
【建议收藏】MCP:AI Agent开发的秘密武器,从入门到实战的全流程指南
当下AI应用开发面临一个核心痛点:如何让
LLM
优雅地与外部世界交互?
大模型本地部署
·
2025-04-11 12:36
人工智能
langchain
大数据
数据库
chatgpt
大模型
一文秒懂 AI 核心: Agent、RAG、Function Call 与 MCP 全解析
我们用一个表格来总结下它们的关系和区别:特性MCP(模型上下文协议)RAG(检索增强生成)Agent(智能体)FunctionCall(函数调用)核心思想标准化AI与外部数据/工具的通信协议检索外部知识+增强提示+生成回答
LLM
。。。
·
2025-04-11 06:00
人工智能
前端
提示词优化建议:如何高效引导AI模型输出
提示词建议:如何高效使用大语言模型在与大语言模型(
LLM
)交互时,精心设计的提示词(prompt)是获取高质量回答的关键。以下是一些优化提示词的建议,帮助你更好地利用模型的能力。
禾日木目心
·
2025-04-11 02:08
Dify
人工智能
大模型
提示词
Dify
为什么PDF文件更适合
LLM
大模型信息提取?
为什么PDF文件更适合
LLM
大模型信息提取?在Dify平台中,我们通过
LLM
大模型提取上传文件中的指定信息。目前使用的大模型包括qwen2:7b和deepseek-r1:70b。
禾日木目心
·
2025-04-11 02:35
Dify
pdf
Dify
LLM
文档提取器
用户画像(https://github.com/memodb-io/memobase)应用
/api/config.yaml这里我的配置内容如下config.yaml(因为我是调用的符合openai格式的大模型,所以我没改,如果要是别的大模型的话,需要自己再做兼容)
llm
_api_key:sk-
llm
_base_ur
fc&&fl
·
2025-04-10 20:27
大模型实战应用
状态模式
人工智能
python
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他