llm

大模型在边缘部署可行吗？一文解析边缘AI的落地路径

引言：边缘AI的热潮随着人工智能技术的不断突破，尤其是在大语言模型（LLM）、计算机视觉、语音识别等领域的广泛应用，越来越多的企业和开发者开始关注“边缘AI”的潜力。

moppol·2025-04-14 09:08

别再搞混了！MCP真的需要Function Calling吗？Cline源码揭秘

是不是一定要LLM具备FunctionCalling能力，才能有效利用MCP与外部工具交互呢？答案可能和你想象的不一样。

that's boy·2025-04-14 05:14

常见LLM大模型概览与详解

以下是一些常见的大模型的详细介绍，包括LLaMA2、LLaMA3、BLOOM、BERT、Falcon180B、Mistral7B、OpenHermes、GPT-NeoX-20B、Pythia、OpenLLaMA、OlMA、GPT-4系列、Claude-3、GLM-4、文心一言、通义千问、Abad6、qwen等模型。1.LLaMA2定义和来源：LLaMA2是LLaMA（LargeLanguageMo

夏沫の梦·2025-04-14 05:41

《多Agent自动选择与链式执行方案技术白皮书》大纲

《多Agent自动选择与链式执行方案技术白皮书》大纲1.引言背景与挑战：随着大语言模型（LLM）的广泛应用，单一智能体（Agent）已难以满足复杂任务的需求。

大霸王龙·2025-04-14 05:41

LLM辅助软件测试：提高代码质量的新方法

《LLM辅助软件测试：提高代码质量的新方法》关键词：LLM（大型语言模型）软件测试自动化测试缺陷检测性能测试摘要：本文深入探讨了LLM（大型语言模型）在软件测试中的应用，阐述了LLM如何通过自然语言处理技术辅助自动化测试

AI天才研究院·2025-04-13 15:10

论文阅读：NeurIPS Workshop Weakly Supervised Detection of Hallucinations in LLM Activations

CSPhD-winston-杨帆·2025-04-13 13:00

Spring AI 结构化输出详解

一、SpringAI结构化输出的定义与核心概念SpringAI提供了一种强大的功能，允许开发者将大型语言模型（LLM）的输出从字符串转换为结构化格式，如JSON、XML或Java对象。

大树~~·2025-04-13 06:42

对话记忆（Conversational Memory）

一、引言在与大型语言模型（LLM）交互的场景中，对话记忆（ConversationalMemory）指的是模型能够在多轮对话中保留、检索并利用先前上下文信息的能力。

大树~~·2025-04-13 06:40

SGLang实战：从KV缓存复用到底层优化，解锁大模型高效推理的全栈方案

在当今快速发展的人工智能领域，大型语言模型(LLM)的应用已从简单对话扩展到需要复杂逻辑控制、多轮交互和结构化输出的高级任务。面对这一趋势，如何高效地微调并部署这些大模型成为开发者面临的核心挑战。

SYC_MORE·2025-04-13 05:06

解码ChatBI技术形态：独立对话框、插件式与IM集成模式的技术优劣

ChatBI的形态之争随着大语言模型（LLM）技术的成熟，**对话式商业智能（ChatBI）**正成为企业数据分析的新范式。

zandy1011·2025-04-13 03:21

AI爬虫：Crawl4AI的安装和详细使用案例（开源 LLM 友好型网络爬虫）

数据知道·2025-04-13 00:34

微调和蒸馏：详细技术全解_蒸馏微调

前言LLM已经彻底改变了人工智能，特别是具有数十亿到数百亿参数的模型，使其在各种自然语言处理（NLP）任务中实现了最先进的表现。然而，它们庞大的体量带来了计算效率、适应性和部署可行性方面的挑战。

慕烟疏雨·2025-04-12 22:56

AI部署架构：A100、H100、A800、H800、H20的差异以及如何选型？开发、测试、生产环境如何进行AI大模型部署架构？

本文的原始文章传送门尼恩：LLM大模型学习圣经PDF的起源在40岁老架构师尼恩的读者交流群(50+)中，经常性的指导小伙伴们改造简历。

45岁资深老架构师尼恩·2025-04-12 22:21

如何使用少量样本（Few-Shot）示例提升大语言模型性能

如何使用少量样本（Few-Shot）示例提升大语言模型性能引言在使用大语言模型（LLM）时，我们经常需要引导模型生成特定格式或风格的输出。一种简单而有效的方法是使用少量样本（Few-Shot）示例。

sjufgwgfhoia·2025-04-12 19:35

智能体平台终极对决：Dify、Coze、FastGPT深度评测，谁是开发者与企业的最优解？

背景介绍智能体技术浪潮下的平台化竞赛在生成式AI与大语言模型（LLM）技术驱动下，2023-2025年全球智能体（AIAgent）开发平台迎来爆发式增长。

敲代码的AI玩家·2025-04-12 15:41

谁才是AI王者？ DeepSeek、Grok、千问、ChatGPT、Claude大模型终极PK

随着2025年初DeepSeek在国内外火爆出圈，全球大语言模型（LLM）的竞争愈发激烈，几乎到了白热化。2月18日，马斯克推出了他的用20万张GPU训练的最新的“地表最强”的大模型Grok3。

qweqwety·2025-04-12 15:10

ChatGPT、DeepSeek 与 Grok：三大 AI 模型的优势与劣势对比

1.引言随着人工智能技术的飞速发展，大语言模型（LLM）在智能问答、代码生成、数据分析等领域的应用日益广泛。ChatGPT、DeepSeek和Grok作为当下三大主流AI模型，各具特色。

慌ZHANG·2025-04-12 14:08

AI大模型之提示词工程进阶版（二）

1.零样本提示如今，经过⼤量数据训练并调整指令的LLM能够执⾏零样本任务。prompt="""将文本分类为中性、负面或正面。文本：我认为这次假期一般。情感："""#prompt="中国的首都是哪里？"

程序员搞AI·2025-04-11 22:44

LLM Weekly（2025.02.03-02.09）

本次主要是针对2.3-2.9之间的LLM论文和相关新闻进行摘要总结。1新闻Gemini2.0现已对所有人开放。

UnknownBody·2025-04-11 20:59

【建议收藏】MCP：AI Agent开发的秘密武器，从入门到实战的全流程指南

当下AI应用开发面临一个核心痛点：如何让LLM优雅地与外部世界交互？

大模型本地部署·2025-04-11 12:36

一文秒懂 AI 核心： Agent、RAG、Function Call 与 MCP 全解析

我们用一个表格来总结下它们的关系和区别：特性MCP(模型上下文协议)RAG(检索增强生成)Agent(智能体)FunctionCall(函数调用)核心思想标准化AI与外部数据/工具的通信协议检索外部知识+增强提示+生成回答LLM

‍。。。·2025-04-11 06:00

提示词优化建议：如何高效引导AI模型输出

提示词建议：如何高效使用大语言模型在与大语言模型（LLM）交互时，精心设计的提示词（prompt）是获取高质量回答的关键。以下是一些优化提示词的建议，帮助你更好地利用模型的能力。

禾日木目心·2025-04-11 02:08

为什么PDF文件更适合LLM大模型信息提取？

为什么PDF文件更适合LLM大模型信息提取？在Dify平台中，我们通过LLM大模型提取上传文件中的指定信息。目前使用的大模型包括qwen2:7b和deepseek-r1:70b。

禾日木目心·2025-04-11 02:35

用户画像（https://github.com/memodb-io/memobase）应用

/api/config.yaml这里我的配置内容如下config.yaml(因为我是调用的符合openai格式的大模型，所以我没改，如果要是别的大模型的话，需要自己再做兼容)llm_api_key:sk-llm_base_ur

fc&&fl·2025-04-10 20:27

Ollama与vLLM部署对比：哪个更合适？

耗子口袋大数据2024年11月25日20:56重庆近年来，大语言模型（LLM）的应用日益广泛，而高效的部署方案至关重要。Ollama和vLLM作为两种流行的LLM部署工具，各有优劣。

强化学习曾小健2·2025-04-10 19:51

vLLM 与 Ollama 部署与应用

拉取并运行vLLMDocker镜像️二、Ollama的本地多模型部署方案1.安装Ollama一、vLLM与FastChat的Docker部署指南vLLM与FastChat的结合可以实现高性能的大语言模型（LLM

张3蜂·2025-04-10 18:15

从CLIP到未来：深入探讨视觉任务的视觉语言模型VLM

·2025-04-10 15:46

如何实现参加RAG比赛但进不了复赛的总结

AI大模型-王哥·2025-04-10 12:06

金融大模型

github.com/AI4Finance-Foundation/FinGPT/tree/master/fingpt/FinGPT-v3FinGPTv3系列是在新闻和微博情绪分析数据集上使用LoRA方法进行微调的LLM

兔兔爱学习兔兔爱学习·2025-04-10 11:28

当 Ollama 遇上 OpenVINO™ ：解锁多硬件 AI 推理新范式

双引擎驱动的技术优势Ollama和OpenVINO™的结合为大型语言模型（LLM）的管理和推理提供了强大的双引擎驱动。

OpenVINO 中文社区·2025-04-10 11:56

Dify工作流之创建一个可以上传文档和图片的应用

工作流通过将复杂的任务分解成较小的步骤（节点）降低系统复杂度，减少了对提示词技术和模型推理能力的依赖，提高了LLM应用面向复杂任务的性能，提升了系统的可解释性、稳定性和容错性。

wjj_fire·2025-04-10 09:14

【LLM】MCP(Python)：实现 SSE 通信的 Server 和 Client

部分灵感来源：Se7en。环境准备在开始之前，请确保您已安装必要的Python库：pipinstallopenaimcp此外，创建一个.env文件来存储您的配置：MODEL_NAME=deepseek-chatBASE_URL=https://api.deepseek.com/v1API_KEY=your_api_key_here将your_api_key_here替换为您的实际API密钥。Ser

T0uken·2025-04-10 03:37

使用 Python 开发 MCP Server 及 Inspector 工具详解

使用Python开发MCPServer及Inspector工具详解前言模型上下文协议(ModelContextProtocol,MCP)是一种新兴的协议，旨在让大型语言模型(LLM)更容易地与外部工具和服务集成

engchina·2025-04-10 03:07

2024年11月大数据月报

手把手系列丨如何使用MilvusBackup备份向量数据大模型技术在淘宝生鲜审核场景的应用“亿”想天开AI｜LLM在eBay推理平台的工程实践与应用<

@SmartSi·2025-04-09 23:34

手把手教你在 Windows10 本地部署 ChatGLM

近年来，大语言模型（LLM）如雨后春笋般涌现，ChatGLM作为清华大学和智谱AI推出的开源中文对话模型，因其优秀的中文能力和开放的使用协议，在国内开发者社区迅速走红。

annus mirabilis·2025-04-09 22:59

LLM 系列——Qwen2——论文解读

一、概述1、是什么是单模态纯文本的大语言模型，论文全称《QWEN2TECHNICALREPORT》，开源了一整套基础和指令调优的语言模型，参数范围从5亿到720亿不等，包括密集模型和混合专家模型。可以用于：语言理解、生成、多语言、编码、数学和推理。2、亮点主要是精召性能、数据和长文本处理方面，包括数据处理等使用了一些最新的其他论文的思路，模型结构等方面并没有大的改动，具体如下：*旗舰模型Qwen2

TigerZ*·2025-04-09 21:22

LLM大模型教程——什么是AI大模型

引言当GPT-4展现出惊人的上下文理解能力，当StableDiffusion创造出媲美人类画师的图像作品，当AlphaFold2破解蛋白质折叠密码——这些里程碑事件标志着人工智能发展进入大模型主导的新纪元。本综述将深入解析这一技术革命的核心载体——AI大模型。一、AI大模型是什么概念：AI大模型，本质上是基于深度学习理论构建的超大规模模型。这些模型借助海量数据训练，拥有强大的泛化能力，能够处理多种

西木风落·2025-04-09 21:49

Dify 生成提示词的 Prompt

Dify生成提示词的Prompt**第1次提示词****第2次提示词****第3次提示词**总结Dify生成提示词是，会和LLM进行3次交互，下面是和LLM进行交互是的Prompt。

engchina·2025-04-09 19:10

白话文讲解大模型必修基础知识 | Transformer架构（小白也能看懂）

它在机器翻译、文本生成、问答系统、情感分析等任务中表现出了卓越的能力，并且是大规模语言模型（LLM,LargeLanguageModels）的基础。

大模型面试·2025-04-09 18:34

万字长文 | 如何让你的大模型“开口”说话：从ASR到端到端语音大模型的进化之旅

我们将分两期进行探讨，如何让大型语言模型（LLM）“发声”，第一期（语音三剑客）：围绕从文字到声音的互相转换，以及这一过程中的关键技术——自动语音

南七小僧·2025-04-09 16:48

从感知到共创：AI赋能人类想象力的边界重塑

但随着大语言模型（LLM）的兴起，这种认知正悄然发生改变。

慌ZHANG·2025-04-09 15:14

【DeepSeek】从文本摘要到对话生成：DeepSeek 在 NLP 任务中的实战指南

引言随着大语言模型（LLM）的发展，越来越多的企业和开发者希望将其应用于具体业务场景中。然而，由于缺乏明确的使用示例和最佳实践，许多开发者在落地过程中遇到

·2025-04-09 13:29

大模型国产化适配7-华为昇腾LLM落地可选解决方案（MindFormers、ModelLink、MindIE）

大模型国产化适配7-华为昇腾LLM落地可选解决方案（MindFormers、ModelLink、MindIE）原创吃果冻不吐果冻皮吃果冻不吐果冻皮2024-04-1712:00四川随着ChatGPT的现象级走红

强化学习曾小健·2025-04-09 11:20

2024 年最值得尝试的 8 个 AI 开源大模型

如果要将LLM按照是否开源来划分的话，那么，OpenAI的ChatGPT，Google的Gemini这一类就属于闭源模型，也可以说是专有的LLM，用户并不能深入到模型层面去使用，而是只能在基于模型的聊天应用层使用

七七Seven～·2025-04-09 06:46

我们公司落地大模型的路径、方法和坑

最近一年，LLM（大型语言模型）已经成熟到可以投入实际应用中了。预计到2025年，AI领域的投资会飙升到2000亿美元。现在，不只是机器学习专家，任何人都能轻松地把AI技术融入自己的产品里。

IT猫仔·2025-04-09 06:46

地质科研智能革命：当大语言模型“扎根”地质现场、大语言模型本地化部署与AI智能体协同创新实践

大语言模型（LLM）与AI智能体的本地化部署技术，正在为这一领域带来‌三重新范式突破‌：‌知识提取‌：从百年地质文献中构建结构化知识图谱‌决策辅助‌：基于岩石薄片图像与地球化学数据的智能矿物判别‌流程再造‌

KY_chenzhao·2025-04-09 06:46

使用 JSON Schema 实现语言模型的结构化输出：跨平台实践指南

随着大语言模型（LLM）的广泛应用，开发者常常需要从模型中提取结构化数据，例如JSON格式的输出，以便直接用于程序化处理。

田猿笔记·2025-04-09 05:44

LLM大模型在融合通信产品中的应用实践_文档生成

前言LLM问题幻觉：在没有答案的情况下提供虚假信息。过时：当用户需要特定的当前响应时，提供过时或通用的信息。来源：从非权威来源创建响应。

脱泥不tony·2025-04-09 03:02

如何利用Dify搭建MCP服务器：构建灵活的AI应用生态系统

使用Dify搭建MCP服务器完整指南引言随着人工智能技术的快速发展，大语言模型（LLM）应用已经成为各行各业提升效率和创新的重要工具。

AI Agent首席体验官·2025-04-08 14:05

智能体开发实战指南：提示词设计、开发框架与工作流详解

在大语言模型（LLM）驱动的智能体（Agent）快速发展的今天，构建一个实用、智能的Agent已不再遥不可及。

禁止默·2025-04-08 09:31

推荐频道

llm