LLM九层妖塔第5页

【论文阅读】LayoutPrompter: Awaken the Design Ability of Large Language Models

本文提出Layout-Prompter，利用大型语言模型(llm)通过上下文学习来解决上述问题。LayoutPr

进击的乔洋·2025-03-09 16:40

大规模语言模型构建流程

大规模语言模型1.大语言模型大规模语言模型（LargeLanguageModels，LLM），也称大语言模型，是一种由包含数百亿以上参数的深度神经网络构建的语言模型，通常使用自监督学习方法通过大量无标注文本进行训练

人工智能技术笔记·2025-03-09 15:34

LLM时代的小模型思考：《What is the Role of Small Models in the LLM Era: A Survey》论文笔记

ImperialCollegeLondonAbstract问题：扩大模型大小会导致计算成本和能耗呈指数级增长，这使得这些模型对于学术研究人员和资源有限的企业来说不切实际小型模型（SMs）经常用于实际环境中，引发了关于小模型在LLM

FrancisQiu·2025-03-09 14:02

OpenManus：快速复刻Manus项目的技术路径与实施策略

这种设计使得复刻项目时能够快速剥离非必要模块，例如：模块替换：通过修改config.toml的llm配置段，可在1小时内完成从GPT-4到Claude3的模型切换功能裁剪：删除vision模块相关代码及配置项即可实现

花生糖@·2025-03-09 12:15

【快速入门】本地知识库部署：FastGPT与Dify轻松上手全指南！

本文主要内容本地部署Dify、FastGPT、OllamaDify、FastGPT对接一些目前免费的LLM大语言AI模型Dify、FastGPT对接Ollama本地模型大家好，我是一名喜欢在家折腾本地部署的开发者

大模型老炮·2025-03-09 11:33

LLM大模型安全概述

引言2022年底以来，以ChatGPT为代表的大模型飞速发展，正在成为#驱动新质生产力发展#的新动能、人类探索未知的新工具.在显著提升人工智能(artificialintelligence,AI)模型通用理解和生成能力的同时，也带来了前所未有的安全风险.大模型的能力与风险生成式大模型因其强大的智能能力和巨大的应用潜力吸引了众多研究者和企业的关注.从智能能力的角度来看，研究人员观测到：当训练数据和参

LLM教程·2025-03-09 06:06

在 VSCode 中本地运行 DeepSeek，打造强大的私人 AI

步骤1：在VSCode中安装Ollama和CodeGPT要在本地运行DeepSeek，我们首先需要安装Ollama，它允许我们在我们的机器上运行LLM，以及CodeGPT，它是集成这些模型以提供编码辅助的

csdn_aspnet·2025-03-08 23:19

大模型RAG入门到实战基础教程（非常详细），大模型RAG入门到精通，收藏这一篇就够了！

写在前面大模型（LargeLanguageModel，LLM）的浪潮已经席卷了几乎各行业，但当涉及到专业场景或行业细分域时，通用大模型就会面临专业知识不足的问题。

AI程序猿人·2025-03-08 18:56

研究发现，LLM基于数据的内在含义进行表示，并以其主导语言推理

每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/【本周AI新闻:Deepseek崛起背后：AI智能代理时代正式到来？】https://w

新加坡内哥谈技术·2025-03-08 16:21

解锁 Hugging Face 的 smolagents：AI 代理的革命性突破！

AI代理的崛起随着大型语言模型（LLM）推理能力的增强，AI代理成为了当前最热门的话题。这些代理不仅能够独立做出决策，还能根据用户输入执行任务。

真智AI·2025-03-08 13:27

Ollama：让大型语言模型触手可及

Ollama：让大型语言模型触手可及导语：近年来，大型语言模型（LLM）发展迅猛，但对于普通用户而言，搭建和使用LLM仍有一定门槛。

步子哥·2025-03-08 12:15

DeepSeek掘金——vLLM和ollama综合对比

欢迎来到我们深入研究LLM推理框架的最后一部分！在第一部分和第二部分中，我们分别探讨了Ollama和vLLM，了解了它们的架构、功能和基本性能特征。

不二人生·2025-03-08 10:12

项目管理发展史 --转

项目管理通常被认为是第二次世界大战的产物（如美国研制原子弹的曼哈顿计划），事实上，项目管理历史源远流长，其发展大致经历了以下阶段：（1）古代其代表作如我国的长城、埃及的金字塔、古罗马的供水渠这样不朽的伟大工程

hongzhen1114·2025-03-08 08:46

打卡代码随想录第17天：LeetCode654.最大二叉树、 617.合并二叉树、 700.二叉搜索树中的搜索、98.验证二叉搜索树

学习资料：代码随想录文中含LLM生成内容，不一定对654.最大二叉树力扣题目地址思路：不断寻找该部分的最大值去切割数组，不断递归，到在左闭右开区间不成立时，返回空节点。

jingjingjing1111·2025-03-08 07:26

打卡代码随想录第15天：LeetCode 110.平衡二叉树 257. 二叉树的所有路径 404.左叶子之和

学习资料：代码随想录文中含LLM生成内容110.平衡二叉树力扣题目链接思路：逐层返回当前节点的最大高度，比较各节点的左右孩子高度后续方法遍历，因为‘中’是比较环节，要在左右之后/***Definitionforabinarytreenode

jingjingjing1111·2025-03-08 07:24

打卡代码随想录算法训练营第11天： 150. 逆波兰表达式求值 239. 滑动窗口最大值 347.前 K 个高频元素

代码随想录文中含LLM回答内容150.逆波兰表达式求值力扣题目链接思路K:先理解逆波兰表达式是啥，是把运算符放在了两个要运算的数字的后边，又叫后缀表达式。

jingjingjing1111·2025-03-08 07:51

山海鲸接入DeepSeek~赋予AI 3D感知“超能力”

山海鲸震撼升级，一键直连DeepSeek、通义千问等主流大模型，融合前沿3D-LLM算法，赋予AI3D感知“超能力”，让数字孪生生产力全面爆发，开启无限可能！

山海鲸可视化·2025-03-08 06:03

NL2SQL技术方案系列(5)：金融领域NL2SQL技术方案以及行业案例实战讲解3--非LLM技术方案

NL2SQL技术方案系列(5)：金融领域NL2SQL技术方案以及行业案例实战讲解3NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（SpidervsBIRD）全面对比优劣分析[Text2SQL

汀、人工智能·2025-03-08 03:00

NL2SQL技术方案系列(1)：NL2API、NL2SQL技术路径选择；LLM选型与Prompt工程技巧，揭秘项目落地优化之道

NL2SQL技术方案系列(1)：NL2API、NL2SQL技术路径选择；LLM选型与Prompt工程技巧，揭秘项目落地优化之道NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（SpidervsBIRD

汀、人工智能·2025-03-08 03:59

NL2SQL进阶系列(2)：DAIL-SQL、DB-GPT开源应用实践详解[Text2SQL]

NL2SQL进阶系列(2)：DAIL-SQL、DB-GPT开源应用实践详解[Text2SQL]NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（SpidervsBIRD）全面对比优劣分析

汀、人工智能·2025-03-08 03:58

Spring AI简单使用

Java大模型应用开发，微服务整合DeepSeek，LangChain大型语言模型LLM实战-尚硅谷文

NaughtyBo·2025-03-08 01:40

象牙塔中的“智者”：DeepSeek R1 引领高校问答智体新纪元

目录高校问答智体的“前世今生”：痛点与机遇DeepSeekR1：开启推理大模型的新篇章“DeepSeekR1+高校”：场景、架构与实践3.1场景一：智能学术助手3.2场景二：个性化学习导航3.3场景三：科研数据分析3.4系统架构设计3.5实践案例分享技术进阶：让问答智体更“聪明”4.1知识图谱融合4.2持续学习与反馈4.3多模态融合挑战与展望：迈向更广阔的未来1.高校问答智体的“前世今生”：痛点与

海棠AI实验室·2025-03-08 00:50

CentOS 7中安装Dify

Dify是一个开源的LLM应用开发平台。其直观的界面结合了AI工作流、RAG管道、Agent、模型管理、可观测性功能等，让您可以快速从原型到生产。

laolitou_1024·2025-03-07 22:04

2024年图灵奖公布：两位AI先锋因强化学习获奖

萨顿现在担任阿尔伯塔大学教授，他也是前DeepMind研究科学家。两人将分享图灵奖的100万美元奖金。图灵奖设立于1966年，常被称为“计算

吴脑的键客·2025-03-07 13:15

Agentic Security：开源LLM漏洞扫描器

AgenticSecurity：开源LLM漏洞扫描器项目地址:https://gitcode.com/gh_mirrors/ag/agentic_security项目介绍AgenticSecurity是一款开源的大型语言模型

袁立春Spencer·2025-03-07 13:06

《代码巫师启示录：当人类开始用机器思考》

新物种"##⌨️第一重身份：他们是用键盘施法的现代萨满凌晨三点的IDE（代码编辑器）泛着幽幽蓝光，程序员正进行着这个时代最神秘的仪式——把咖啡因转化为函数，用注释书写咒语，在GitHub上建造数字巴别塔。

·2025-03-07 11:32

YOLOv10改进之MHAF(多分支辅助特征金字塔)

YOLOv10架构YOLOv10的架构主要由主干网络、特征金字塔和预测头三部分组成。主干网络采用改进的Darknet结构，增强特征提取能力。

清风AI·2025-03-07 11:20

LLM辅助编程：代码自动生成与优化

LLM,代码生成,代码优化,编程辅助,AI编程,自然语言处理,深度学习1.背景介绍随着软件开发的日益复杂化，程序员面临着越来越高的开发压力和效率要求。

AI智能涌现深度研究·2025-03-07 05:54

【大模型技术】LlamaFactory 的原理解析与应用

LlamaFactory是一个基于LLaMA系列模型（如LLaMA、LLaMA2、Vicuna等）的开源框架，旨在帮助开发者和研究人员快速实现大语言模型（LLM,LargeLanguageModel）的微调

大数据追光猿·2025-03-07 00:32

开源模型应用落地-qwen2-7b-instruct-LoRA微调-LLaMA-Factory-单机多卡-RTX 4090双卡（五）

二、术语介绍2.1.LoRA微调LoRA(Low-RankAdaptation)用于微调大型语言模型(LLM)。

开源技术探险家·2025-03-06 23:26

揭秘AWS GPU实例：以极致AI算力与成本优化，重塑企业智能竞争力

面对动辄千亿参数的LLM大模型训练、实时高并发的AI推理场景，如何兼顾超强算力与极致成本？本文将深度解析AWSGPU实例的颠覆性技术方案，带您解锁AI时代的核心生产力。

AWS官方合作商·2025-03-06 23:55

【大模型系列篇】Vanna-ai基于检索增强(RAG)的sql生成框架

简介Vanna是基于检索增强(RAG)的sql生成框架Vanna使用一种称为LLM（大型语言模型）的生成式人工智能。

木亦汐丫·2025-03-06 23:54

数学希腊符号

Ααalpha/a:lf/阿尔法2、Ββbeta/bet/贝塔3、Γγgamma/ga:m/伽马4、Δδdelta/delt/德尔塔5、Εεepsilon/ep`silon/伊普西龙6、Ζζzeta/zat/截塔7

Humingway·2025-03-06 22:46

Mac 基于 Ollama 安装 DeepSeek-R1（蒸馏版本）、AnythingLLM 及使用体验

简介下载与安装Ollama下载并运行DeepSeek-R11.在终端运行（建议从8B开始）2.本地模型存储路径3.终端测试4.查询服务状态5.退出服务下载并运行AnythingLLM1.下载与安装2.设置LLM

窝窝和牛牛·2025-03-06 21:12

【AI爬虫干货】Crawl4AI+DeepSeek：从安装配置到 DeepSeek 集成，掌握 AI 爬虫核心技术「喂饭教程」

爬虫核心技术「喂饭教程」Crawl4AI简介一、安装二、异步爬取网页内容三、批量抓取四、保存结果到文件五、与DeepSeek模型结合使用总结Crawl4AI简介Crawl4AI是一个开源的、专为大型语言模型（LLM

blues_C·2025-03-06 18:10

AstrBot：多平台 LLM 聊天机器人框架，让 AI 触手可及！

产品概述AstrBot是一款多平台大型语言模型（LLM）聊天机器人及开发框架，提供松耦合、异步的AI机器人解决方案。

Hello server·2025-03-06 14:06

成为LLM大师的必读书籍：这几本大模型书籍，详细到让你一篇文章就收藏足够

以下是几本关于大模型和人工智能领域的经典书籍，它们各自具有独特的特点和适用人群：《深度学习》（DeepLearning）作者：伊恩·古德费洛（IanGoodfellow）、约书亚·本吉奥（YoshuaBengio）、亚伦·库维尔（AaronCourville）简介：《深度学习》是深度学习领域的经典之作，全面介绍了深度学习的基础知识、主要模型及其应用。书中详细讲解了神经网络、卷积神经网络、循环神经网

AGI大模型老王·2025-03-06 13:58

8.1 从28GB到7GB！大模型显存暴降4倍的量化实战指南

大模型显存暴降4倍的量化实战指南8.1模型显存占用与量化技术简介8.1.1大模型显存占用分析在部署和训练大语言模型（LLM）时，显存占用是开发者面临的核心挑战。

少林码僧·2025-03-06 11:42

【AI大模型应用开发】【LangChain系列】5. 实战LangChain的智能体Agents模块

在我前面的MetaGPT系列文章中，已经对智能体有了一个认知，重温一下：智能体=LLM+观察+思考+行动+记忆将大语言模型作为一个推理引擎。

同学小张·2025-03-06 10:03

给没有登录认证的web应用添加登录认证(openresty lua实现)

我也折腾了下本地部署，ollama、vllm、llama.cpp都弄了下，webui也用了几个，发现nextjs-ollama-llm-ui小巧方便，挺适合个人使用的。

dgiij·2025-03-06 08:47

大语言模型中的 Token：它们是什么，如何工作？

大语言模型（LLM，LargeLanguageModel）并不是直接处理整个句子或文章，而是拆分成一个个Token（标记）来进行计算。那么，什么是Token？它们在大语言模型中起到什么作用？

运维小子·2025-03-06 07:33

结构化思考和金字塔结构之：信息检索与知识获取

作者：禅与计算机程序设计艺术文章目录1.简介2.1概念定义2.2检索阶段2.3提取阶段3.1信息检索和文本信息处理的组成3.2技术总体架构3.3信息检索的关键技术3.3.1倒排索引和TF-IDF权值3.3.1.1倒排索引3.3.1.2TF-IDF权值3.3.2文档集合模型3.3.3语言模型3.3.3.1词袋模型3.3.3.2n-gram模型3.3.4PageRank算法3.3.5信息熵的实体抽取3

AI天才研究院·2025-03-06 06:31

大模型（LLM）的若干科普之问（七）：如何隔离LLM微调结果？

一、微调大模型LLM的微调是指在预训练好的大型语言模型基础上，通过特定任务的数据进行进一步训练，以提升模型在该任务上的性能。

人工干智能·2025-03-06 04:12

深度学习突破：LLaMA-MoE模型的高效训练策略

在人工智能领域，大模型（LLM）的崛起带来了前所未有的进步，但随之而来的是巨大的计算资源需求。

人工智能大模型讲师培训咨询叶梓·2025-03-06 01:44

2万字长文，九篇论文读懂大语言模型的前世今生

如果感兴趣的话，感谢关注，点赞转发在看收藏，五键四连，谢谢~更多LLM架构文章：LLM架构专栏近日热文：1.全网最全的神经网络数学原理（代码和公式）直观解释2.大模型进化史：从Transformer到DeepSeek-R1

·2025-03-06 00:32

大语言模型技术发展

LLM技术呈现出大型模型和小型模型并行发展的趋势，同时，多模态功能和长上下文能力成为顶级模型的标准配置。MoE架构的出现推动了模型参数量向万亿级别迈进。

联蔚盘云·2025-03-06 00:43

大模型中的Token究竟是什么？从原理到作用深度解析

引言在人工智能领域，大型语言模型（LLM）如GPT-4、Claude等系统性地改变了人机交互方式。这些模型处理文本的核心单元被称为"Token"，这个看似简单的概念实则蕴含复杂的工程设计和语言学原理。

·2025-03-05 16:48

零基础也能看懂的ChatGPT等大模型入门解析！大模型入门到精通，看这篇就够了！

近两年，大语言模型LLM(LargeLanguageModel)越来越受到各行各业的广泛应用及关注。对于非相关领域研发人员，虽然不需要深入掌握每一个细节，但了解其基本运作原理是必备的技术素养。

大模型微调实战·2025-03-05 12:27

信奥赛CSP-J复赛集训（DP专题）（13）：P2800 又上锁妖塔

信奥赛CSP-J复赛集训（DP专题）（13）：P2800又上锁妖塔题目描述小A在玩《剑仙》，他遇到了一个锁妖塔，想从外面爬上去。锁妖塔共有nnn层，第i

王老师青少年编程·2025-03-05 12:52

大模型研究：DeepSeek版本比较说明

截至2024年11月，DeepSeek已发布了多个版本的大模型，主要包括DeepSeek-Coder、DeepSeek-LLM等，各版本在不同方面各有优劣：各版本简介及对比1.DeepSeek-Coder

程序猿学长·2025-03-05 09:33

推荐频道

LLM九层妖塔