词向量-语言模型第4页

玩转大模型的第一步——提示词(Prompt)工程【抛砖篇】

前言AI大模型提示词工程，又名LLMpromptsProject，指的是在使用大型语言模型（如OpenAI的GPT系列）时，用于引导模型生成特定响应的输入，是在使用AI大模型过程中非常重要的一个环节，是模型生成文本的起点

AI大模型老林·2025-01-20 03:37

实战千问2大模型第五天——VLLM 运行 Qwen2-VL-7B（多模态）

一、简介VLLM是一种高效的深度学习推理库，通过PagedAttention算法有效管理大语言模型的注意力内存，其特点包括24倍的吞吐提升和3.5倍的TGI性能，无需修改模型结构，专门设计用于加速大规模语言模型

学术菜鸟小晨·2025-01-20 02:50

使用Python实现LLM的文本生成：风格迁移与内容控制

文章目录引言1.大型语言模型（LLM）概述1.1Transformer架构1.2预训练与微调2.文本生成基础2.1无条件生成2.2条件生成3.风格迁移3.1风格迁移的基本原理3.2使用Python实现风格迁移

二进制独立开发·2025-01-20 02:46

AI 在播客领域的应用

播客以语言交谈为主，是大语言模型AI可以大展拳脚的地方，比如播客简介，播客节目笔记（shownotes）的自动化生成，播客节目单自动化推荐等等。

姚家湾·2025-01-19 21:00

文心一言vsGPT-4全面对比

文心一言和GPT-4都是当前非常先进的人工智能语言模型，它们各自具有独特的特点和优势。

编程小郭·2025-01-19 18:45

【大模型】从零样本到少样本学习：一文读懂 Zero-shot、One-shot 和 Few-shot 的核心原理与应用！

正文：在自然语言处理（NLP）领域，Zero-shot、One-shot和Few-shot学习已经成为衡量大语言模型泛化能力的重要指标。

橙子小哥的代码世界·2025-01-19 17:06

Cognitive Architectures for Language Agents

语言代理的认知架构摘要1引言2背景：从字符串到符号AGI3语言模型与生产系统之间的链接4语言代理的认知架构（CoALA）：一个概念框架5用例6可操作的见解7讨论8结论摘要最近的努力已经将大型语言模型（LLM

UnknownBody·2025-01-19 16:57

探索LLMonitor：全面提升AI应用可观测性的开源平台

引言在构建和部署大型语言模型（LLM）和聊天模型时，开发者通常面临数据追踪、使用情况分析、成本控制等各种挑战。LLMonitor是一个开源的可观测性平台，专注于解决这些挑战。

afTFODguAKBF·2025-01-19 14:05

利用Langchain与Minimax进行自然语言处理的精彩指南

Minimax作为一家中国初创企业，专注于提供优秀的语言模型服务。本篇文章将介绍如何使用Langchain库与Minimax进行交互，帮助开发者充分利用这一强大的AI工具。

afTFODguAKBF·2025-01-19 14:05

DeepSeek V3：新一代开源 AI 模型，多语言编程能力卓越

DeepSeekV3的核心亮点DeepSeekV3是一款基于混合专家（MoE）架构的大型语言模型，

that's boy·2025-01-19 10:35

深度剖析 DeepSeek V3 技术报告：架构创新与卓越性能表现

随着人工智能（AI）技术的不断发展，各种大规模语言模型（LLM）层出不穷，DeepSeekV3作为其中的一员，凭借其出色的性能表现和创新的架构设计，吸引了广泛关注。

微凉的衣柜·2025-01-19 09:27

学习AI大模型的小白入门建议和具体的学习方法推荐

深度思考我是一名在汽车行业工作的嵌入式系统工程师，现在我想进入人工智能领域，特别是大型语言模型。说到人工智能，我是一个完全的新手，所以我需要弄清楚从哪里开始。让我们把它分解一下。

aFakeProgramer·2025-01-19 08:17

第二课堂笔记——大语言模型

part1——qwen在这一部分中需要完成初步运行通义千问，流式输出与在网页窗口进行对话。1.环境准备首先配置满足需求的环境。配置环境代码中：!pipinstalltransformers==4.37.0-U用于安装或更新Python的transformers库到特定版本4.37.0。‌这里的-U参数表示如果已安装transformers库，‌则将其更新到指定的版本。‌!pipinstallstr

skna_·2025-01-19 06:26

大模型-Qwen2.5 技术报告解读

Abstract主要是在介绍通义千问2.5（Qwen2.5）这一大型语言模型系列，涵盖了它在不同训练阶段的改进、多样化配置、可获取途径以及在各项性能评测中的出色表现等多个方面，旨在展示其先进性与实用性。

数据分析能量站·2025-01-19 06:55

Python调用通义千问qwen2.5模型步骤

Qwen2.5模型简介1.1模型概述Qwen2.5是阿里云推出的一款超大规模语言模型，它基于阿里巴巴达摩院在自然语言处理领域的研究和积累。

我就是全世界·2025-01-19 05:15

深度学习-45-大型语言模型LLM之本地化部署运行自己的大模型

文章目录1深度学习1.1神经网络和深度学习1.2神经网络的工作原理1.3神经网络的专业术语2LLM概述2.1大模型的"大"是指什么?2.2训练大模型有多烧钱？2.3如何入门大模型？2.4LLM的结构2.4.1Transformer2.4.2Prompts2.4.3FineTuning3本地跑大模型3.1Ollama运行开源LLM3.1.1启动并运行3.1.2使用api访问3.1.3设置外网访问3.

皮皮冰燃·2025-01-19 04:58

从零开始构建一个大语言模型-第二章第一节

#第二章目录**2.1理解词嵌入**2.2文本分词2.3将词元转换为词元ID2.4添加特殊上下文词元2.5字节对编码2.6使用滑动窗口进行数据采样2.7创建词元嵌入2.8编码词位置#本章涵盖为大型语言模型训练准备文本

释迦呼呼·2025-01-19 03:55

【cs.CV】25.1.14 arxiv更新速递

110篇—第1篇----=====Omni-RGPT:UnifyingImageandVideoRegion-levelUnderstandingviaTokenMarks关键词:计算机视觉,多模态大语言模型

hinmer·2025-01-19 03:25

Knowledge Boundary of Large Language Models: A Survey

大型语言模型的知识边界：综述摘要1引言2知识边界的定义3不良行为4知识边界的识别5缓解6挑战与前景7结论局限性摘要尽管大型语言模型（LLM）在其参数中存储了大量的知识，但它们在记忆和利用某些知识方面仍然存在局限性

UnknownBody·2025-01-19 03:52

从零开始:在服务器上部署大模型并集成到 vscode +Cline使用

近年来，大型语言模型（LLMs）展现出了强大的自然语言处理能力，吸引了越来越多的关注。Qwen系列模型是阿里巴巴开源的一系列强大的大语言模型，具有优秀的性能和广泛的应用场景。Olla

一个正经的AI·2025-01-19 00:35

3.ChatClient&Chat Model简化与AI模型的交互

通过向预训练语言模型（如GPT等）发送提示词或部分对话内容，模型依据自身训练数据及对自然语言模式的理解，生成对话的延续或完整回复，并返回给应用程序。应用程序可以将其呈现给用户或用于进一步处理。

laopeng301·2025-01-18 23:20

ollama教程——使用LangChain调用Ollama接口实现ReAct

walkskyer·2025-01-18 21:25

思维图GOT：用大语言模型解决复杂问题

23年8月份来自瑞士和波兰的大学以及一个数据公司Cledar的大语言模型论文“GraphofThoughts:SolvingElaborateProblemswithLargeLanguageModels

硅谷秋水·2025-01-18 19:05

文心一言 vs gpt-4 全面横向比较

文心一言是中国百度公司研发的大规模语言模型，它有超多的参数，就像一个超级大脑，特别擅长理解并生成中文内容。在聊天啊、写文章啊、答题这些任务上表现不错，对中国文化和国情有更深的理解和适应能力。

周盛欢·2025-01-18 18:54

LLMs，即大型语言模型

LLMs，即大型语言模型，是一类基于深度学习的人工智能模型，它们通过海量的数据和大量的计算资源进行训练，可以理解和生成自然语言。

maopig·2025-01-18 17:52

【论文速读】| 利用大语言模型在灰盒模糊测试中生成初始种子

基本信息论文标题:HarnessingLargeLanguageModelsforSeedGenerationinGreyb0xFuzzing作者:WenxuanShi,YunhangZhang,XinyuXing,JunXu作者单位:NorthwesternUniversity,UniversityofUtah关键词:Greyb0xfuzzing,LargeLanguageModels,Seed

云起无垠·2025-01-18 17:52

第79期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

云起无垠·2025-01-18 17:22

第60期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

云起无垠·2025-01-18 17:22

【LLM】大语言模型（LLMs）

大型语言模型（LLMs）1.什么是大型语言模型？大型语言模型（LargeLanguageModel，LLM）是基于深度学习的自然语言处理模型，能够理解和生成自然语言文本。

林九生·2025-01-18 17:21

全新 Hopper 架构的Transformer 引擎有什么特点？

Transformer模型是当今广泛使用的语言模型（例如asBERT和GPT-3）的支柱。

扫地的小何尚·2025-01-18 17:50

大语言模型（LLMs）入门教程（非常详细）从零基础入门到精通，看完这一篇就够了

大语言模型（LLMs）作为人工智能（AI）领域的一项突破性发展，已经改变了自然语言处理（NLP）和机器学习（ML）应用的面貌。

大模型零基础教程·2025-01-18 17:19

《AI语言模型的关键技术探析：系统提示、评估方法与提示工程》

文章主要内容摘要1.系统提示(SystemPrompt)定义:用于设置模型行为、角色和工作方式的特殊指令重要性:定义模型行为边界影响输出质量和一致性可将通用模型定制为特定领域助手挑战:技术集成复杂兼容性问题效果难以精确预测2.模型评估方法创新方向:自一致性(Self-Consistency)评估PlanSearch方法强化学习(RL)应用核心特点:多次采样和交叉验证策略空间探索动态权重调整实践价值

XianxinMao·2025-01-18 17:16

《多模态语言模型：一个开放探索的技术新领域》

核心主题多模态语言模型的特点仍处于探索和定义阶段没有固定的标准任务和评估方法研究方向高度开放技术路径主要存在两种方法：后期融合(LateFusion)从语言模型backbone开始添加图像编码器效果稳定

XianxinMao·2025-01-18 17:16

第83期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

云起无垠·2025-01-18 16:11

【大模型LoRa微调】Qwen2.5 Coder 指令微调【代码已开源】

本文需要用到的代码已经放在GitHub的仓库啦，别忘了给仓库点个小心心~~~https://github.com/LFF8888/FF-Studio-Resources第001个文件哦~一、引言：大语言模型与指令微调

FF-Studio·2025-01-18 07:31

《提示工程的科学化探索与大语言模型交互革新》

文章信息摘要主题：提示工程的科学化与大语言模型交互革新核心内容：提示工程的科学化与系统化建立可复现的方法论形成系统性知识体系构建标准化流程和评估体系大语言模型带来的交互变革从指令驱动到对话驱动从单一输出到多轮复杂交互从工具到协作伙伴的转变提示对模型行为的影响机制认知层面

XianxinMao·2025-01-18 06:57

第78期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

·2025-01-18 05:13

GitHub每日最火火火项目（1.17）

OpenBMB/MiniCPM-o项目名称：OpenBMB/MiniCPM-o用途：MiniCPM-o2.6是一个适用于手机的视觉、语音和多模态直播的GPT-4o级别大语言模型（LLM）。

FutureUniant·2025-01-18 04:12

第81期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

·2025-01-18 01:02

第83期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

·2025-01-18 00:26

记录一个LLM+API类型的临床预测模型APP（糖尿病Cox预测模型）的过程

记录一个LLM+API类型的临床预测模型APP（糖尿病Cox预测模型）的构建过程LLM代表的是大语言模型，API代表的是机器学习模型，LLM+API是说将机器学习模型以API的形式引入到LLM，让机器学习模型以对话的方式与用户交流而服务于临床实践的

预测模型的开发与应用研究·2025-01-17 22:20

GraphRAG 本地 Ollama - 知识图谱

论文摘要使用检索增强生成（RAG）从外部知识源中检索相关信息，使大型语言模型（LLMs）能够回答关

ericliu2017·2025-01-17 21:07

第79期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

·2025-01-17 19:08

提示工程（Prompt Engineering）最全综述：本质、技术、最佳实践

一、理解提示与提示工程（promptengineering）（一）提示的本质提示是我们输入给大语言模型以获取期望响应的信息。它的形式丰富多样，可以是一个

大模型之路·2025-01-17 14:13

安装指南：LLaMA Factory、AutoGPTQ 和 vllm

安装指南：LLaMAFactory、AutoGPTQ和vllm在本文中，我们将详细介绍如何安装LLaMAFactory、AutoGPTQ和vllm，这些工具在大型语言模型（LLMs）和视觉语言模型（VLMs

从零开始学习人工智能·2025-01-17 13:05

DeepSeek Artifacts：前端开发的新利器

这款轻量级模型凭借在大语言模型（LLM）排行榜上的优异表现，以及亲民的价格和卓越的性能，在人工智能社区中广受关注。然而，它的姊妹工具DeepSeekArtifacts却因截然不同的缘由引发了热议。

·2025-01-17 05:12

大规模语言模型从理论到实践大语言模型预训练数据

大规模语言模型从理论到实践：大语言模型预训练数据关键词：大规模语言模型、预训练数据、数据集选择、数据清洗、数据增强、数据集评估、数据集扩展1.背景介绍1.1问题的由来随着深度学习和大规模神经网络的发展，

AI大模型应用之禅·2025-01-17 03:39

PyTorch建模与应用：从深度学习到大模型

全书共11章，内容涵盖了从深度学习的基础概念到大语言模型的应用。第1章介绍了深度

屿小夏·2025-01-17 00:12

论文翻译：A survey on large language model (LLM) security and privacy: The Good, The Bad, and The Ugly

TheGood,TheBad,andTheUglyhttps://www.sciencedirect.com/science/article/pii/S266729522400014X文章目录关于大型语言模型

CSPhD-winston-杨帆·2025-01-17 00:41

【vLLM 学习】安装

vLLM是一款专为大语言模型推理加速而设计的框架，实现了KV缓存内存几乎零浪费，解决了内存管理瓶颈问题。

·2025-01-17 00:08

推荐频道

词向量-语言模型

玩转大模型的第一步——提示词(Prompt)工程【抛砖篇】

实战千问2大模型第五天——VLLM 运行 Qwen2-VL-7B（多模态）

使用Python实现LLM的文本生成：风格迁移与内容控制

AI 在播客领域的应用

文心一言vsGPT-4全面对比

【大模型】从零样本到少样本学习：一文读懂 Zero-shot、One-shot 和 Few-shot 的核心原理与应用！

Cognitive Architectures for Language Agents

探索LLMonitor：全面提升AI应用可观测性的开源平台

利用Langchain与Minimax进行自然语言处理的精彩指南

DeepSeek V3：新一代开源 AI 模型，多语言编程能力卓越

深度剖析 DeepSeek V3 技术报告：架构创新与卓越性能表现

学习AI大模型的小白入门建议和具体的学习方法推荐

第二课堂笔记——大语言模型

大模型-Qwen2.5 技术报告解读

Python调用通义千问qwen2.5模型步骤

深度学习-45-大型语言模型LLM之本地化部署运行自己的大模型

从零开始构建一个大语言模型-第二章第一节

【cs.CV】25.1.14 arxiv更新速递

Knowledge Boundary of Large Language Models: A Survey

从零开始:在服务器上部署大模型并集成到 vscode +Cline使用

3.ChatClient&Chat Model简化与AI模型的交互

ollama教程——使用LangChain调用Ollama接口实现ReAct

思维图GOT：用大语言模型解决复杂问题

文心一言 vs gpt-4 全面横向比较

LLMs，即大型语言模型

【论文速读】| 利用大语言模型在灰盒模糊测试中生成初始种子

第79期 | GPTSecurity周报

第60期 | GPTSecurity周报

【LLM】大语言模型（LLMs）

全新 Hopper 架构的Transformer 引擎有什么特点？

大语言模型（LLMs）入门教程（非常详细）从零基础入门到精通，看完这一篇就够了

《AI语言模型的关键技术探析：系统提示、评估方法与提示工程》

《多模态语言模型：一个开放探索的技术新领域》

第83期 | GPTSecurity周报

【大模型LoRa微调】Qwen2.5 Coder 指令微调【代码已开源】

《提示工程的科学化探索与大语言模型交互革新》

第78期 | GPTSecurity周报

GitHub每日最火火火项目（1.17）

第81期 | GPTSecurity周报

第83期 | GPTSecurity周报

记录一个LLM+API类型的临床预测模型APP（糖尿病Cox预测模型）的过程

GraphRAG 本地 Ollama - 知识图谱

第79期 | GPTSecurity周报

提示工程（Prompt Engineering）最全综述：本质、技术、最佳实践

安装指南：LLaMA Factory、AutoGPTQ 和 vllm

DeepSeek Artifacts：前端开发的新利器

大规模语言模型从理论到实践 大语言模型预训练数据

PyTorch建模与应用：从深度学习到大模型

论文翻译：A survey on large language model (LLM) security and privacy: The Good, The Bad, and The Ugly

【vLLM 学习】安装

大规模语言模型从理论到实践大语言模型预训练数据