LLm 第19页

自然语言转SQL，一个微调ChatGPT3.5的实例(上)--训练数据准备

最近，大型语言模型（LLM）技术（如GPT-4）的进展提高了所提出解决方案的准确性。

数大招疯·2024-01-05 08:36

使用生成式AI查询大型BI表

鉴于大型语言模型(LLM)令人印象深刻的功能，我们很自然地想知道人工智能是否可以帮助我们将信息需求转化为格式良好的SQL查询。诚然，大多数LLM可以基于自然语言输入至少输出一些SQL查询。

数大招疯·2024-01-05 08:05

2024 年 5 个关键网络安全趋势

考虑到基于人工智能(AI)和大型语言模型(LLM)的工具的功能和可访问性不断增强，我们必须领先威胁行为者几步，并了解来

网络研究院·2024-01-05 05:51

【LLM】大型语言模型综述论文

架构师研究会·2024-01-05 04:31

LLM 中的长文本问题

近期，随着大模型技术的发展，长文本问题逐渐成为热门且关键的问题，不妨简单梳理一下近期出现的典型的长文本模型：10月上旬，MoonshotAI的KimiChat问世，这是首个支持20万汉字输入的智能助手产品；10月下旬，百川智能发布Baichuan2-192K长窗口大模型，相当于一次处理约35万个汉字；11月上旬，OpenAI发布支持128K上下文窗口的GPT-4Turbo模型；11月下旬，Anth

AI知识图谱大本营·2024-01-05 01:49

Think-on-Graph—基于知识图谱的LLM推理

文章目录背景动机LLM模型存在的问题LLM⊕\oplus⊕KG范式的局限性LLM⊗\otimes⊗KG范式（ThinkonGraph，ToG）LLM⊗\otimes⊗KG范式的过程ToG的三个阶段初始化实体提取关系及实体探索推理例子及效果相关结论搜索深度和波束宽度对

dzysunshine·2024-01-05 00:43

KnowLM知识抽取大模型

的知识抽取的智析大模型数据集构建及训练过程预训练数据集构建预训练训练过程指令微调数据集构建指令微调训练过程开源的数据集及模型局限性信息抽取Prompt部署环境配置模型下载预训练模型使用LoRA模型使用KnowLM项目介绍KnowLM是由浙江大学NLP&KG团队的在读博士生研发并开源的项目，是一种将LLM

dzysunshine·2024-01-05 00:13

FinGPT——金融领域开源大模型

以数据为中心的方法用于FinLLMs金融数据和独特特性应对处理金融数据的挑战FINGPT概述：FINLLM的开源框架数据来源面向金融NLP的实时数据工程流程大型语言模型（LLM）应用结论未来工作背景FinGPT

dzysunshine·2024-01-05 00:41

如何训练你自己的大语言模型: 分步指南

引言大语言模型(LargeLanguageModels，LLM)真正彻底改变了人工智能(AI)领域。

Garry1248·2024-01-05 00:58

【langchain】入门初探实战笔记（Chain, Retrieve, Memory, Agent）

大语言模型技术栈大语言模型技术栈由四个主要部分组成：数据预处理流程（datapreprocessingpipeline）嵌入端点（embeddingsendpoint）+向量存储（vectorstore）LLM

小松不菜·2024-01-04 23:51

2024年AI领域的突破性进展预测

GPT-5发布后，LLM在本质上仍然有限，基本的AGI也不足以实现。然而，英伟达高级科学家和OpenAI联创人都预测，2024年将是视频年，视频AI将迎来突破性进展。

go2coding·2024-01-04 23:43

斯坦福和 Meta学者发现Gemini在常识推理任务中有较强潜力；初学者GPT：Ai和LLM资源

AI新闻斯坦福和Meta学者发现Gemini在常识推理任务中有较强潜力摘要：斯坦福和Meta的学者发表论文为Gemini正名，他们发现之前对Gemini的评估并不能完全捕捉到其真正的常识推理潜力。他们设计了需要跨模态整合常识知识的任务，对Gemini在复杂推理任务中的表现进行了全面评估。研究结果显示，Gemini在常识推理能力上表现强大，相比于GPT-3.5Turbo稍有优势。然而，模型在处理时间

go2coding·2024-01-04 23:43

探索大模型语言（LLM）科技的革新

其中，大模型语言（LLM）技术作为人工智能领域的重要分支，正逐渐改变着我们的生活和工作方式。本文将深入探讨大模型语言技术的革新，并展望其在未来的发展前景。

猴哥是肖鸿·2024-01-04 21:38

20、Finetuning

微调是指调整大型语言模型（LLM）的参数以适应特定任务的过程，用于改进预训练模型的性能。这是通过在与任务相关的数据集上训练模型来完成的。所需的微调量取决于任务的复杂性和数据集的大小。

C--G·2024-01-04 20:47

关于：大模型的「幻觉」

幻觉可以说早就已经是LLM老生常谈的问题了，那为什么会产生这个现象该如何解决这个问题呢？快来和我们分享一下吧~>提醒：在发布作品前，请把不需要的内容删掉。

91888888·2024-01-04 18:58

利用Embedding优化搜索功能

我们继续用Gemini学习LLM编程之旅。Embedding是一种自然语言处理(NLP)技术，可将文本转换为数值向量。

fireshort·2024-01-04 16:39

LLM 幻觉现象及 RAG 解决方案

大模型的回答有编造成分或错误.比如问“tensorflow1.12版本有xxx这个api么”,模型回答“有”,其实没有.原因训练语料质量低,本身有错误答案存在.LLM的训练并不关注“事实是否正确”,自然不能保证生成答案一定符合事实

yichudu·2024-01-04 16:45

一文通透Text Embedding模型：从text2vec、openai-ada-002到m3e、bge

v_JULY_v·2024-01-04 15:47

一文掌握文本语义分割：从BERT切分、Cross-Segment到阿里SeqModel

前言之所以写本文，源于以下两点在此文《基于LangChain+LLM的本地知识库问答：从企业单文档问答到批量文档问答》的3.5节中，我们曾分析过langchain-chatchat项目中文本分割相关的代码

v_JULY_v·2024-01-04 15:13

Evaluating Object Hallucination in Large Vision-Language Models----评估大视觉语言模型中的物体幻觉

Abstract受大语言模型（LLM）卓越语言能力的启发，最近提出了大视觉语言模型（LVLM），通过集成强大的LLM来提高复杂多模态任务的性能。

Mars_prime·2024-01-04 14:48

多模态大模型MLLM 指令微调相关文章

文章目录LLM“家谱树”MLLM使用指南--任务导向上手大模型多模态大模型的发展多模态数据!

榴莲_·2024-01-04 12:43

CVPR2023 Tutorial Talk | 哈佛博士主讲大型多模态模型：构建和超越多模态GPT-4

我将介绍不同的方式来利用大型语言模型(LLM)进行多模态任务。我将重点讲解端到端训练的模型，以便我们可

AI每天一点点·2024-01-04 12:11

大模型周报丨微软发布GPT-4V报告，MiniGPT-5不仅续写还配图，内附AMiner AI综述

大模型(LLM)是一种人工智能模型，旨在理解和生成人类语言。它们在大量的文本数据上进行训练，可以执行广泛的任务，包括文本总结、翻译、情感分析等等。

AMiner学术搜索和科技情报挖掘·2024-01-04 12:11

利用ChatGLM3构建Prompt实现Text2SQL

spm=1001.2014.3001.5501使用ChatGLM3实现Text2SQL前言Text2SQL的构建第一阶段：SQL脚本构建（1）构建数据信息表的schema，利用LLM生

我在北国不背锅·2024-01-04 11:19

Redis之父的大语言模型编程实践

【编者按】Redis之父Antirez在自己的博客中分享到，借助ChatGPT等语言辅助编程工具可以节省查询文档等时间，可以直接让GPT生成解释或者代码，对于临时性代码，则可以让LLM直接生成，他最后还提到

AI科技大本营·2024-01-04 10:29

bitsandbytes 安装排错

目录简介，linux安装使用方法win11系统安装：解决方法：简介，linux安装使用方法bitsandbytes是对CUDA自定义函数的轻量级封装，特别是针对8位优化器、矩阵乘法（LLM.int8()

AI视觉网奇·2024-01-04 07:43

大语言模型LLM微调技术：P-Tuning

1引言Bert时代，我们常做预训练模型微调（Fine-tuning），即根据不同下游任务，引入各种辅助任务loss和垂直领域数据，将其添加到预训练模型中，以便让模型更加适配下游任务的方式。每个下游任务都存下整个预训练模型的副本，并且推理必须在单独的批次中执行。那么能不能将所有自然语言处理的任务转换为语言模型任务？就是所有任务都可以被统一建模，任务描述与任务输入视为语言模型的历史上下文，而输出则为语

智慧医疗探索者·2024-01-04 07:28

【论文精读】A Survey on Large Language Model based Autonomous Agents

ASurveyonLargeLanguageModelbasedAutonomousAgents前言Abstract1Introduction2LLM-basedAutonomousAgentConstruction2.1AgentArchitectureDesign2.1.1ProfilingModule2.1.2MemoryModuleMemoryStructuresMemoryFormats

HERODING77·2024-01-04 07:24

大模型语言模型：从理论到实践

资源获取链接二、概念整理定义发展历程大模型的基本构成一、资源获取链接《大规模语言模型：从理论到实践》、复旦大学课件链接/提取码：x7y6二、概念整理定义大规模语言模型（LargeLanguageModels，LLM

棋圣阳阳阳·2024-01-04 06:25

用通俗易懂的方式讲解大模型：在 CPU 服务器上部署 ChatGLM3-6B 模型

大语言模型（LLM）的量化技术可以大大降低LLM部署所需的计算资源，模型量化后可以将LLM的显存使用量降低数倍，甚至可以将LLM转换为完全无需显存的模型，这对于LLM的推广使用来说是非常有吸引力的。

Python算法实战·2024-01-04 04:59

【LLM】大型语言模型：2023年完整指南

Figure1:Searchvolumesfor“largelanguagemodels”近几个月来，大型语言模型（LLM）引起了很大的轰动（见图1）。

架构师研究会·2024-01-03 22:50

企业使用人工智能情况调查

具体来说，ChatGPT和Midjourney等大型语言模型(LLM)正在帮助提高人工智能采用率。一、使用人工智能统计数据的公司全球35%的公司使用人工智能。

万俟淋曦·2024-01-03 18:47

19、BLIP-2

实现过程为了弥合模态差距，提出了一个分两个阶段预训练的QueryingTransformer(Q-Former):使用冻结ImageTransformer的视觉语言表示学习阶段使用冻结LLM的视觉到语言生成学习阶段

C--G·2024-01-03 18:13

LLM Agent-指令微调方案

上一章我们介绍了基于Prompt范式的工具调用方案，这一章介绍基于模型微调，支持任意多工具组合调用，复杂调用的方案。多工具调用核心需要解决3个问题，在哪个位置进行工具调用(where),从众多工具中选择哪一个(Which),工具的输入是什么(What)。Where+Which+What，我称之为3W原则，3H它兄弟哈哈哈哈~其实如何教大模型使用工具，和教人类使用工具没啥区别。就像上周末我想给我妈买

人工智能小豪·2024-01-03 17:02

LLM Agent零微调范式 ReAct & Self Ask

可以有以下两个视角首先是我们赋能模型，如果说LLM是大脑，那Agent提供了手脚和感官感官：获取真实世界的信息，包括实时信息像天气情况，金融市场，交通状况；包括私有信息例如用户个人数据；包括多模态信息像声音和图像手

人工智能小豪·2024-01-03 17:59

利用提示工程，提升LLM将自然语言转化为SQL的准确性

大型语言模型(LLM)已展现出理解自然语言提示并生成连贯响应的卓越能力。这为将自然语言翻译成SQL等结构化查询语言开辟了新的可能性。

数大招疯·2024-01-03 12:21

利用提示工程，提升LLM将自然语言转化为SQL的准确性

大型语言模型(LLM)已展现出理解自然语言提示并生成连贯响应的卓越能力。这为将自然语言翻译成SQL等结构化查询语言开辟了新的可能性。

数大招疯·2024-01-03 12:47

对比开源大语言模型的自然语言生成SQL能力

随着GPT-4、Llama2和Falcon等大型语言模型(LLM)开发的最新进展，业界和学术界对NL

数大招疯·2024-01-03 11:28

克服幻觉：提升语言模型在自然语言处理中的准确性与可靠性

随着语言模型（LLM）在自然语言处理（NLP）中的应用日益普及，它们在文本生成、机器翻译、情感分析等许多任务中展现出惊人的能力。

一尘之中·2024-01-03 11:58

大模型与大模型的幻觉问题

参考大模型中的涌现OpenAI科学家：幻觉是大模型与生俱来的特性，而非缺陷大模型「幻觉」，看这一篇就够了｜哈工大华为出品大模型什么是大模型大语言模型（LLM）是基于海量文本数据训练的深度学习模型。

IT从业者张某某·2024-01-03 09:57

以小博大进行时！2023年值得关注的个小模型

大语言模型（LLM）作为年度热词，已经充分向我们证明了其影响力。如今，一场无声却极具开创性的变革正在兴起。小语言模型（SLM）的兴起正逐步挑战着大预言模型的主导地位。

c++服务器开发·2024-01-03 09:50

大语言模型LLM微调技术：Prompt Tuning

1预训练语言模型概述1.1预训练语言模型的发展历程截止23年3月底，语言模型发展走过了三个阶段：第一阶段：设计一系列的自监督训练目标（MLM、NSP等），设计新颖的模型架构（Transformer），遵循Pre-training和Fine-tuning范式。典型代表是BERT、GPT、XLNet等；第二阶段：逐步扩大模型参数和训练语料规模，探索不同类型的架构。典型代表是BART、T5、GPT-3等

智慧医疗探索者·2024-01-03 08:57

微软真是活菩萨，面向初学者的机器学习、数据科学、AI、LLM课程统统免费

微软真是活菩萨，面向初学者的机器学习、数据科学、AI、LLM课程统统免费大家好，我是老章推荐几个质量上乘且完全免费的微软开源课程面向初学者的机器学习课程**地址：**https://microsoft.github.io

机器学习算法与Python实战·2024-01-03 07:52

卷？中学生开始学习人工智能和大模型，附课件！

课程简介这个experience-ai课程是GooleDeepMind团队和RaspberryPi基金会合作开发的，最大特点是，没有难懂的理论，完全面向0基础人群（初中生），LLM部分比吴恩达近期放出的

机器学习算法与Python实战·2024-01-03 07:51

小周带你读论文-1之“浪潮Yuan2 有哪些创新“

如果自己读嫌麻烦，可以来看我这个的总结老规矩，1,2,3上链接...IEIT-Yuan/Yuan-2.0:Yuan2.0LargeLanguageModel(github.com)Yuan2是浪潮的刚发布的LLM

周博洋K·2024-01-03 05:54

【Amazon Bedrock】体验 Bedrock 的基本功能，为构建强大安全的LLM应用而准备

文章目录一、什么是AmazonBedrock？二、为什么选择AmazonBedrock三、访问AmazonBedrockUI四、与AmazonBedrock聊天五、对比AmazonBedrock不同基础模型的返回结果六、让AmazonBedrock处理文本七、利用AmazonBedrock生成图片八、参考链接一、什么是AmazonBedrock？AmazonBedrock是一个完全托管的服务，它通

云矩阵·2024-01-03 04:19

2023年度AI盘点 AIGC|AGI|ChatGPT|人工智能大模型

LLM：LargeLanguageModel，即大语言模型，旨在理解和生成人类语言。LLM的特点是规模庞大，包含成百、上千亿的

herosunly·2024-01-03 01:51

大语言模型（LLM）框架及微调 (Fine Tuning)

大语言模型（LLM）是指由大规模训练语言模型所得的模型。这些模型通常使用深度学习方法，在巨大的文本语料库上进行训练，以学习语言的各种结构、规则和特征。

m0_黎明·2024-01-03 01:06

【LLM】微调我的第一个WizardLM LoRA

根据特定用例调整LLM的行为之前，我写过关于与Langchain和Vicuna等当地LLM一起创建人工智能代理的文章。如果你不熟悉这个话题，并且有兴趣了解更多，我建议你阅读我之前的文章，开始学习。

架构师研究会·2024-01-02 20:31

【LLM】人工智能应用构建的十大预训练NLP语言模型

在人工智能领域，自然语言处理（NLP）被广泛认为是阅读、破译、理解和理解人类语言的最重要工具。有了NLP，机器可以令人印象深刻地模仿人类的智力和能力，从文本预测到情感分析再到语音识别。什么是自然语言处理？语言模型在NLP应用程序的开发中起着至关重要的作用。然而，从头开始构建复杂的NLP语言模型是非常耗时的。出于这个原因，人工智能和机器学习的研究人员和开发人员对预先训练的语言模型深信不疑。迁移学习是

架构师研究会·2024-01-02 18:47

推荐频道

LLm

自然语言转SQL，一个微调ChatGPT3.5的实例(上)--训练数据准备

使用生成式AI查询大型BI表

2024 年 5 个关键网络安全趋势

【LLM】大型语言模型综述论文

LLM 中的长文本问题

Think-on-Graph—基于知识图谱的LLM推理

KnowLM知识抽取大模型

FinGPT——金融领域开源大模型

如何训练你自己的大语言模型: 分步指南

【langchain】入门初探实战笔记（Chain, Retrieve, Memory, Agent）

2024年AI领域的突破性进展预测

斯坦福和 Meta学者发现Gemini在常识推理任务中有较强潜力；初学者GPT：Ai和LLM资源

探索大模型语言（LLM）科技的革新

20、Finetuning

关于：大模型的「幻觉」

利用Embedding优化搜索功能

LLM 幻觉现象及 RAG 解决方案

一文通透Text Embedding模型：从text2vec、openai-ada-002到m3e、bge

一文掌握文本语义分割：从BERT切分、Cross-Segment到阿里SeqModel

Evaluating Object Hallucination in Large Vision-Language Models----评估大视觉语言模型中的物体幻觉

多模态大模型MLLM 指令微调相关文章

CVPR2023 Tutorial Talk | 哈佛博士主讲大型多模态模型：构建和超越多模态GPT-4

大模型周报丨微软发布GPT-4V报告，MiniGPT-5不仅续写还配图，内附AMiner AI综述

利用ChatGLM3构建Prompt实现Text2SQL

Redis之父的大语言模型编程实践

bitsandbytes 安装排错

大语言模型LLM微调技术：P-Tuning

【论文精读】A Survey on Large Language Model based Autonomous Agents

大模型语言模型：从理论到实践

用通俗易懂的方式讲解大模型：在 CPU 服务器上部署 ChatGLM3-6B 模型

【LLM】大型语言模型：2023年完整指南

企业使用人工智能情况调查

19、BLIP-2

LLM Agent-指令微调方案

LLM Agent零微调范式 ReAct & Self Ask

利用提示工程，提升LLM将自然语言转化为SQL的准确性

利用提示工程，提升LLM将自然语言转化为SQL的准确性

对比开源大语言模型的自然语言生成SQL能力

克服幻觉：提升语言模型在自然语言处理中的准确性与可靠性

大模型与大模型的幻觉问题

以小博大进行时！2023年值得关注的个小模型

大语言模型LLM微调技术：Prompt Tuning

微软真是活菩萨，面向初学者的机器学习、数据科学、AI、LLM课程统统免费

卷？中学生开始学习人工智能和大模型，附课件！

小周带你读论文-1之“浪潮Yuan2 有哪些创新“

【Amazon Bedrock】体验 Bedrock 的基本功能，为构建强大安全的LLM应用而准备

2023年度AI盘点 AIGC|AGI|ChatGPT|人工智能大模型

大语言模型（LLM）框架及微调 (Fine Tuning)

【LLM】微调我的第一个WizardLM LoRA

【LLM】人工智能应用构建的十大预训练NLP语言模型