N-gram语言模型。第12页

一些大语言模型（LLM）相关的开源项目

随风奔跑尿飞扬·2024-02-02 08:08

【动手学大模型】第一章大模型简介

同时研究人员发现，随着语言模型规模的扩大，比如增加模型大小和使用更多的训练数据，模型展现出

Farah_Y·2024-02-02 07:44

数学建模比赛中，使用大语言模型如chatgpt、文心一言该如何写Prompt（提示）？

在大型语言模型中，"prompt"（中文常译为“提示”或“引导”）是指提供给模型的输入文本，用于指示或引导模型产生特定的输出。它的作用主要是告诉模型用户想要得到什么样的信息或完成什么样的任务。

数学建模学习交流·2024-02-02 07:11

【人工智能】探秘OpenAI神奇接口 - ChatCompletion (6)

换句话说，在大语言模型领域，这种根据提示来预测对应的文字输出的过程，被称为Comple

魔道不误砍柴功·2024-02-02 06:13

LLMLingua | 通过提示语压缩为大型语言模型设计一种语言

在当今这个技术飞速发展的时代，大型语言模型（LLM）的能力不断被推向新的高度，它们已经

新加坡内哥谈技术·2024-02-02 06:08

大模型运行成本对比：GPT-3.5/4 vs. 开源托管

作为回应，各行业开始研究大型语言模型以及如何将其纳入其业务中。然而，在医疗保健、金融和法律行业等敏感应用中，ChatGPT等公共API的隐私一直是一个问题。

新缸中之脑·2024-02-02 06:00

【论文阅读】《Text-to-SQL Empowered by Large Language Models: A Benchmark Evaluation》

Text-to-SQLEmpoweredbyLargeLanguageModels:ABenchmarkEvaluation大语言模型助力Text-to-SQL：一项基准评估DaweiGao∗AlibabaGroupgaodawei.gdw

道边苦李，励志笃行·2024-02-02 04:46

基于 Langchain-Chatchat，我搭建了一个本地知识库问答系统

LangChain-Chatchat二、搭建步骤2.1环境配置2.2模型下载2.3初始化知识库和配置文件2.4一键启动2.5启动界面示例技术交流群用通俗易懂方式讲解系列一、LangChain-Chatchat基于ChatGLM等大语言模型与

深度学习算法与自然语言处理·2024-02-02 01:31

对话生成技术:序列到序列模型和Transformer架构

这需要处理的问题包括语言模型、上下文理解、对话策略等。在过去的几年里，许多研究工作已经提出

OpenChat·2024-02-02 00:18

革新智能机器人训练工具

目录莫拉维克悖论EurekaHabitat3.0大语言模型零样本学习Zero-ShotLearningHumanFeedbackMETA发布的HABITAT3.0Habitat3.0提供了三个方面的贡献莫拉维克悖论莫拉维克悖论是由人工智能和机器人学者所发现的一个和常识相佐的现象

Zhi non·2024-02-01 22:39

今日Arxiv最热NLP大模型论文：复旦大学最新研究，如何让大模型说出“我不知道”？

引言：AI助手的真实性挑战在人工智能（AI）的发展进程中，基于大型语言模型（LLMs）的AI助手已经在多个任务中展现出惊人的性能，例如对话、解决数学问题、编写代码以及使用工具。

夕小瑶·2024-02-01 22:29

今日arXiv最热NLP大模型论文：伯克利&DeepMind联合研究，RaLMSpec让检索增强LLM速度提升2-7倍！

引言：知识密集型NLP任务中的挑战与RaLM的潜力在知识密集型自然语言处理（NLP）任务中，传统的大语言模型面临着将海量知识编码进全参数化模型的巨大挑战。

夕小瑶·2024-02-01 22:29

腾讯发表多模态大模型最新综述，从26个主流大模型看多模态效果提升关键方法

在大规模语言模型（LLMs）通往通用人工智能（AGI）的道路中，从传统的单一的“语言模态”扩展到“图像”、“语音”等等的“多模态”必然是大模型进化的必经之路。

夕小瑶·2024-02-01 22:28

OpenAI角色扮演输入优化事项--智谱AI开放平台

语言模型Prompt工程策略：编写清晰、具体的指令为了获得最佳的回答，用户需要向GLM提供清晰、具体的指令。GLM越能明确您的需求，提供的回答质量越高。技巧：定义SystemPrompt

Dachao_lpc·2024-02-01 22:48

ChatGLM-6B：自定义数据集和模型微调！

Datawhale干货开源：ChatGLM，编辑：Coggle数据科学ChatGLM-6B介绍ChatGLM-6B是一个开源的、支持中英双语问答的对话语言模型，基于GeneralLanguageModel

Datawhale·2024-02-01 20:52

自然语言大模型介绍

1简介最近一直被大语言模型刷屏。本文是周末技术分享会的提纲，总结了一些自然语言模型相关的重要技术，以及各个主流公司的研究方向和进展，和大家共同学习。

xieyan0811·2024-02-01 18:42

初识大模型

1大模型定义：“大模型”全称为大型语言模型（LLM）,，狭义上指基于深度学习算法进行训练的自然语言处理（NLP）模型，主要应用于自然语言理解和生成等领域，广义上还包括机器视觉（CV）大模型、多模态大模型等

一刀道人·2024-02-01 18:14

使用ChatGPT学习大象机器人六轴协作机械臂mechArm

它基于大规模语言模型GPT（Gen

大象机器人·2024-02-01 13:54

AI的安全应答之道

作者：统信UOS技术团队2023,随着各种大语言模型的爆发，整个AI生态正处于从决策式AI进化到生成式AI的进程中。各类AI模型和AI应用层出不穷，也随之带来了与AI相关的各类潜在风险。

统信软件技术有限公司·2024-02-01 13:46

【论文阅读笔记】Transformer-XL

AbstractTransformer具有学习长依赖的能力，但受限于语言模型固定长度上下文的限定。本文提出的Transformer-XL神经网络架构可以在不打破

没啥信心·2024-02-01 12:16

对齐大型语言模型与人类偏好：通过表示工程实现

1、写作动机：强化学习表现出相当复杂度、对超参数的敏感性、在训练过程中的不稳定性，并需要在奖励模型和价值网络中进行额外的训练，导致了较大的计算成本。为了解决RL方法带来的上述挑战，提出了几种计算上轻量级的替代方案，在这些替代方案中，两个突出的范例包括对比学习和Hindsight指令重新标记（HIR），然而，无奖励微调容易受到训练集中包含的偏好注释响应对的嘈杂数据或不正确标签的影响。几种方法的比较如

Ly大可爱·2024-02-01 11:53

YAYI-UIE: 一个用于通用信息提取的聊天增强的指令微调框架

1、写作动机：最近的研究提出了基于大型语言模型的方法，以统一地建模不同的信息提取任务。然而，这些现有方法在处理英语以外的中文语言的信息提取能力方面存在不足。

Ly大可爱·2024-02-01 11:53

通过与chatGPT交流实现零样本事件抽取

1、写作动机：近来的大规模语言模型（例如ChatGPT）在零样本设置下取得了很好的表现，这启发作者探索基于提示的方法来解决零样本IE任务。

Ly大可爱·2024-02-01 11:45

免费chartGPT网站汇总

https://chat.tool4j.com\n支持文心4.0、智谱等国内大语言模型，以及gpt4.0等主流大模型）国内可以直连，响应速度很快很稳定，每个月可以免费用10次点击访问以下是从网上收集的，

effort看看喽·2024-02-01 10:57

基于LLM的对话式搜索简明教程

生成式AI和大型语言模型(LLM)实现的最令人兴奋的模式之一是对话式搜索。在这篇文章中，我将介绍你为什么需要对话式搜索、它是如何工作的以及这种搜索模式有哪些限制和变体。

新缸中之脑·2024-02-01 09:48

强强联合！DiffusionGPT : LLM驱动的统一文本到图像生成系统

为了结合两者的优势，提出了DiffusionGPT，它利用大语言模型（LLM）提供一个统一的生成系统，能够无缝地适应各种类型的提示并整

AI生成未来·2024-02-01 09:15

Transformer 自然语言处理（二）

原文：NaturalLanguageProcessingwithTransformers译者：飞龙协议：CCBY-NC-SA4.0第五章：文本生成基于Transformer的语言模型最令人不安的特点之一是它们生成的文本几乎无法与人类写的文本区分开

绝不原创的飞龙·2024-02-01 07:57

OpenVoice文本转语音大模型原理

IVC使用户能够灵活定制生成的声音，在各种真实世界应用中展现了巨大的价值，如媒体内容创作、定制聊天机器人以及人与计算机或大型语言模型之间的多模态交互。原理IVC

MaxCode-1·2024-02-01 07:52

FuseLLM：大语言模型的知识融合！

深度学习自然语言处理原创作者：wkk论文：KNOWLEDGEFUSIONOFLARGELANGUAGEMODELS地址：https://arxiv.org/pdf/2401.10491.pdfgit:https://github.com/fanqiwan/FuseLLM小伙伴们好久没见，今天为大家介绍中山大学联合腾讯人工智能实验室的最新研究论文，关于整合LLM知识能力的框架。引言当进行LLM工作时

zenRRan·2024-02-01 07:20

免费的ChatGPT网站（7个）

1，文心一言网站：https://yiyan.baidu.com/简介：文心一言（ERNIEBot）是百度研发的知识增强大语言模型，能够与人对话互动，回答问题，协助创作，高效便捷地帮助人们获取信息、知识和灵感

还是大剑师兰特·2024-02-01 06:22

阿里巴巴多模态模型Qwen-VL刚迎来升级更新，就被网友逮去装进了ComfyUI里面

其实就是通义千问，Qwen-VL是一种大规模视觉语言模型，由阿里云于2024年1月26日推出。该模型的升级版Qwen-VL-Max拥有更强的视觉推理能力和中文

喜好儿网·2024-02-01 05:24

【GitHub项目推荐--大语言模型课程】【转载】

LargeLanguageModelCourseLargeLanguageModelCourse（大型语言模型课程）是一个开源项目，该课程分为三个部分：LLM基础：涵盖了数学、Python和神经网络的基础知识

旅之灵夫·2024-02-01 03:16

StoryGPT-V——可以生成漫画故事的多模态大模型

尽管存在这些挑战，新兴的大语言模型（LLM）表现出强大的推理能力，能够通过模糊的参考和广泛的序列导航。

知来者逆·2024-02-01 01:27

【无标题】

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大型语言模型（LLM）等安全领域应用的知识。

云起无垠·2024-01-31 22:12

第38期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大型语言模型（LLM）等安全领域应用的知识。

云起无垠·2024-01-31 22:41

ChatGPT 和文心一言哪个更好用？

首先，ChatGPT是由OpenAI基于GPT-3.5架构训练而成，拥有庞大的语言模型和深度学习算法支持。这使得它在理解和生成复杂的语言结构方面表现出色。

五味的编程日记·2024-01-31 22:39

聊一聊GPT、文心、通义、混元

GPT-3.5：在我个人使用GPT模型的过程中，我一直觉得gpt-3.5比国内的语言模型更好用。这可能是因为首因效应的影响，我对gpt-3.5有着一种偏好。

庄泽峰·2024-01-31 18:38

龙哥风向标20240103 GPT拆解

操作步骤：创建小红书垂直类账号，建立品牌形象和粉丝基础寻找无版权的虚拟资料和教育产品供应商，或者使用爬虫爬取相关内容使用大语言模型改写或生成介绍，确保内容原创性在小红书上发布虚拟资料和教育产品的信息，引流到自己的账号与用户进行互动

绝不原创的飞龙·2024-01-31 18:06

大白话理解大语言模型预训练和微调

引言在人工智能的黄金时代，预训练模型已成为推动技术发展的驱动力。这些模型通过自回归和生成式的核心特性，为语言理解和生成开辟了新天地。本文将探讨这两种模型的特性及其对大模型预训练的影响。一、自回归模型的魔法自回归模型是预训练过程中的关键。这种模型通过考虑之前的所有输出来预测下一个词，就像我们填写完形填空题一样。它们是顺序模型，意味着它们一步步地构建序列，每一步只生成一个词。例如，考虑句子：“我喜欢吃

E寻数据·2024-01-31 13:14

如何通过 API 将大语言模型集成到自己的应用程序中

在现代应用程序开发中，利用强大的大语言模型为应用程序增加智能和自然语言处理能力已经成为一种趋势。

云长歌·2024-01-31 12:38

黑盒提示优化：在不进行模型训练的情况下对齐大型语言模型

Black-BoxPromptOptimization:AligningLargeLanguageModelswithoutModelTraining1、写作动机：为了使LLMs更好地遵循用户的指令，现有的对齐方法大多集中在进一步训练它们。然而，LLMs的额外训练通常在GPU计算方面昂贵；更糟糕的是，用户需求的训练模型很多都是闭源的，例如GPTs。2、过去的一些将LLM与人类偏好对齐的方式以及不足

Ly大可爱·2024-01-31 09:01

LLM语言模型，特别是GPT，对美国各种职业和行业的潜在影响

百态老人·2024-01-31 09:00

GPTs大型语言模型对劳动力市场影响潜力的早期观察,对经济、社会和政策影响没有任何暴露任务的职业：蓝领

根据OpenAI的研究，GPTs大型语言模型对劳动力市场的影响潜力可以通过以下标准进行评估：任务暴露度：GPTs可以自动执行的任务数量。任务重要性：GPTs自动执行的任务对工作的重要程度。

小黄人软件·2024-01-31 09:56

使用llama.cpp在本地搭建vicuna 13B语言模型

有人做了windows下的脚本放到github上了，直接运行就可以了。我在本机试了一下13B的模型能运行，但生成速度非常慢，回复一个问题基本上要花5分钟以上的时间。我的机器配置3900X32G内存。https://github.com/mps256/vicuna.ps1

lilihli·2024-01-31 09:50

4.AI大语言模型

AI大语言模型大模型大爆炸阶段，有支持文本生成、逻辑推理、图片生成、视频生成、语言识别等各种单一大模型，也有支持多模态的大模型。普通人如何利用好这些工具来为我们服务。

行循自然-kimi·2024-01-31 09:20

生成式AI与大模型核心技术开发与应用研修班

ChartGPT的发布，让大语言模型成了人工智能的焦点。尤其近期发布的大模型各业务场景应用应接不暇，为行业带来新的发展机遇，甚至将重构AI行业。

人工智能技术与咨询·2024-01-31 08:37

点评：“理想与现实的努力平衡：OpenAI开启测试API试水商业化道路”道翰天琼认知智能机器人大脑API接口平台。

摘要：为了平衡使命和现实，OpenAI开始尝试将研发出的高性能算法GPT-3构建成API以实现商业化……基于这一强大的自然语言模型，OpenAI发布了一款通用的文本处理接口，与先前为特定目标设计的AI系统不同的是

认知智能·2024-01-31 08:05

论文推荐:大语言模型在金融领域的应用调查

这篇论文总结了现有LLM在金融领域的应用现状，推荐和金融相关或者有兴趣的朋友都看看论文分为2大部分：1、作者概述了使用llm的现有方法包括使用零样本或少样本的预训练模型，对特定于领域的数据进行微调，还有从头开始训练定制llm，并给出了关键模型的总结与评价。2、根据给定的用例、数据约束、计算和性能需求，提出决策框架，指导选择合适的LLM解决方案，这是这篇论文可以好好阅读的地方，因为论文还对在金融领域

deephub·2024-01-31 07:29

huggingface 的trainer训练框架优势

be_humble·2024-01-31 07:57

从零训练模型：BERT模型【任务：①MLM（掩码语言模型）、②NSP（下一句预测）】

想要继续训练BERT的话首先需要弄懂NSP和MLM这两个预训练任务的原理，然后再根据这两个任务来通过自己的语料从头训练一个BERT模型或者是以开源的模型参数为基础进行追加训练。下面，掌柜就分别从MSL和NSP任务的数据构造、模型实现和网络训练等方面来一一进行介绍。1引言经过前面六篇文章的介绍，我们已经清楚了：BERT的基本原理[1]、如何从零实现BERT[2]、如何基于BERT预训练模型来完成文本

u013250861·2024-01-31 07:38

推荐频道

N-gram语言模型。