N-gram语言模型第56页

大语言模型(LLM)综述(一)：大语言模型介绍

ASurveyofLargeLanguageModels前言1.INTRODUCTION2.OVERVIEW2.1大语言模型的背景2.2GPT系列模型的技术演变前言随着人工智能和机器学习领域的迅速发展，

青云遮夜雨·2023-10-27 20:02

大语言模型(LLM)综述(四)：如何适应预训练后的大语言模型

ASurveyofLargeLanguageModels前言5.ADAPTATIONOFLLMS5.1指导调优5.1.1格式化实例构建5.1.2指导调优策略5.1.3指导调优的效果5.1.4指导调优的实证分析5.2对齐调优5.2.1Alignment的背景和标准5.2.2收集人类反馈5.2.3根据人类反馈进行强化学习5.2.4无需RLHF的对齐5.2.5对于SFT和RLHF的评论5.3参数高效的模

青云遮夜雨·2023-10-27 20:25

Prompt设计与大语言模型微调

本文主要介绍了Prompt设计、大语言模型SFT和LLM在手机天猫AI导购助理项目应用。

阿里巴巴淘系技术团队官网博客·2023-10-27 18:24

第9期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大型语言模型（LLM）等安全领域应用的知识。

云起无垠·2023-10-27 11:45

第5期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大型语言模型（LLM）等安全领域应用的知识。

云起无垠·2023-10-27 11:15

第6期|GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大型语言模型（LLM）等安全领域应用的知识。

云起无垠·2023-10-27 11:15

第7期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大型语言模型（LLM）等安全领域应用的知识。

云起无垠·2023-10-27 11:15

第8期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大型语言模型（LLM）等安全领域应用的知识。

云起无垠·2023-10-27 11:39

大模型周报丨Table-GPT、3D-GPT、AgentTuning等新工作重磅来袭

2022年底，OpenAI推出的基于GPT-3.5的大型语言模型ChatGPT，由于

AMiner学术搜索和科技情报挖掘·2023-10-27 10:32

Table-GPT:让大语言模型理解表格数据

llm对文本指令非常有用，但是如果我们尝试向模型提供某种文本格式的表格数据和该表格上的问题，LLM更有可能产生不准确的响应。在这篇文章中，我们将介绍微软发表的一篇研究论文，“Table-GPT:Table-tuningGPTforDiverseTableTasks”，研究人员介绍了Table-GPT，一种针对该问题的GPT模型，可以更好地理解输入中的表并产生准确的响应。我们将解释这篇论文，以了解如

deephub·2023-10-27 10:29

什么情况下你会使用AI工具（chatgpt、bard）？

前言–人工智能教程ChatGPT是一款由OpenAI开发的大型语言模型，可以生成文本、翻译语言、编写不同类型的创意内容，并以信息丰富的方式回答你的问题。

此星光明·2023-10-27 08:12

只需100GB内存，让Falcon 180B在你的电脑上起飞

然而，在短短不到几个月的时间，研究所又推出了第三个重量级的大语言模型——Falcon180B。

技术狂潮AI·2023-10-27 04:00

量化HuggingFace的Transformers 模型

huggingface.co/docs/transformers/main/en/main_classes/quantizationAutoGPTQ集成Transformers已集成了optimumAPI以对语言模型执行

Tim_Van·2023-10-27 04:00

[论文笔记]NEZHA

预训练语言模型由于具有通过对大型语料库进行预训练来捕获文本中深层上下文信息的人能力，因此在各种自然语言理解任务中均取得了巨大成功。然而，对中文预训练模型B

愤怒的可乐·2023-10-27 01:01

NVIDIA基于Code Llama发布在线版本Llama，人人可以免费使用

CodeLlama是Meta发布的基于Llama-2，针对代码生成的NLP大语言模型。

人工智能研究所·2023-10-26 22:48

Prevalence and prevention of large language model use in crowd work

众包工作中使用大型语言模型的流行率和预防摘要1研究1：LLM使用的普遍率2研究2：LLM使用的预防3讨论4材料与方法摘要我们表明，大型语言模型（LLM）的使用在众包工作者中很普遍，有针对性的缓解策略可以显著减少但不能消除

UnknownBody·2023-10-26 21:46

大语言模型(LLM)综述(三)：大语言模型预训练的进展

模型架构4.2.1典型架构4.2.2详细配置4.2.3预训练任务4.2.4解码策略4.2.5总结和讨论4.3模型训练4.3.1优化设置4.3.2可扩展的训练技术前言随着人工智能和机器学习领域的迅速发展，语言模型已经从简单的

青云遮夜雨·2023-10-26 21:58

浅试通义千问大模型API调用

“通义千问大模型”是阿里云推出的一个超大规模的语言模型，具有强大的归纳和理解能力，可以处理各种自然语言处理任务，包括但不限于文本分类、文本生成、情感分析等。

来上云吧·2023-10-26 18:10

第13期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大型语言模型（LLM）等安全领域应用的知识。

云起无垠·2023-10-26 18:12

第10期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大型语言模型（LLM）等安全领域应用的知识。

云起无垠·2023-10-26 18:12

第12期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大型语言模型（LLM）等安全领域应用的知识。

云起无垠·2023-10-26 18:12

第11期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大型语言模型（LLM）等安全领域应用的知识。

云起无垠·2023-10-26 18:09

Are Large Language Models Really Robust to Word-Level Perturbations?

大型语言模型真的对单词级扰动具有鲁棒性吗？

UnknownBody·2023-10-26 18:37

NEFTUNE: NOISY EMBEDDINGS IMPROVE INSTRUCTION FINETUNING

NEFTUNE：噪声嵌入改善指令微调摘要1引言2NEFTUNE：噪声嵌入指令调整3实验设置4结果5分析6结论与局限性摘要我们展示了语言模型微调可以通过简单的增强来改进，有时甚至是显著的改进。

UnknownBody·2023-10-26 18:37

OPENCHAT: ADVANCING OPEN-SOURCE LANGUAGE MODELS WITH MIXED-QUALITY DATA

OPENCHAT：利用混合质量数据推进开源语言模型摘要1引言2前言3OpenChat4实验5分析6相关工作7结论与未来工作摘要如今，像LLaMA这样的开源大型语言模型已经出现。

UnknownBody·2023-10-26 18:07

大学生学数学，不妨读《数学之美》这本书

统计方法、统计语言模型、中文信息处理、隐含马尔科夫模型、布尔代数、图论、网页排名技术、信息论、动态规划、余弦定理、矩阵运算、信息指纹、密码学、搜索技术、数学模型、最大熵模型、拼音输入法、贝叶斯网络、句法分析

令狐翀冲鸭·2023-10-26 17:30

大语言模型系列

国产大模型开源一哥再登场，最强双语LLM「全家桶」级开源！340亿参数超越Llama2-70B为什么说大模型训练很难？-知乎GitHub-jeinlee1991/chinese-llm-benchmark:中文大模型能力评测榜单：覆盖百度文心一言、chatgpt、阿里通义千问、讯飞星火、belle/chatglm6b等开源大模型，多维度能力评测。不仅提供能力评分排行榜，也提供所有模型的原始输出结果

贝猫说python·2023-10-26 16:08

抢跑大模型应用大战，从这场黑客松开始

Datawhale赛事主办方：36Kr，合作方：Datawhale首届我爱黑“可颂”大语言模型应用创新挑战赛来了！

Datawhale·2023-10-26 12:07

GPT-1、GPT-2和GPT-3模型详解及其进化之路

GPT-1模型原理与结构OpenAIgpt模型基于Transformer的语言模型，其利用Transformer的decoder结构来进行单向语言模型的训练。

-柚子皮-·2023-10-26 12:16

LLM：大语言模型

大语言模型发展树主要分成底层和3个分支（transformer-encoder类、transformer类、transformer-decoder类）from:[https://blog.csdn.net

-柚子皮-·2023-10-26 12:16

GPT的前世今生：从gpt1到chatgpt的能力提升

transformer模型openai推出了gpt1模型以及google推出了bert模型，到2019-2021年openai陆续推出gpt2和gpt3，再到2022-2023年推出chat-gpt和gpt4，大语言模型已经发展成了一个具有

-柚子皮-·2023-10-26 11:11

【AI实战】最强开源 6B 中文大语言模型ChatGLM2-6B，从零开始搭建

【AI实战】最强开源6B中英文大语言模型ChatGLM2-6B，从零开始搭建ChatGLM2-6B简介ChatGLM2-6B评测结果ChatGLM2-6B搭建参考ChatGLM2-6B简介ChatGLM2

szZack·2023-10-26 10:24

[BELLE] Chathome:development and evaluation of a domain-specific llm for home renovation

1.introductionChatHome是一个专门为家装改造设计的语言模型，包括两个步骤：首先，使用涵盖专业文章、标准文件和网络内容的广泛家装改造数据集对通用模型进行预训练后调整；其次，使用家装改造为基础的提示生成的问题

Kun Li·2023-10-26 08:58

当一名硅谷创业者决定参加百度“文心杯”大赛

但这次，是我们团队第一次尝试用国内的大语言模型。我感觉到了很多惊喜，比如在速度上，文心一言比ChatGPT的生成答案速度还快。”

超声波沙龙·2023-10-26 07:53

论文解读：Black-Box Tuning for Language-Model-as-a-Service

核心要点：诸如GPT-3等大预训练语言模型（PLM）以服务的形式发布。允许用户设计特定于任务的提示(TaskspecifiedPrompt)，并通过黑盒API查询PLM。

RittoQin·2023-10-26 07:41

大语言模型在天猫AI导购助理项目的实践！

本文主要介绍了Prompt设计、大语言模型SFT和LLM在手机天猫AI导购助理项目应用。

机器学习社区·2023-10-26 07:01

探索大模型技术在运维方向的应用前景

OpenAI在2022年11月发布了对话型大语言模型ChatGPT，提供了高度智能化的人机交互体验和极富创造力的内容生成能力，模型一经发布，就得到全世界的广泛关注。

机器学习社区·2023-10-26 07:30

2023 年最佳开源软件

上榜的25个软件涵盖编程语言、运行时、应用程序框架、数据库、分析引擎、机器学习库、大型语言模型(LLM)、用于部署LLM的工具等领域ApacheHudi在构建开放式数据湖或湖仓一体时，许多行业都需要一个更可发展和可变化的平台

ejinxian·2023-10-26 07:15

一篇关于LLM指令微调的综述

深度学习自然语言处理原创作者：cola指令微调(IT)是提高大型语言模型(LLM)能力和可控性的关键技术。

大数据AI人工智能培训专家培训讲师叶梓·2023-10-26 04:59

一款集成了主流大语言模型以及绘图模型的 APP，采用 Flutter 开发，代码完全开源！！

一款集成了主流大语言模型以及绘图模型的APP，采用Flutter开发，代码完全开源，支持以下功能：支持OpenAI的GPT-3.5，GPT-4大语言模型支持Anthropic的Claudeinstant

向彪-blockchain·2023-10-26 04:54

立哥尖端技术-中国电信Telechat大模型模型层探秘

该层为整个系统提供全局模型能力，由通用Telechat（语翼）大语言模型支撑。

小可爱J 人工智能学者全栈工程师·2023-10-26 03:09

AI 编程与研发效能论坛笔记摘录

LLM涉及到的领域NLP/ML提示工程知识工程多任务调度算法优化LLM涉及到的技术算法:深度学习、强化学习、迁移学习大语言模型预训练技术,包括构建预训练系统参数高效微调技术数

恭仔さん·2023-10-26 01:26

【网安大模型专题10.19】论文6：Java漏洞自动修复+数据集 VJBench+大语言模型、APR技术+代码转换方法+LLM和DL-APR模型的挑战与机会

写在最前面摘要贡献发现介绍背景：漏洞修复需求和Java漏洞修复方向动机方法贡献数据集先前的数据集和Java漏洞Benchmark数据集扩展要求数据处理工作最终数据集VJBenchVJBench与Vul4J的比较大语言模型和

是Yu欸·2023-10-26 01:21

AI小百科 - 什么是大语言模型（Large Language Model）？

我是一个特殊的机器人助手，名字叫做LLM（LargeLanguageModel）。想象一下，你知道电脑是怎么帮助人们做各种事情的吧？LLM就是一种非常聪明的电脑程序，它被训练得非常聪明，可以回答各种各样的问题。LLM就像是一个超级智能的图书馆管理员，它可以记住很多书里的知识，而且能够理解人们问的问题，并给出最合适的答案。无论是关于科学、历史、地理、文学还是其他领域的问题，LLM都可以帮助你找到答案

LarryHai6·2023-10-26 01:18

【网安大模型专题10.19】论文3：ChatGPT+自协作代码生成+角色扮演+消融实验

Self-collaborationCodeGenerationviaChatGPT写在最前面朋友分享的收获与启发课堂讨论代码生成如何协作，是一种方法吗思路相同交互实用性代码生成与自协作框架摘要相关工作PPT学习大语言模型在代码生成方向提高生成的代码的准确性和质量

是Yu欸·2023-10-26 01:13

AI在线工具分享

1、ChatGPTChatGPT是一种由OpenAI训练的大型语言模型。

Knight_Key·2023-10-25 20:40

Alexon：在云原生环境中快速部署应用服务

SymeCloud公司主要致力于AI-Infra方面的研发，从OpenAI泄露出的技术架构来看，基于大语言模型的推理产品的主要工程难度在于部署。产品级LLM并不是简单地跑个单节点，而是有复杂的架构

UsamaBinLaden·2023-10-25 16:38

大模型人工智能师资培训·华南理工大学站重磅招募中！

伴随预训练大语言模型技术引发的产业变革，市场对AI人才需求也同样发生着深刻变化，教育迎来了新的机遇与挑战。

飞桨PaddlePaddle·2023-10-25 15:57

斯坦福NLP提出EFT：如何不实际微调而“假装”微调了LLM?

语言模型（LM）的训练经历两个关键阶段：首先，利用大量多样化的文本数据进行预训练；接着，对模型针对特定目标进行微调。

大数据AI人工智能培训专家培训讲师叶梓·2023-10-25 14:51

惊呼！在Mac上可以跑LLaMA啦！附上详细教程

夕小瑶·2023-10-25 11:36

推荐频道

N-gram语言模型

大语言模型(LLM)综述(一)：大语言模型介绍

大语言模型(LLM)综述(四)：如何适应预训练后的大语言模型

Prompt设计与大语言模型微调

第9期 | GPTSecurity周报

第5期 | GPTSecurity周报

第6期|GPTSecurity周报

第7期 | GPTSecurity周报

第8期 | GPTSecurity周报

大模型周报丨Table-GPT、3D-GPT、AgentTuning等新工作重磅来袭

Table-GPT:让大语言模型理解表格数据

什么情况下你会使用AI工具（chatgpt、bard）？

只需100GB内存，让Falcon 180B在你的电脑上起飞

量化HuggingFace的Transformers 模型

[论文笔记]NEZHA

NVIDIA基于Code Llama发布在线版本Llama，人人可以免费使用

Prevalence and prevention of large language model use in crowd work

大语言模型(LLM)综述(三)：大语言模型预训练的进展

浅试通义千问大模型API调用

第13期 | GPTSecurity周报

第10期 | GPTSecurity周报

第12期 | GPTSecurity周报

第11期 | GPTSecurity周报

Are Large Language Models Really Robust to Word-Level Perturbations?

NEFTUNE: NOISY EMBEDDINGS IMPROVE INSTRUCTION FINETUNING

OPENCHAT: ADVANCING OPEN-SOURCE LANGUAGE MODELS WITH MIXED-QUALITY DATA

大学生学数学，不妨读《数学之美》这本书

大语言模型系列

抢跑大模型应用大战，从这场黑客松开始

GPT-1、GPT-2和GPT-3模型详解及其进化之路

LLM：大语言模型

GPT的前世今生：从gpt1到chatgpt的能力提升

【AI实战】最强开源 6B 中文大语言模型ChatGLM2-6B，从零开始搭建

[BELLE] Chathome:development and evaluation of a domain-specific llm for home renovation

当一名硅谷创业者决定参加百度“文心杯”大赛

论文解读：Black-Box Tuning for Language-Model-as-a-Service

大语言模型在天猫AI导购助理项目的实践！

探索大模型技术在运维方向的应用前景

2023 年最佳开源软件

一篇关于LLM指令微调的综述

一款集成了主流大语言模型以及绘图模型的 APP， 采用 Flutter 开发，代码完全开源！！

立哥尖端技术-中国电信Telechat大模型模型层探秘

AI 编程与研发效能论坛 笔记摘录

【网安大模型专题10.19】论文6：Java漏洞自动修复+数据集 VJBench+大语言模型、APR技术+代码转换方法+LLM和DL-APR模型的挑战与机会

AI小百科 - 什么是大语言模型（Large Language Model）？

【网安大模型专题10.19】论文3：ChatGPT+自协作代码生成+角色扮演+消融实验

AI在线工具分享

Alexon：在云原生环境中快速部署应用服务

大模型人工智能师资培训·华南理工大学站重磅招募中！

斯坦福NLP提出EFT：如何不实际微调而“假装”微调了LLM?

惊呼！在Mac上可以跑LLaMA啦！附上详细教程

一款集成了主流大语言模型以及绘图模型的 APP，采用 Flutter 开发，代码完全开源！！

AI 编程与研发效能论坛笔记摘录