zenRRan

ACL'22 | 一文解读复旦黄萱菁、邱锡鹏等老师NLP实验室的12篇长文

每天给你送来NLP技术干货！

来自：FudanNLP

国际计算语言学年会（Annual Meeting of the Association for Computational Linguistics, ACL）是自然语言处理领域的顶级学术会议，由计算语言学协会在世界范围内每年召开一次。

在ACL 2022中，复旦大学自然语言处理实验室FudanNLP共计12篇长文被录用，其中包括7篇主会论文和5篇Findings论文。

ACL 2022 主会

CQG: A Simple and Effective Controlled Generation Framework for Multi-hop Question Generation

作者：费子楚，张奇，桂韬，梁迪，王思睿，武威，黄萱菁

类别：Long Paper

摘要：多跳问题生成侧重于生成需要对输入段落的多条信息进行推理的复杂问题。当前具有最先进性能的模型已经能够生成与答案相对应的正确问题。然而，大多数模型无法保证生成问题的复杂性，因此它们可能会生成无需多跳推理即可回答的浅层问题。为了应对这一挑战，我们提出了CQG，这是一个简单有效的可控生成框架。CQG采用简单的方法生成包含多跳推理链中关键实体的多跳问题，保证了问题的复杂性和质量。此外，我们引入了一种新颖的基于Transformer的可控解码器，以保证关键实体出现在问题中。实验结果表明，我们的模型大大提高了性能，在HotpotQA上也比最先进的模型高出5个BLEU点约25%。

Flooding-X: Improving BERT's Resistance to Adversarial Attacks via Loss-Restricted Fine-Tuning

作者：刘勤，郑锐，包容，刘婧漪，刘志华，程战战，乔梁，桂韬，张奇，黄萱菁

类别：Long Paper

摘要：对抗鲁棒性在学界引起了很多关注，主流的解决方案是对抗训练。通用方法是为每个输入样本生成对抗扰动，这种训练方法的计算复杂性随着对抗样本所需要的梯度计算次数成倍上升。为了解决这个问题，我们采用了Flooding方法作为一种低成本的防御方法。然而，这一方法依赖于参数的选择，于是我们进一步提出一个指标来缩小参数搜索范围。Flooding-X并不需要生成额外的对抗扰动来训练模型，其时间消耗近似于模型微调，比标准对抗训练快2-15倍。实验表明，我们的方法在很大程度上提高了BERT对文本对抗攻击的防御能力，并在各种文本分类和GLUE任务上获得了当前最佳的鲁棒正确率。

MINER: Improving Out-of-Vocabulary Named Entity Recognition from an Information Theoretic Perspective

作者：王枭，窦士涵，熊立茂，邹易澄，张奇，桂韬，乔梁，程战战，黄萱菁

类别：Long Paper

摘要：基于深度学习的命名实体识别模型在许多数据集（如CONLL2003）上取得惊人的可喜成绩，但是，近期很多研究表明过去的方法过度依赖实体词本身的信息，以至于对训练集中未见过的实体词（未登录实体词）上的识别性能很差。现实生活中的实体词往往呈长尾分布，意味着这样的模型在实际应用中很难达到预期的效果。在这个工作中，基于信息论，我们提出一种新的NER学习框架去解决未登录实体词的识别问题。该方法额外包含两个基于互信息的训练目标，1）泛化信息最大化，目标是强化文本表示中的上下文信息和可泛化的实体特征；2）多余信息最小化，防止模型过度关注实体词本身和训练集中的数据偏见。实验结果表明，我们的方法可以有效提升模型在未登陆实体词识别上的泛化性和数据扰动下的鲁棒性。

Robust Lottery Tickets for Pre-trained Language Models

作者：郑锐，包容，周钰皓，梁迪，王思睿，武威，桂韬，张奇，黄萱菁

类别：Long Paper

摘要：彩票网络假说(Lottery Ticket Hypothesis)的相关工作表明，预训练模型中存在媲美原始网络性能的子网络，这些子网络也被称为中奖彩票(winning tickets)。然而，中奖彩票在遭受对抗攻击时，表现出了比原始网络更差的鲁棒性。为了缓解上述问题，本文提出了一种基于可学习权重掩码(learnable binary masks for weights)的方法来识别隐藏在原始预训练模型中的鲁棒彩票网络(Robust Tickets）。为了解决二值掩码带来的离散优化问题，本方法使用concrete distribution对掩码进行建模，并使用L0范数的平滑近似来促进掩码的稀疏度。此外，本方法引入对抗损失目标来指引鲁棒彩票网络的搜索过程，确保彩票网络在准确度和鲁棒性上都有很好的表现。实验结果表明，相较之前的工作，本方法在鲁棒性评估上得到显著改善，甚至优于目前最先进的文本对抗防御方法。最后，本文提供了一种新的角度解释预训练语言模型在对抗鲁棒性上的脆弱性：某些预训练权重对准确度没有贡献，但可能会损害模型鲁棒性。

KNN-Contrastive Learning for Out-of-Domain Intent Classification

作者：周云华，刘佩举，邱锡鹏

类别：Long Paper

摘要：未知意图分类对于任务型对话系统是一项基础又具有挑战的任务。现有的方法在学习已知意图的可判别特征（语义）表示时，通常隐性限制已知意图的特征分布区域为“紧致的”或“单连通区域”，即分布区域内部不含未知意图。在下游未知意图检测时，已知意图的特征分布通常又会被限定服从某一特定的分布（最常见为高斯分布），使其应用受限。本文首先探索了未知意图分类问题的本质，借助于Open Space Risk形式化了该问题的优化目标，并提出了一种简单且有效的特征学习方法--k近邻对比学习，即仅利用与样本在特征（语义）空间中相近的k个样本来学习意图的可判别特征表示。进一步，本文尝试从理论层面探索，相比之前方法，该方法能更好优化目标的原因。值得注意的是，本文提出的意图特征学习方式和以密度为基础的异常检测方法天然相适应，从而避免对意图的特征分布做额外限制。在四个文本意图基准数据集上的实验结果表明，该方法能够取得较好的效果。

DialogVED: A Pre-trained Latent Variable Encoder-Decoder Model for Dialog Response Generation

作者：陈伟，宫叶云，王松，要博伦，齐炜祯，魏忠钰，胡晓武，周海涛，毛祎，陈伟祝，程骉，段楠

类别：Long Paper

摘要：开放域对话中的响应生成是一个重要的研究课题，其主要挑战是生成相关且多样的响应。本文提出一种新的对话预训练框架DialogVED，它将连续隐变量引入增强的编码器-解码器预训练框架中，以提高响应的相关性和多样性。我们利用语言模型和变分自编码器文献中的4个任务在大型对话语料库Reddit上对模型进行预训练：1) 遮盖语言模型；2) 响应生成；3）词袋预测；4）KL散度减少。我们还添加了额外的参数来建模对话中的轮次结构，以提高预训练模型的性能。我们在PersonaChat、DailyDialog 和 DSTC7-AVSD 基准上进行实验。结果表明，我们的模型在所有这些数据集上都达到了最新的水平。

Contextual Fine-to-Coarse Distillation for Coarse-grained Response Selection in Open-Domain Conversations

作者：陈伟，宫叶云，徐粲，胡煌，要博伦，魏忠钰，范智昊，胡晓武，周海涛，姜大昕，程骉，段楠

类别：Long Paper

摘要：我们研究了检索式对话系统中的粗粒度响应选择问题，它与细粒度响应选择同样重要，但在现有文献中的探索较少。本文提出一种基于上下文的细到粗蒸馏模型CFC，用于开放域对话中的粗粒度响应选择。在CFC 模型中，我们基于上下文匹配和多塔架构学习查询、候选上下文和响应的稠密表示，并将单塔架构（细粒度）中学习的知识蒸馏到多塔架构中（粗粒度）以增强检索器的性能。为了评估所提出模型的性能，我们基于 Reddit 评论和 Twitter 语料库构建了两个新数据集。在两个数据集上的大量实验结果表明，与传统的基线方法相比，所提出的方法在所有评估指标上都取得了巨大的进步。

Findings of ACL 2022

A Simple Hash-Based Early Exiting Approach For Language Understanding and Generation

作者：孙天祥，刘向阳，朱威，耿志超，吴玲玲，何义龙，倪渊，谢国彤，黄萱菁，邱锡鹏

类型：Long Paper

摘要：动态早退是一种提升模型推理效率的技术手段，它通过估计样本难度让不同样本在不同层退出推理过程。过去的工作通常采用某些启发式指标（例如熵）来衡量样本难度，因此需要调节阈值且找到的阈值难以在不同任务间泛化。作为对比，利用神经网络模块去估计样本难度进而学习何时退出的方法更加通用。但是，样本难度究竟能否被学习，以及能够学到什么程度仍旧是未知的。在本文中，我们对样本难度的可学性开展了实验，结果表明现代神经网络在预测样本难度任务上表现很差。基于这一观察，我们提出了一种简单有效的基于哈希的早退方法（HashEE），用简单的哈希函数替换learn-to-exit模块，直接为每个单词分配其退出层。相比过去的方法，HashEE不需要内部分类器或额外参数，因而更加高效。我们在分类、回归、生成任务上的实验结果都表明，HashEE可以用更少的FLOPs和推理时间取得更好的效果。

Towards Adversarially Robust Text Classifiers by Learning to Reweight Clean Examples

作者：徐健涵，张岑湲，郑骁庆，李林阳，Cho-Jui Hsieh，Kai-Wei Chang，黄萱菁

类别：Long Paper

摘要：在文本领域的对抗鲁棒性研究中，现阶段绝大部分的研究关注于对抗数据增强、优化模型结构等方面上，而在分配训练数据训练权重的研究则偏少。本文通过以重新分配原始训练样本权重的方式，尝试不在训练集中添加额外的对抗增强数据，来得到一个鲁棒的文本分类器，并将这种训练方法命名为WETAR。具体地，我们希望通过使用验证集梯度，来引导模型分配训练样本权重。我们采用了Learning to Reweight的框架，通过构建在验证集中加入对抗样本构建鲁棒验证集，并采取了类似元学习的训练方式来计算验证集样本在训练样本上的相对影响力。实验证明，WETAR不仅能够得到一个鲁棒的模型，在三个数据集上要优于之前的大部分对抗训练工作，而且让我们能够知道存在一种权重分配方式，能够使模型在原始样本下训练下得到很好的鲁棒性提升。该工作在复旦大学郑骁庆老师团队与加州大学洛杉矶分校的Cho-Jui Hsieh和Kai-Wei Chang老师指导下完成。

Improving the Adversarial Robustness of NLP Models by Information Bottleneck

作者：张岑湲，周翔，万奕欣，郑骁庆，Kai-Wei Chang，Cho-Jui Hsieh

类别：Long Paper

摘要：现有研究显示，对抗样本的成因与非鲁棒特征有直接联系。非鲁棒特征能够对模型最终的预测结果产生影响，但人类对这种特征并不敏感。因此，非鲁棒特征容易被人为操控，以用来欺骗语言模型、进行对抗攻击。

在本研究中，我们利用了信息瓶颈（information bottleneck）理论，尝试探索在保留任务相关的鲁棒特征的前提下，尽可能的过滤掉非鲁棒特征。我们在SST-2, AGNEWS 和 IMDB三个数据集上进行了实验，实验结果证明: 相较于现有的防御方法，基于information bottleneck的方法能够在保证模型在干净样本上性能的基础上，令模型的鲁棒性得到显著提升。

Divide and Conquer: Text Semantic Matching with Disentangled Keywords and Intents

作者：邹易澄，刘宏伟，桂韬，王浚哲，张奇，唐萌，李海翔，Daniel Wang

类别：Long Paper

摘要：文本语义匹配是一项被广泛应用于社区问答、信息检索、推荐系统等多种场景的基础任务。大多数基于预训练语言模型（PLM）的文本匹配方法（如 BERT等）通过统一处理句子中不同的单词来直接进行文本内容的比较。然而，待匹配的句子通常包含不同匹配粒度的内容。我们一般将其分为两类：（1）“关键词”（keyword），即应当严格匹配的动作、实体和事件等事实信息；（2）“意图”（intent），即可以通过多种表述方式传达的抽象概念。在这项工作中，我们提出了一种简单有效的文本匹配训练策略DC-Match，将关键词与意图分离，并使用分而治之的策略进行匹配。我们假设两个句子是匹配的，当且仅当它们的关键词和意图均匹配。DC-Match可以方便地与PLM相结合，而不影响其推理的效率。我们在三个数据集上进行了实验，结果表明我们的方法在多种 PLM 上均能得到稳定的性能提升。

Logic-Driven Context Extension and Data Augmentation for Logical Reasoning of Text

作者：王思远，钟宛君，唐都钰，魏忠钰，范智昊，姜大昕，周明，段楠

类别：Long Paper

摘要：基于文本的逻辑推理需要识别文本中的逻辑结构并执行逻辑推断，目前的方法主要关注于文本的上下文语义而难以对逻辑推断过程进行明确建模。本文我们提出了一个LReasoner系统，由两个部分组成：逻辑驱动的文本扩充框架和逻辑驱动的样本增强算法。前者通过提取逻辑表达式作为基本推理单元，根据逻辑等价律推断隐式存在的表达式，并扩充给定文本以匹配答案。后者构造字面上相似但逻辑上不同的样本，通过对比学习使得模型更好地捕捉文本中的逻辑信息，尤其是逻辑上的否定和条件关系。我们在数据集ReClor和LogiQA上进行了实验，结果表明了我们提出的推理系统的有效性，甚至在ReClor数据上超过了人类性能。

下载一：中文版！学习TensorFlow、PyTorch、机器学习、深度学习和数据结构五件套！  后台回复【五件套】
下载二：南大模式识别PPT  后台回复【南大模式识别】

投稿或交流学习，备注：昵称-学校（公司）-方向，进入DL&NLP交流群。

方向有很多：机器学习、深度学习，python，情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

整理不易，还望给个在看！

Python_算术运算符 Ww_Sid python python 算术运算符
两个数字相加sumNumber=1+2print(sumNumber)>>>3两个字符串相加sumString="Nicework"print(sumString)>>>Nicework两个数字相减subNumber=2-1print(subNumber)>>>1两个数字相乘或者multiplicationNumber=2*3print(multiplicationNumber)>>>6字符串重复
代码精进：工作中学到的12个代码风格程序员
在工作中，我们编写代码时尽可能地使其易于阅读。这意味着以下几点：变量名有意义且更长（而不是a,b和c）函数名有意义且更长许多注释和文档解释代码到处都是类型提示字符串似乎更长、更啰嗦等等以下是我在过去几年的工作中学到的一些生产级别的Python代码风格。1)使用括号的元组解包这是一些正常的元组解包：a,b=(1,2)在生产级别的代码中，我们通常不使用像a或b这样的变量名——相反，我们的变量名会变得更
python错误：No module named 'sklearn.cross_validation' 小炸鸡钟熊 python
调用fromsklearn.cross_validationimporttrain_test_split时，发现错误：Nomodulenamed'sklearn.cross_validation’更改为sklearn.model_selection即可fromsklearn.model_selectionimporttrain_test_split
leetcode 485 python weixin_36908057 leetcode
Givenabinaryarray,findthemaximumnumberofconsecutive1sinthisarray.Example1:Input:[1,1,0,1,1,1]Output:3Explanation:Thefirsttwodigitsorthelastthreedigitsareconsecutive1s.Themaximumnumberofconsecutive1sis
python连接485网关设备 dilqu python 网络开发语言
Python相关视频讲解：python的or运算赋值用法用python编程Excel有没有用处？011_编程到底好玩在哪？查看python文件_输出py文件_cat_运行python文件_shel如何实现Python连接485网关设备1.流程图gantttitlePython连接485网关设备流程图section了解485网关设备:1dsection安装Python库:1dsection编写Pyt
Azure Synapse Dedicated SQL Pool通过配置选项和参数优化性能 weixin_30777913 云计算 azure
配置选项与参数分布键（DistributionKey）：•选择：在大数据量表中，选择经常用于JOIN、WHERE条件中的列作为分布键，如Date、ID等。•策略：对于范围查询，使用HASH分布避免数据倾斜；对于维度表，通常选择ROUND-ROBIN分布。索引：•类型：聚集列存储索引（CCI）针对大型数据扫描和聚合进行了优化。•策略：始终对大型事实表使用CCI，避免在大型表上使用传统的行存储索引。分
Python学习day14 BBS功能和聊天室 weixin_30725467 json 数据库前端 ViewUI
Createdon2017年5月15日@author:louts第1课作业讲解及装饰器使用28minutesdefcheck(func):defrec(request,*args,**kargs):returnfunc(request,*args,**kargs)returnrec@checkdefindex(request,):printrequest第2课自定义装饰器扩展使用18minutes
华为OD机试C卷-- 跳格子3（Java & JS & Python & C）飞码创造者华为OD机试题库华为od c语言 java javascript python
获取题库不需要订阅专栏，可直接私信我进入CSDN领军人物top1博主的华为OD交流圈观看完整题库、最新面试实况、考试报告等内容以及大佬一对一答疑。题目描述小明和朋友们一起玩跳格子游戏，每个格子上有特定的分数score=[1,-1,-6,7,-17,7]，从起点score[0]开始，每次最大的步长为k，请你返回小明跳到终点score[n-1]时，能得到的最大得分。输入描述第一行输入总的格子数量n第二
如何使用Visual Studio Code调试PHP CLI应用和Web应用
Python中的class体内定义方法时，如果没有显式地包含self参数，有时候依然可以被调用。这是一个非常有趣的话题，因为它涉及到对Python中类与对象之间关系的更深理解。要理解为什么这种情况下方法依然能够被调用，我们需要逐步拆解Python类的构造方式以及方法绑定的原理。
理解 Python 的 Dataclasses Cater Chen python
理解Python的Dataclasseshttps://zhuanlan.zhihu.com/p/59657729
Python中dataclass库 SteveKenny #Python第三方库 python 开发语言哈希算法
文章目录dataclass语法一、简介二、装饰器参数三、数据属性1、参数2、使用示例3、注意事项四、其他1、常用函数2、继承3、总结dataclass语法一、简介官方文档的地址为：https://docs.python.org/3.9/library/dataclasses.htmldataclass的定义位于PEP-557，根据定义一个dataclass是指“一个带有默认值的可变的namedtu
提升数据科学工作流效率的10个Jupyter Notebook高级特性
JupyterNotebooks已成为数据科学家、机器学习工程师和Python开发人员的核心开发工具。其核心优势在于提供了一个集成式环境，支持代码执行、文本编辑和数据可视化的无缝整合。尽管大多数用户熟悉其基本功能，但许多能显著提升工作效率的高级特性往往被忽视。本文将介绍一些高级功能，帮助您在数据科学项目中充分发挥JupyterNotebooks的潜力。1、Magic命令：高效的命令行接口Jupyt
【视觉算法—视频目标跟踪】基于camshift实现视频目标实时追踪明月下视觉算法 opencv python 音视频
本文代码功能：1.获取摄像头，实时显示2.鼠标获取第一帧中的目标roi区域3.在视频中实时对目标进行追踪。4.两种目标追踪的方式：‘meanshift’，‘camshift’5.保存视频代码准备新建test.py，复制以下代码：importcv2ascvimportnumpyasnpglobalmin_y,height,min_x,width#1代表打开外置摄像头,外置多个摄像头可依此枚举0，1，
Python 数据建模完整流程指南木觞清 3天入门Python python 开发语言
在数据科学和机器学习中，建模是一个至关重要的过程。通过有效的数据建模，我们能够从原始数据中提取有用的洞察，并为预测或分类任务提供支持。在本篇博客中，我们将通过Python展示数据建模的完整流程，包括数据准备、建模、评估和优化等步骤。1.导入必要的库在进行任何数据分析或建模之前，首先需要导入必需的Python库。这些库提供了各种工具和算法，帮助我们更高效地完成任务。importnumpyasnpim
python安装包提示Requirement already satisfied 可爱的的编辑人员配置 python numpy 开发语言
python安装cnocr提示Requirementalreadysatisfied错误信息如下：Requirementalreadysatisfied:pyreadline3inc:\python310\lib\site-packages(fromhumanfriendly>=9.1->coloredlogs->onnxruntime->cnocr)(3.4.1)Installingcollec
整理一下一些Qt/C++第三方库 MayZork qt 开发语言 c++
boost一个广泛的C++库集合，提供了大量的功能模块，包括但不限于数据结构、算法、并发编程、网络编程、文件系统、正则表达式、序列化等。poco也是一个广泛的C++库集合，提供了一套丰富的功能模块，包含网络通信、HTTP、文件系统、XML、JSON、数据库等。libevent轻量级的C语言库，主要用于异步网络编程。它提供了对I/O复用的支持，使得开发者可以在单线程中同时处理多个连接。QCustom
Python3 打包成.exe（附IndexError: tuple index out of range错误解决） zdxdxd python python
1.首先下载PyInstaller官网地址入口已经安装了pip，直接在命令行输入：pipinstallpyinstaller2.进行打包进入需要被打包目录，输入：pyinstaller-Fyourprogram.py//-F打包成一个.exe文件另外，可以在官方的说明里看到pyinstaller目前并不支持python3.6，如下图：所以，在打包python3.6的程序时，会出现“:IndexEr
Python爬虫爬取1万首音乐代码 EasySoft易软 python
importrequestsbase_url=“http://music.163.com/song/media/outer/url?id=”start_id=200000end_id=210000formusic_idinrange(start_id,end_id+1):song_url=base_url+str(music_id)response=requests.get(song_url,st
随机森林分类算法原理与实验分析 ningaiiii 机器学习与深度学习随机森林分类算法
随机森林分类算法原理与实验分析1.引言随机森林（RandomForest）是一种集成学习方法，它通过构建多个决策树并结合它们的预测结果来进行分类。你可以把它想象成一个“团队决策”的过程：团队中的每个成员（决策树）都独立发表意见，最后通过投票决定最终结果。这种方法不仅提高了模型的准确性，还增强了模型的稳定性和鲁棒性。随机森林的主要特点是通过随机选择样本和特征来构建多个决策树，从而避免单棵决策树可能产
快速傅里叶变换华东算法王（原聪明的小孩子小孩哥总结MIT线性代数线性代数矩阵
快速傅里叶变换（FFT）快速傅里叶变换（FFT）是一种高效的算法，用于计算离散傅里叶变换（DFT）和其逆变换。傅里叶变换是一种重要的数学工具，广泛应用于信号处理、图像分析、数据压缩、声音合成等领域。传统的离散傅里叶变换算法的计算复杂度较高，而快速傅里叶变换通过减少计算量，大大提高了运算速度。1.离散傅里叶变换（DFT）离散傅里叶变换（DFT）将离散的时间信号变换到频域。对于一个长度为(N)的离散序
利用python向modbus RTU设备（RS485串口通信）发送16进制指令无名小白12138 python 开发语言
importserialimporttime#配置串口通信参数serial_port='COM1'baudrate=9600#创建串口连接ser=serial.Serial(port=serial_port,baudrate=baudrate)#检查串口是否已打开ifser.is_open:try:hex_data=bytes.fromhex('01100010000102000564C3')se
Python的简介-课前甜点 cheese-liang Python实用小技巧 python 开发语言
Python的简介-课前甜点1.`Python`需求的任务2.Python代码的实现3.代码修改的位置4.运行结果5.注意事项6.其他文章链接快来试试吧Python的简介点击这里也可以查看1.Python需求的任务如果您的工作主要是用电脑完成的，总有一天您会想能不能自动执行一些任务。比如，对大量文本文件执行查找、替换操作；利用复杂的规则重命名、重排序一堆照片文件；也可能您想编写一个小型数据库、或开
动态规划算法----回文串问题阿_北算法动态规划 c++
引言在算法的世界里，回文串问题一直是一个经典且富有挑战性的题目。而动态规划作为一种强大的算法思想，为解决这类问题提供了高效且优雅的解决方案。本文将深入探讨如何运用动态规划算法来解决回文串相关问题，从问题描述、动态规划思路，到代码实现与复杂度分析，全面剖析这一过程。回文串问题描述回文串是指一个字符串从左到右读和从右到左读是完全一样的，例如“level”、“madam”等。常见的回文串问题有：给定一个
【第十章——数据可视化之地图构建】【最新！黑马程序员Python自学课程笔记】课上笔记+案例源码+作业源码嗯哈！信息可视化 python 笔记 pycharm
第十章-数据可视化之地图构建10.1数据可视化-地图-基础地图使用注意！！！现在的版本，需要加：省，市"""演示地图可视化的基本使用"""frompyecharts.chartsimportMapfrompyecharts.optionsimportVisualMapOpts#准备地图对象map=Map()#准备数据data=[("北京市",9),("上海市",8),("湖南省",5),("台湾省
【LLM】大语言模型（LLMs）林九生人工智能语言模型人工智能自然语言处理
大型语言模型（LLMs）1.什么是大型语言模型？大型语言模型（LargeLanguageModel，LLM）是基于深度学习的自然语言处理模型，能够理解和生成自然语言文本。它们通过在大规模文本数据上进行训练，学习语言的语法、语义和各种语言特征，从而可以执行诸如文本生成、翻译、总结、问答等多种语言任务。以下是大型语言模型的定义和基本原理：1.1定义大型语言模型是由大量参数组成的神经网络，这些参数通过在
Python phonenumbers 库详解：号码解析与验证的利器萧鼎 python基础到进阶教程 python
Pythonphonenumbers库详解：手机号解析与验证的利器在开发涉及电话号码的应用时，尤其是全球化的应用，处理电话号码是一个常见的需求。不同国家的电话格式各异，如何有效地验证、格式化、解析这些号码呢？phonenumbers库就是一个专为此目的设计的Python库，可以帮助我们轻松处理电话号码的验证和格式化。1.phonenumbers是什么？phonenumbers是一个Python库，
【Python】python dataclass使用指南菜菜2022 Python学习笔记 Python dataclass 字段继承数据结构
https://www.cnblogs.com/apocelipes/p/10284346.html定义一个dataclass深入dataclass装饰器数据类的基石——dataclasses.field一些常用函数dataclass继承参考https://docs.python.org/3.7/library/dataclasses.htmlhttps://www.python.org/dev/
全新 Hopper 架构的Transformer 引擎有什么特点？扫地的小何尚人工智能
Transformer引擎是全新Hopper架构的一部分，将显著提升AI性能和功能，并助力在几天或几小时内训练大型模型。Transformer模型是当今广泛使用的语言模型（例如asBERT和GPT-3）的支柱。Transformer模型最初针对自然语言处理用例而开发，但因其通用性，现在逐步应用于计算机视觉、药物研发等领域。与此同时，模型大小不断呈指数级增长，现在已达到数万亿个参数。由于计算量巨大，
大语言模型（LLMs）入门教程（非常详细）从零基础入门到精通，看完这一篇就够了大模型零基础教程语言模型人工智能自然语言处理大模型
大语言模型（LLMs）作为人工智能（AI）领域的一项突破性发展，已经改变了自然语言处理（NLP）和机器学习（ML）应用的面貌。这些模型，包括OpenAI的GPT-4o和Google的gemini系列等，已经展现出了在理解和生成类人文本方面的令人印象深刻的能力，使它们成为各行各业的宝贵工具。如下这份指南将涵盖LLMs的基础知识、训练过程、用例和未来趋势……一.WhatareLargeLanguage
数据类库 Dataclasses 深入指南陆或愉
数据类库Dataclasses深入指南dataclassDataclassesforTypeScript&JavaScript项目地址:https://gitcode.com/gh_mirrors/da/dataclass项目介绍数据类库（Dataclasses）是Python标准库中的一个模块，自Python3.7起被引入。它通过装饰器@dataclass简化了自定义类的创建过程，自动添加了属性
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在

ACL'22 | 一文解读复旦黄萱菁、邱锡鹏等老师NLP实验室的12篇长文

你可能感兴趣的:(大数据,自然语言处理,算法,python,计算机视觉)