小园秋子

Unsupervised Question Answering by Cloze Translation 通过完形填空翻译的无监督的问答

文章目录

Unsupervised Question Answering by Cloze Translation 通过完形填空翻译的无监督的问答
0、Abstract
- 0.1、背景
- 0.2、Paper做的
- - c-1）为了产生上面的三元组：
- 0.3、其它
1、Introduction
- 1.1 现有背景
- 1.2 作者方法
- 1.3 cloze to natural
- 1.4 少样本学习
- 1.5 To Summarize 总结
2、Unsupervised Extractive QA 无监督EQA
- 2.1、Context and Answer Generation 上下文和答案生成
- 2.2、Question Generation 问题生成
- 2.3、Question Answering 问题回答
- 2.4、Unsupervised Cloze Translation 无监督完形填空翻译
3、Experiments 实验
- 3.1、Unsupervised QA Experiments 无监督QA实验
- 3.2、Ablation Studies and Analysis消融实验和分析
- 3.3、Error Analysis 错误分析
- 3.4、UNMT-generated Question Analysis UNMT生成问题分析
- 3.5、Few-Shot Question Answering 少样本问题回答
4、Related Work相关工作
5、Discussion 讨论
6、Conclusion 结论

作者是三个Facebook的AI研究员

0、Abstract

0.1、背景

获取QA的训练数据是一个耗时、耗资源的问题，现有的QA数据集仅仅只是某个特定领域或语言的。

0.2、Paper做的

a）对于EQA需要多大程度质量的训练数据
b）调查无监督EQA的可能性
c）通过无监督的方法产生context、question、answer三元组去自动合成EQA的训练数据，用于解决背景提出的问题

c-1）为了产生上面的三元组：

1、从一个大的语料库中随机抽取context paragraph 样本
2、从上面的样本中，随机抽取noun phrase OR named entity 作为答案
3、将上述抽取的答案转化为“fill-in-the-blank”在context中，既完形填空
4、最终将上面的完形填空翻译为自然语言问题

0.3、其它

文章提出并对比了几种无监督方法用于完形填空问题翻译为自然语言问题，包括使用nonaligned语料库中的自然语言问题和完形填空问题以及基于rule-base的方法训练一个无监督的NMT(Neural Machine Translation)模型。结果发现使用合成的训练数据集训练的modern QA模型能够很好的学会回答人类问题。还证实了不使用SQuAD的数据集的情况下，我们的方法(指的是使用合成的训练数据集)在SQuAD v1上可以实现56.4F1，当答案是Named entity时可以实现64.5F1，远超早期的监督模型。

1、Introduction

1.1 现有背景

a）EQA表示给定一个context document assumption情况下，答案在document里面，然后进行回答。
b）现有的EQA数据集SQuAD、SQuAD 2.0 都已经被模型给刷爆了，超过了人类的表现。
c）Natural Question也已经被模型给达到了人类的表现。

1.2 作者方法

生成EQA训练数据集，图一为示意图
1）在目标域中抽取一个段落，例如英语的维基百科
2）在上面抽取的段落中抽取一个candidate answer集，使用pretrained component(NER(Named Entity Recognition) or noun chunkers)去识别这些candidate answer。这些需要监督(?)，但是不需要 aligned(question, answer) or (question, context) data。提供一个candidate answer 和 context我们可以提取出 “fill-the-blank”完形填空。
3）最后，我们使用无监督的完形填空-自然语言问题翻译器将完形填空问题转换为自然语言问题(最大的挑战)

1.3 cloze to natural

利用最近在无监督机器翻译的方法(Lample et al., 2018, 2017; Lample and Conneau, 2019; Artetxe et al., 2018).文章收集了大量的自然问题的语料库以及unaligned的完形填空语料库并且结合online back-translation 和 de-noising auto-encoding去训练seq2seq模型去映射natural和cloze问题领域。无监督seq2seq模型超过基于noise和rule-based。

1.4 少样本学习

1.2中作者的方法也能用于few-shot learning，例如使用32个标签数据可以获得59.3 F1超过不使用我们的方法40.0 F1(?)

1.5 To Summarize 总结

a）实现无监督QA的第一种方法就是使用无监督的机器翻译将问题减为无监督的完形填空翻译
b）大量的实验测试各种完形填空问题翻译算法和假设的效果
c）实验证明我们的方法可以用于EQA的few-shot learning(-本文用于合成数据集的模型和产生的数据集在：
https://github.com/facebookresearch/UnsupervisedQA)

2、Unsupervised Extractive QA 无监督EQA

图1：关于本文方法的示意图，右边虚线箭头代表传统EQA，我们介绍无监督的数据产生(左边，实心箭头)用于训练标准的EQA模型

在EQA里面给予一个问题 q 和一个context paragraph c 以及需要提供的答案 a = (b, e)，b为c中的字符索引开始，e为结束。图1为该任务的示意图。
分2阶段解决无监督QA。(看不懂，那些生成器为什么要写成p(xx)的）
使用无监督开发一个生成模型 p(q, a, c)，然后使用 p 作为数据生成器训练一个判别模型 pr(a |q, c)。这个生成器 p(q, a, c) = p© * p(a|c) * p(q|a, c)将生成数据在一个“相反的方向”，首先通过p©进行context抽样，然后获取答案通过p(a|c)，最后获取问题通过p(q|a, c)。

2.1、Context and Answer Generation 上下文和答案生成

对任何文档平均抽取合适长度的段落c，加入先验经验通过p(a|c)生成好的答案spans，分为Noun Phrase 和 Named Entities 的p(a|c)。若答案只为Named Entity虽然减少了问题类型，但是实际很有效

2.2、Question Generation 问题生成

分两步生成完形填空q’ = cloze(a, c)以及翻译p(q|q’)，通过选择答案周围的子句以提高问题的准确性同时减少完形填空的长度，现有4种方法将cloze翻译为natural。
1）Identity Mapping
采用启发式的wh单词替换mask token
2）Noisy Clozes
删除完形填空 q’ 的mask token，在q’前面加个wh，在句尾加个？，采用 Lample et al. (2018) 的noise function
3）Rule-Based
将嵌入在句子中的答案变成 (q, a) 对可以理解为具有 wh-movement 和 wh-word 的类型依赖选择的句法转换，使用 Heilman and Smith (2010)完成
4）Seq2Seq
3）需要大量的工程和先验知识，1）2）产生的问题距离真正的自然问题远远不够，本文采用无监督seq2seq模型来完成完形填空到自然语言问题

2.3、Question Answering 问题回答

2种方法
1）训练一个单独的QA系统，对于任何QA结构，都采用我们生成的数据训练
2）Using Posterior 计算最高的posterior p(a|c, q)，即计算产生这个问题可能性最大的answer使用 Lewis and Fan (2019).

2.4、Unsupervised Cloze Translation 无监督完形填空翻译

采用nonparallel corpora 的源和目标语言句子，学习一个函数用于自然语言问题和完形填空问题的映射，这将需要大量的完形填空语料库和自然语言语料库
完形填空语料库：抛弃单词长度超过40的，如果答案是noun phrase就用“MASK”代替，如果答案是Named Entity，参考如下表格5，依据Named Entity的类型来进行替代，并且给问题标注上类型。5M个从维基百科。

问题语料库：从common crawl获取问题，选择开头为(“how much”，“how many”, “what”,“when”, “where” and “who”) ，以？结尾的，拒绝重复？或结尾为？！或长度大于20的。5M个。

根据Lample et al. (2018)训练cloze-to-natural模型，同样也有使用语言预训练模型同 Lample and Conneau (2019).类似。虽然使用pretraining会产生更多的好格式问题，但是对于QA的性能却并没有很大的提升，未来工作。采用无监督NMT进行cloze-to-natural。无监督NMT训练步骤如下：
使用Moses (Koehn et al., 2007),and use FastBPE (https://github.com/glample/fastBPE)进行单词和subword分割，结构上采用4层transformer进行编码和4层transformer进行解码，有一层是特定语言专用，其余共享。采用Lample el al.(2018)进行标准超参数设置，输入单词矩阵向量话使用FastText
Wh* 启发式，应用于输入的cloze问题，在训练时将答案类型映射为合适的wh*，在前面加上类型，然后进行合适的wh* 映射，规则见表格5，在训练前添加前置wh*在问题最前面，然后再添加答案类型在问题前面。如“PLACE Where is Mount Vesuvius ?”

3、Experiments 实验

1、探究不使用align的q，a数据，那么QA系统的表现性能会怎样
2、这样做对比监督学习以及其它不需要训练数据的方法（？？？）
3、探究解释关于不同的设计决策对我们的QA系统的性能影响
4、当只有少量可用样本时方法的可行性分析
5、评估无监督NMT对于问题生成是否有效

3.1、Unsupervised QA Experiments 无监督QA实验

采用微调BERT (Devlinet al., 2018) and BiDAF + Self Attention (Clark and Gardner, 2017) 使用合成的数据集进行训练，使用NMT模型进行问题评估，使用EM和F1进行标准评定。采用SQuAD开发数据集进行模型组件评估。
本文是第一个特意使用无监督QA在SQuAD数据集上的。同许多模型进行对比，实验结果见表一

表格1 本文最好的无监督模型对比各种baseline和监督模型，*代表结果是评估在SQuAD dev set，†表示结果是在一个不标准的测试集通过Dhingra el al.(2018)创建，‡表示我本文重新实现的。

3.2、Ablation Studies and Analysis消融实验和分析

所有的消融实验分析采用SQuAD development set。使用BERT-Base和BiDAF+SA进行消融，使用最佳的设置来进行微调BERT-Large模型，所有使用BERT-Base的实验都进行3 seeds进行重复，防止不稳定性。记录平均结果如表2

1）训练QA模型比Posterior Maximisation要好
2）答案类型是Named Entity比noun phrase要好
3）使用子句产生更短的问题，这样产生的问题分布更接近SQuAD问题分布，训练效果更好，能实现更高的F1。见图2不同问题生成器，生成问题的长度和最大相同子序列长度同SQuAD的对比图。

4）Noisy方法和UNMT翻译有助于提高训练模型的F1，其中noisy cloze能提高更多。
5）BERT-Base比BiDAF+SA要好，BERT-Large又比BERT-Base要好，对QA提升最多
6）NMT比Rule-based要好

3.3、Error Analysis 错误分析

对于答案是Named Entity的SQuAD其F1能达到64.5，如果不是则只有47.9 F1，这得益于BERT的语言预训练归纳了NE在句子中的语义作业，而不是简单的模仿NER系统。图三展示了我们系统对于不同类型问题的表现。“when”问题表现最好，因为这种问题潜在的可能的答案最少“what”问题答案有很广的潜在答案所以表现最差，“TEMPORAL”同“when”一样。

3.4、UNMT-generated Question Analysis UNMT生成问题分析

完形填空和产生的问题字长是不对称的，翻译必须保存答案，而不是简单的风格转换。在不使用heuristic的情况下，UNMT将变得困难，如图4，特别是对于Person/Org/Norp和Numeric答案。

图4展示了对于NE答案无监督的UNMT产生的样例。

UNMT的输出很多都是复制的输入，产生的问题平均有context中9.1个连续的token长的子句，相较于4.7tokens的SQuAD，UNMT是保守的翻译。但是UNMT产生的问题里面也有单词的语义替换，比如“sold”换成“buy”，也有人称的替换，但是语义转义也是个问题。
使用BERT-Base采用的Faruquiand and Das(2018)里面的数据训练
一个classifier用于问题质量评估，评估产生问题的质量，如下表格6。
可以发现UNMT可以产生68%的好格式问题，rule-based 可以产生75.6%的，同时SQuAD里面有92.3%的好问题，发现使用预训练模型的UNMT可以产生78.5%的好格式问题。

3.5、Few-Shot Question Answering 少样本问题回答

使用Section 3里面最好配置的BERT-large QA模型进行预训练(?)，同时使用少量SQuAD训练数据进行调优，使用和Dhingra的BETR-Large模型进行对比，进行模型训练提早停止。如图5，我们的少样本问题回答是有用的，且同其它两种对比，我们的效果最好。

4、Related Work相关工作

Unsupervised Learning in NLP
Semi-supervised QA
Question Generation

5、Discussion 讨论

达到我们方法的最好表现需要1）NER系统2）用constituency parser 进行子句提取(trained on the Penn Treebank) 3）wh*的heuristic，这限制了我们的方法。但是我们的方法是无监督的不需要（question， answer）或（question，context）对，这对于大规模的QA训练数据来说是一个巨大的挑战。
我们还注意到“noisy cloze”系统虽然简单且缺乏问题的相关语法和句法，但是产生的效果却和我们最复杂的系统一样。同时它产生的问题格式也很差。但是这个有趣的结果表明自然问题可能对于SQuAD来说没有那么重要，然而强大的问题上下文单词匹配就足够了。

6、Conclusion 结论

对于EQA，不使用带标签的数据是可行的，且对于SQuAD达到56.4 F1，对于答案只是Named Entity达到64.5 F1，超过了很多简单的监督系统。但是虽然本文结果在相对简单的QA task上表现的鼓舞人心，但是进一步的工作需要去处理更具有挑战性的QA元素和减少对于语言资源和启发式的依赖

大模型Agent 和 RAG 的关系大数据追光猿大模型语言模型人工智能学习方法 transformer
Agent和RAG（Retrieval-AugmentedGeneration）是两种在自然语言处理（NLP）和人工智能领域中广泛使用的技术，它们在功能、目标和实现方式上既有区别又有联系。以下是它们的关系及其协同作用的详细分析。1.Agent和RAG的定义（1）Agent定义：Agent是一种智能体，能够感知环境并采取行动以完成特定任务。在NLP领域，Agent通常指一个基于大语言模型（LLM）的
AI模型技术演进与行业应用图谱智能计算研究中心其他
内容概要当前AI模型技术正经历从基础架构到行业落地的系统性革新。主流深度学习框架如TensorFlow和PyTorch持续优化动态计算图与分布式训练能力，而MXNet凭借高效的异构计算支持在边缘场景崭露头角。与此同时，模型压缩技术通过量化和知识蒸馏将参数量降低60%-80%，联邦学习则通过加密梯度交换实现多机构数据协同训练。在应用层面，医疗诊断模型通过迁移学习在CT影像分类任务中达到98.2%的准
重要重要！！fisher矩阵是怎么计算和更新的，以及计算过程中参数的物理含义 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力矩阵概率论线性代数 windows 微信机器学习
fisher矩阵是怎么计算和更新的，以及计算过程中参数的物理含义Fisher信息矩阵（FisherInformationMatrix,FIM）用于衡量模型参数估计的不确定性，其计算和更新在统计学、机器学习和优化中具有重要作用。以下是其计算和更新的关键步骤：一、Fisher矩阵的计算定义Fisher矩阵的元素表示对数似然函数关于参数的二阶导数的期望值的负数，即：Fi,j=−
AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
端到端的NLP框架（Haystack） deepdata_cn NLP 自然语言处理人工智能
Haystack是一个端到端的NLP框架，专门用于构建基于文档的问答系统，是实现RAG的理想选择。它提供了数据预处理、文档存储、检索和生成等一系列组件，支持多种语言模型和检索器。提供可视化界面，方便用户进行配置和调试；支持多模态数据，可处理文本、图像等多种类型的数据；具有可扩展性，可根据需求添加自定义组件。2020年在自然语言处理技术快速发展，对高效、易用且灵活的端到端NLP框架需求日益增长的背景
客服机器人怎么才能精准的回答用户问题？玩人工智能的辣条哥 AI面试机器人客服机器人
环境：客服机器人问题描述：客服机器人怎么才能精准的回答用户问题？解决方案：客服机器人要精准回答用户问题，需综合技术、数据和用户体验等多方面因素。以下是关键策略和步骤：1.精准理解用户意图自然语言处理（NLP）技术分词与实体识别：提取关键词（如“订单号”“退货”）和实体（如时间、地点）。意图分类：通过机器学习模型（如BERT、Transformer）将问题归类（如“售后”“支付”）。上下文理解记录对
深度学习篇---对角矩阵&矩阵的秩&奇异矩阵 Ronin-Lotus 程序代码篇深度学习篇深度学习矩阵人工智能线性代数
文章目录前言一、对角矩阵（DiagonalMatrix）1.1定义1.2特性行列式运算简化1.3应用领域深度学习信号处理量子力学经济学二、矩阵的秩（RankofaMatrix）2.1定义2.2特性满秩降秩影响2.3应用领域深度学习图像压缩推荐系统控制理论三、奇异矩阵（SingularMatrix）3.1定义3.2特性秩不足行列式为零3.3应用领域深度学习正则化损失函数结构工程统计学数值计算四、跨领
DeepSeek、Grok 与 ChatGPT 三巨头：技术架构与应用场景的全方位解析云策量化 Deepseek chatgpt deepseek grok
前言在当今人工智能领域，DeepSeek、Grok和ChatGPT作为语言模型的三巨头，各自凭借独特的技术架构和广泛的应用场景，在自然语言处理领域占据着重要地位。本文将对这三款模型的技术架构和应用场景进行全方位解析，以期为读者提供深入的了解和有价值的参考。一、技术架构（一）DeepSeekDeepSeek是由DeepSeek团队开发的一款大型语言模型，其技术架构基于深度学习中的Transforme
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
OpenCV ML 模块使用指南 ice_junjun OpenCV opencv 人工智能计算机视觉
一、模块概述OpenCV的ML模块提供了丰富的机器学习算法，可用于解决各种计算机视觉和数据分析问题。本指南将详细介绍该模块中主要的机器学习算法，包括支持向量机（SVM）、K均值聚类（K-Means）和神经网络（ANN），并结合图像分类和聚类分析这两个典型应用场景进行代码实现与解释。二、主要函数及类详解（一）支持向量机（SVM）：cv.ml.SVM_create()功能支持向量机（SVM）是一种强大
强化学习中策略网络模型设计与优化技巧数字扫地僧计算机视觉深度学习
I.引言强化学习（ReinforcementLearning,RL）是一种通过与环境交互，学习如何采取行动以最大化累积奖励的机器学习方法。策略网络（PolicyNetwork）是强化学习中一种重要的模型，它直接输出动作的概率分布或具体的动作。本篇博客将深入探讨策略网络的设计原则、优化技巧，并结合具体实例展示其应用。II.策略网络的基本概念A.策略网络的定义策略网络是一种神经网络，它接受当前状态作为
介于YOLOv5的裂缝识别系统程序员～小强 YOLO
介于YOLOv5的裂缝识别系统在现代工业中，裂缝监测是的保障设施安全的重要环节。我们公司的新项目——基于YOLOv5的裂缝识别系统，将为您提供高效、精准的解决方案，助力各类工程项目的质量管理。系统优势我们的裂缝识别系统借助YOLOv5进行深度学习，经过精心训练，拥有强大的图像识别能力。只需简单的步骤，您就能将复杂的裂缝检测转化为轻松的操作，让分析变得更加简单、高效。核心功能图片上传与场景选择用户可
自然语言处理（5）—— 中文分词隐私无忧人工智能 #自然语言处理自然语言处理中文分词人工智能
中文分词的基本原理及实现1.什么是词2.基本原理3.发展趋势：多数场景无需显式分词信息处理的目标是使用计算机能够理解和产生自然语言。而自然语言理解和产生的前提是对语言能够做出全面的解析。汉语词汇是语言中能够独立运用的最小的语言单位，是语言中的原子结构。由于中文缺乏类似英文的空格分隔，分词的准确性直接影响后续任务（如机器翻译、情感分析）的效果。因此，对中文进行分词就显得至关重要。中文分词（Chine
基于Python编程语言实现“机器学习”，用于车牌识别项目我的sun&shine Python python 机器学习计算机视觉
基于Python的验证码识别研究与实现1.摘要验证码的主要目的是区分人类和计算机，用来防止自动化脚本程序对网站的一些恶意行为，目前绝大部分网站都利用验证码来阻止恶意脚本程序的入侵。验证码的自动识别对于减少自动登录时长，识别难以识别的验证码图片有着重要的作用。对验证码图像进行灰度化、二值化、去离散噪声、字符分割、归一化、特征提取、训练和字符识别等过程可以实现验证码自动识别。首先将原图片进行灰度化处理
如何使用JSON输出解析器解析语言模型的输出 vaidfl json 语言模型 easyui python
在现代AI应用中，让语言模型返回结构化的数据是一个重要的能力，特别是在需要进一步处理或集成的时候。本文将深入探讨如何利用JsonOutputParser来解析语言模型的JSON输出。技术背景介绍随着语言模型的普及，许多应用场景需要从自然语言处理任务中获取结构化的输出。针对这一需求，输出解析器应运而生，它能够帮助我们定义JSON模式，通过提示语言模型生成符合该模式的输出，并将其解析为JSON格式。核
使用LocalAI进行文本嵌入的实战指南 bavDHAUO python
技术背景介绍文本嵌入是一种将文本片段转换为高维向量的技术，可以用于自然语言处理任务中的相似性计算、信息检索等应用。LocalAI提供了一种本地化的嵌入解决方案，允许开发者在本地环境中运行和测试嵌入模型。通过在本地部署LocalAI服务，您可以避免依赖外部API，享受更快的响应速度和更好的数据隐私。核心原理解析LocalAIEmbedding类主要负责与本地运行的LocalAI服务通信，进行文本嵌入
LLM：软件测试的颠覆性力量 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LLM：软件测试的颠覆性力量关键词：大语言模型（LLM）、软件测试、人工智能、测试自动化、测试效率、质量保证、测试革新1.背景介绍在当今快速发展的软件行业中，测试一直是确保产品质量的关键环节。随着人工智能技术的飞速进步，特别是大语言模型（LargeLanguageModels，简称LLM）的出现，软件测试领域正经历着前所未有的变革。LLM凭借其强大的自然语言处理能力和广泛的知识储备，正在重塑我们对
使用Dall-E生成图像：文本到图像的魔力 shuoac 计算机视觉人工智能 python
使用Dall-E生成图像：文本到图像的魔力技术背景介绍Dall-E是OpenAI开发的一个强大的文本到图像生成模型，它能够根据自然语言描述创造出全新的数字图像。这一技术基于深度学习的方法，使得创意与AI图像生成的结合更具可能性。本文将介绍如何调用Dall-EAPI来生成图像，从而使开发者能够将这一技术应用到自己的项目中。核心原理解析Dall-E利用大型语言模型（LLM）从用户提供的文本描述中提取详
DS/ML：数据科学技术之数据科学生命周期(四大层次+机器学习六大阶段+数据挖掘【5+6+6+4+4+1】步骤)的全流程最强学习路线讲解之详细攻略一个处女座的程序猿资深文章(前沿/经验/创新)DataScience ML 数据科学数据科学的生命周期机器学习
DS/ML：数据科学技术之数据科学生命周期(四大层次+机器学习六大阶段+数据挖掘【5+6+6+4+4+1】步骤)的全流程最强学习路线讲解之详细攻略导读：本文章是博主在数据科学和机器学习领域，先后实战过几百个应用案例之后的精心总结，应该是完全覆盖了数据科学的整个生命周期及其各个阶段的要点。其中机器学习领域六大阶段更是在整个数据科学生命周期中扮演着极其重要的角色。同时，因为涉及到博主出书中出版社要求在
深入了解盘古大模型：技术、应用与未来 Hardess-god Literature review 人工智能
随着人工智能技术的迅猛发展，预训练大模型已成为AI领域最前沿、最热门的研究方向之一。近年来，中国自主研发的大模型之一——盘古模型（PanGuModel）逐渐进入公众视野，凭借其强大的性能和广泛的应用前景，引发了行业内外的广泛关注。什么是盘古大模型？盘古大模型是华为公司联合多家科研机构共同研发的超大规模预训练语言模型。该模型以中文数据为主进行训练，旨在推动中文自然语言处理（NLP）以及跨模态应用的技
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。 985小水博一枚呀深度学习人工智能
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。文章目录【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。1.滑坡灾害早期隐患的概念与特征概念主要特征2.通过光学
知识图谱中NLP新技术魔王阿卡纳兹知识图谱入门大数据治理与分析知识图谱自然语言处理人工智能
知识图谱与自然语言处理（NLP）的结合是当前人工智能领域的前沿方向，其技术发展呈现多维度融合与场景深化的特点。以下从核心技术突破、应用场景创新及未来趋势三个层面，系统梳理知识图谱中NLP的最新进展：一、核心技术突破基于预训练模型的图谱构建与增强预训练语言模型与知识嵌入融合：以BERT、KEPLER为代表的模型通过联合优化知识嵌入（KE）和语言建模目标，将知识图谱中的结构化知识融入预训练过程，显著提
给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
简单理解机器学习中top_k、top_p、temperature三个参数的作用无级程序员机器学习人工智能
在机器学习中，top_k、top_p和temperature是用于控制生成模型（如语言模型）输出质量的参数，尤其在文本生成任务中常见。然而，网上文章很多很全，但大多晦涩难懂，今天我们来用最简单的语言谈谈它们的具体作用：1.点菜式筛选法：top_k参数英文全称：top-k中文名称：前k个具体意义：top_k参数就像是你在餐厅点菜时，服务员只给你推荐菜单上前k名的招牌菜。在AI文本生成中，top_k参
使用PyTorch搭建Transformer神经网络:入门篇 DASA13 pytorch transformer 神经网络
1.简介Transformer是一种强大的神经网络架构,在自然语言处理等多个领域取得了巨大成功。本教程将指导您使用PyTorch框架从头开始构建一个Transformer模型。我们将逐步解释每个组件,并提供详细的代码实现。2.环境设置首先,确保您的系统中已安装Python(推荐3.7+版本)。然后,安装PyTorch和其他必要的库:pipinstalltorchnumpymatplotlib3.P
解析大模型归一化：提升训练稳定性和性能的关键技术秋声studio 口语化解析深度学习人工智能大模型归一化
引言在深度学习领域，特别是在处理大型神经网络模型时，归一化（Normalization）是一项至关重要的技术。它可以提高模型的训练稳定性和性能，在加速收敛方面发挥了重要作用。本文将深入探讨大模型归一化的原理、常见方法及其应用场景，并结合实际案例和代码示例进行说明。一、归一化的作用与理论基础归一化的主要目的是为了提高模型的训练稳定性和性能。具体来说，归一化有以下几个关键作用：提高训练稳定性：在神经网
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class

Unsupervised Question Answering by Cloze Translation 通过完形填空翻译的无监督的问答

Unsupervised Question Answering by Cloze Translation 通过完形填空翻译的无监督的问答

文章目录

0、Abstract

0.1、背景

0.2、Paper做的

c-1）为了产生上面的三元组：

0.3、其它

1、Introduction

1.1 现有背景

1.2 作者方法

1.3 cloze to natural

1.4 少样本学习

1.5 To Summarize 总结

2、Unsupervised Extractive QA 无监督EQA

2.1、Context and Answer Generation 上下文和答案生成

2.2、Question Generation 问题生成

2.3、Question Answering 问题回答

2.4、Unsupervised Cloze Translation 无监督完形填空翻译

3、Experiments 实验

3.1、Unsupervised QA Experiments 无监督QA实验

3.2、Ablation Studies and Analysis消融实验和分析

3.3、Error Analysis 错误分析

3.4、UNMT-generated Question Analysis UNMT生成问题分析

3.5、Few-Shot Question Answering 少样本问题回答

4、Related Work相关工作

5、Discussion 讨论

6、Conclusion 结论

你可能感兴趣的:(自然语言处理,机器学习,深度学习)