任菜菜学编程

2019年CS224N课程笔记-Lecture 15:Natural Language Generation

资源链接：https://www.bilibili.com/video/BV1r4411

这节课讲的是文本生成（是一个超级超级广的概念，几乎各个地方都可以牵扯到），NLG甚至每个方面都可以开创一个讲座

正课内容

Natural Language Generation (NLG)/文本生成

自然语言生成指的是我们生成（即写入）新文本的任何设置
NLG 包括以下成员：

机器翻译
摘要
对话（闲聊和基于任务）
创意写作：讲故事，诗歌创作
自由形式问答（即生成答案，从文本或知识库中提取）
图像字幕

之前内容重述

之前我们所说的机器问答并不是NLG，因为他只是提取答案

一些疑问回答：语言模型/LM是根据目前已有的文本生成下一个词的模型，如果这么模型是使用RNN完成的，则称为RNN-LM。

件语言建模是给定之前的单词以及一些其他输入 [公式] ，预测下一个单词的任务：

条件语言建模任务的例子
机器翻译 x=source sentence, y=target sentence
摘要 x=input text, y=summarized text
对话 x=dialogue history, y=next utterance

Recap: training a (conditional) RNN-LM

这是神经机器翻译中的例子，在训练期间,我们将正确的/我们想要的得到的目标句子输入解码器，而不考虑解码器预测的。这种培训方法称为Teacher Forcing（Teacher Forcing，它是一种网络训练方法，对于开发用于机器翻译，文本摘要，图像字幕的深度学习语言模型以及许多其他应用程序至关重要。它每次不使用上一个state的输出作为下一个state的输入，而是直接使用训练数据的标准答案(ground truth)的对应上一项作为下一个state的输入），这就是如何训练有条件的RNN语言模型

Recap: decoding algorithms

问题：当我们有训练好的条件语言模型后，如何使用它生成文本？
答案：我们需要一个解码算法，解码算法是一种算法，用于从语言模型生成文本
几个星期前我们了解了两种解码算法：贪婪解码+束搜索

贪婪解码

一个简单的算法，在每一步中，取根据语言模型生成的最可能的单词（即argmax），将其用作下一个单词，并在下一步中将其作为输入提供，继续前进，直到您产生或达到某个最大长度

由于缺乏回溯，输出可能很差，例如，不合语法，不自然，荒谬。

束搜索

一种旨在通过一次跟踪多个可能的序列，找到高概率序列（不一定是最佳序列）的搜索算法
核心思想：在解码器的每一步，跟踪 k 个最可能的部分序列（我们称之为假设），k是光束大小（是一个超参数），达到某个停止标准后，选择概率最高的序列（考虑一些长度调整），样例如下（k=2，绿的的最终结果）：

电视上也开始使用束搜索了

改变光束大小k有什么影响？

小的 k 与贪心解码有类似的问题（k = 1时就是贪心解码），不符合语法，不自然，荒谬，不正确
更大的 k 意味着您考虑更多假设，增加k可以减少上述一些问题，但是更大的k在计算上更昂贵，而且增加 k 可能会引入其他问题：

对于NMT，增加 k 太多会降低BLEU评分(Tu et al, Koehnet al)，可能和我们认为的有所不同，我们认为k越大应该可以找到更好的结果，但是实际上，beam size 和 BLEU 之间存在最优性之间的区别，高概率序列和高的 BLEU 得分是两件独立的事情，这主要是因为大 k 光束搜索产生太短的翻译（即使得分归一化）
在闲聊话等开放式任务中，大的 k 会输出非常通用的句子（见下一张幻灯片）

聊天对话中光束大小的影响

低beam size/k

更关于话题但是有些重复和经常是没有意义的回答
语法差，重复的

高beam size/k

安全的反应
“正确”的反应
但它是通用的，不太相关

学生问题：可以自适应的调整k吗？没有明确解答，但是说论文中好像看到过相关介绍，认为是有可能的～

基于采样的解码

介绍的一个全新的解码方式，也称为纯采样，在每个步骤t，从概率分布Pt中随机抽样以获取你的下一个单词。
像贪婪的解码，但是是采样而不是argmax。（之所以称为纯采样的原因是将其和top-n采样区分开来）

Top-n 采样

在每个步骤 t ，从Pt的前 n 个最可能的单词中，进行随机采样（即若V = 10, n = 2，就相当于把选择范围限定在了概率排名前两个的单词，再在这两者之间做采样得到一个单词）
与纯采样类似，但截断我们的概率分布
此时，n = 1 是贪婪搜索，n = V 是纯采样，增加n以获得更多样化/风险的输出，减少n以获得更通用/安全的输出，这两者都更多比束搜索更有效率，不用跟踪多个假设

Softmax temperature/Softmax温度

回顾：在时间步 t ，语言模型通过对分数向量使用 softmax 函数计算出概率分布Pt

你可以对 softmax 函数时候用温度超参数

提高温度τ: Pt变得更均匀
因此输出更多样化（概率分布在词汇中）
降低温度 τ : Pt变得更尖锐
因此输出的多样性较少（概率集中在顶层词汇上）

注意：softmax温度不是解码算法！
这是一种可以在测试时结合解码算法（如波束搜索或采样）应用的技术

解码算法：摘要

贪心解码是一种简单的译码方法；给低质量输出
束搜索 (特别是高beam大小)通过大量不同假设的高概率输出，往往比贪婪搜索提供更好的质量，但是如果 Beam 尺寸太大，可能会返回高概率但不合适的输出(如通用的或是短的)
抽样方法来获得更多的多样性和随机性，适合开放式/创意代(诗歌,故事)，Top-n个抽样允许您控制多样性
Softmax温度控制的另一种方式多样性，它不是一个解码算法！这种技术可以应用在任何解码算法。

NLG

（这个内容太大了，只会讲一部分）

摘要：任务定义

任务：给定输入文本x，写出更短的摘要 y 并包含 x 的主要信息

摘要可以是单文档，也可以是多文档

单文档意味着我们写一个文档 x 的摘要 y
多文档意味着我们写一个多个文档x1、x2、...、x3的摘要 y，通常x1、x2、...、x3有重叠的内容：如对同一事件的新闻文章

在单文档摘要，有许多不同的但是是真正的数据集，他们可能源文档具有不同长度和风格

Gigaword数据集: 新闻文章的前一两句->标题(即句子压缩)
LCSTS (中文微博)数据集：段落->句子摘要
NYT, CNN/DailyMail数据集: 新闻文章->(多个)句子摘要
Wikihow (new!)数据集: 完整的 how-to 文章->摘要句子
句子简化 是一个不同但相关的任务：将源文本改写为更简单（有时是更短）的版本，相关数据集如下：

Simple Wikipedia数据集：标准维基百科句子 [公式] 简单版本
Newsela数据集：新闻文章 [公式] 为儿童写的版本

Summarization: two main strategies/摘要：两大策略

抽取式摘要/提取摘要/Extractive summarization

选择部分(通常是句子)的原始文本来形成摘要（类似于我们用荧光笔画出部分笔记）
更简单
限定性的（无需解释）

抽象式摘要/抽象概括/Abstractive summarization

使用自然语言生成技术生成新的文本（类似我们用钢笔自己写出来）
更困难
更多变（更人性化）

前神经摘要/Pre-neural summarization

Pre-neural摘要系统大多是抽取式的
类似Pre-neural MT，他们通常有一个通道（通常包括三部分，如下：）

1、内容选择 Content selection：选择一些句子
2、信息排序 Information ordering：为选择的句子排序
3、句子实现 Sentence realization：编辑并输出句子序列例如，简化、删除部分、修复连续性问题)

Pre-neural内容选择算法

我们需要一些句子评分功能来完成这个任务，句子得分函数可以根据
主题关键词，通过计算如tf-idf等和例如这句话出现在文档的哪里（例如高考作文，龙头凤尾猪肚，中间的可能重要性差一点）
图算法 将文档为一组句子(节点)，每对句子之间存在边，边的权重与句子相似度成正比，使用图算法来识别图中最重要的句子

Summarization evaluation: ROUGE/摘要的评价：ROUGE

ROUGE (Recall-Oriented Understudy for Gisting Evaluation)

（详细内容可以通过该链接去查询，ROUGE: A Package for Automatic Evaluation of Summaries, Lin, 2004 http://www.aclweb.org/anthology/W04-1013）

类似于 BLEU，是基于 n-gram 覆盖的算法，不同之处在于：

没有简洁惩罚
基于召回率 recall，BLEU 是基于准确率的。我们可能会想：准确率对于MT来说是更重要的(通过添加简洁惩罚来修正翻译过短)，召回率对于摘要来说是更重要的(假设有一个最大长度限制，因为我们希望所包含所有信息的位置不能太长)，因为需要抓住更重要的信息。但是，通常使用 F1(结合了准确率和召回率)，可能是因为显式最大长度约束导致的（讲解的也不知道为啥使用F1，只说了个可能）

BLEU是一个单一的数字，通常是n=1,2,3,4
通常会为每个n-gram单独得出ROUGE得分，最常使用的是ROUGE-1（基于单子节重叠）、ROUGE-2（基于二元重叠）、ROUGE-L（基于最长公共子序列重叠）

（更多详细信息可以阅读刚刚推荐的文章）

现在有一个python实现的ROUGE，如果做需要这个的项目，可以使用它，会节约一些时间的，地址如下：

Python implementation of ROUGE: https://github.com/google-research/google-research/tree/master/rouge

神经（网络）方法的摘要（2015-至今）

2015: Rush et al. publish the first seq2seq summarization paper，Rush发布了这个论文，形容单文档摘要摘要是一项翻译任务！，因此我们可以使用标准的seq2seq + attention NMT方法来完成，下图是它们做的和使用的，一个标准注意力模型（有点像句子压缩）：

（详细内容可以查看：A Neural Attention Model for Abstractive Sentence Summarization, Rush et al, 2015 https://arxiv.org/pdf/1509.00685.pdf）

自2015年以来，有了更多的发展，使其/主题更容易复制，为了防止太多的复制，人们开始研究分层/多层次的注意力机制、更多的全局/高级的内容选择（如何还记得管道前神经摘要，他们有不同内容的选择算法，可能注意力并不是选择的最好算法，我们需要一种更全面的全局战略，来选择什么是更重要的）、使用RL/强化学习直接最大化 ROUGE 或者其他离散目标（关系内容可能是摘要的长度）、复兴pre-neural 想法(例如图算法的内容选择)，把它们变成神经系统

（上述说的很多方法，在NLG的其他领域或者说NLP深度学习其他领域也是实际可用的）

Neural summarization: copy mechanisms/神经摘要：复制机制

Seq2seq+attention systems 善于生成流畅的输出，但是不擅长正确的复制细节(例如罕见字)
复制机制使用注意力机制，使seq2seq系统很容易从输入复制单词和短语到输出，显然这是非常有用的摘要，也允许复制和创造给了我们一个混合了抽取/抽象式的方法
有几篇论文提出了复制机制的变体:

Language as a Latent Variable: Discrete Generative Models for Sentence Compression, Miao et al, 2016
Abstractive Text Summarization using Sequence-to-sequence RNNs and Beyond, Nallapati et al, 2016
Incorporating Copying Mechanism in Sequence-to-Sequence Learning
etc

如何执行复制机制的一个示例：
在每个解码器步骤中，计算这个概率Pgen（生成下一个字，而不是复制它的概率），并且想法是根据我们当前的上下文类型来计算的当前解码器的状态。一旦完成了上述内容，我们就想着要分配注意力了，然后将Pgen和分配的注意力的概率结合，最终分布是生成（又称“词汇表”）分布和复制（即注意）分布的混合（有一篇论文中注意力分配有两个方面，一个用于复制，一个用于参与），如下公式：

（其他内容可以参考：Get To The Point: Summarization with Pointer-Generator Networks, See et al, 2017 https://arxiv.org/pdf/1704.04368.pdf）

复制机制似乎是一个明智的想法，但是复制机制有不少大问题，首先汇总时他们复制太多，主要是长短语，有时甚至整个句子，一个原本应该是抽象的摘要系统，会坍塌为一个主要是抽取/挖掘的系统
另一个问题，他们不善于整体内容的选择，特别是如果输入文档很长的情况下，没有选择内容总体的战略

Neural summarization: better content selection/神经摘要：更好的内容选择

回忆：pre-neural摘要是不同阶段的内容选择和表面实现(即文本生成)，标准seq2seq + attention 的摘要系统，这两个阶段是混合在一起的，每一步的译码器(即表面实现)，我们也能进行词级别的内容选择(注意力)，但是这是不好的：没有全局内容选择策略，一个解决办法：自下而上的汇总/摘要

Bottom-up summarization/自下而上总结/摘要

首先我们有一个内容选择阶段：使用一个神经序列标注模型来将单词标注为 include / don’t-include
自下而上的注意力阶段：seq2seq + attention 系统不能处理 don’t-include 的单词（使用 mask ）
简单但是非常有效！

更好的整体内容选择策略
减少长序列的复制(即更摘要的输出)
因为长序列中包含了很多 don’t-include 的单词，所以模型必须学会跳过这些单词并将那些 include 的单词进行摘要与组合

Neural summarization via Reinforcement Learning/基于强化学习的神经摘要

（两年前/2017年的一片论文）

使用 RL 直接优化 ROUGE-L，相比之下，标准的最大似然(ML)训练不能直接优化ROUGE-L，因为它是一个不可微函数
有趣的发现，使用RL代替ML取得更高的ROUGE分数，但是人类判断的得分越低（绿色红色箭头内容）。

论文中的一句话：“我们观察到，ROUGE得分最高的模型也生成了几乎不可读的摘要。”（指标虽然优化了，但是对于真正的任务并没有优化）（就像我们知道，BLEU并不是一个完美的类比，实际的翻译质量也是ROUGE也不说一个完美的类比）
混合模型最好（图中ML+RL，可以获得高分数和人类判别分数）

Dialogue/对话

“对话”包括各种各样的设置

面向任务的对话

辅助 (如客户服务、给予建议，回答问题，帮助用户完成任务，如购买或预订)
合作 (两个代理通过对话在一起解决一个任务)
对抗 (两个代理通过对话完成一个任务)

社会对话

闲聊 (为了好玩或公司)
治疗/精神健康/心理交流

Pre- and post-neural dialogue/前后神经对话

由于开放式自由NLG的难度，pre-neural对话系统经常使用预定义的模板，或从语料库中检索一个适当的反应的反应
摘要过去的研究，自2015年以来有很多论文将seq2seq方法应用到对话，从而导致自由对话系统兴趣重燃
一些早期seq2seq对话文章包括

A Neural Conversational Model, Vinyals et al, 2015
Neural Responding Machine for Short-Text Conversation, Shang et al, 2015

Seq2seq-based dialogue/基于Seq2seq的对话

然而，很快他们就明白简单的应用标准seq2seq +attention的方法在对话(闲聊)任务中有严重的普遍缺陷，例子如下：

一般性/无聊的反应
无关的反应(与上下文不够相关)
话语中重复
缺乏上下文(不记得谈话历史)
缺乏一致的角色人格

（下面将基于这些缺点进行说明）

Irrelevant response problem/无关响应问题

问题：seq2seq经常产生与用户无关的话语
要么因为它是通用的(例如,“我不知道”)或者与主题无关
一个解决方案：不是去优化输入 S 到回答 T 的映射来最大化给定 S 的 T 的条件概率，而是去优化输入S 和回复 T 之间的最大互信息Maximum Mutual Information (MMI)，从而抑制模型去选择那些本来就很大概率的通用句子（其实就是最好尝试改变训练目标而不是企图去优化当前目标下的算法），详细内容请查看：A Diversity-Promoting Objective Function for Neural Conversation Models, Li et al, 2016 https://arxiv.org/pdf/1510.03055.pdf

Genericness / boring response problem/一般性/无聊的反应问题

简单的测试时修复

直接在束搜索中直接升级/增大罕见字的概率，这样在搜索过程中更容易产生罕见字
使用抽样解码算法（例如softmax温度）而不是Beam搜索

条件修复（类似于后期干预，这是一种非常好的方法，可以从采样中获得细粒度的细节，然后编辑它以适应当前情况）

用一些额外的内容训练解码器(如抽样一些内容词并处理)
训练 retrieve-and-refine/检索和优化模型而不是 generate-from-scratch/从头开始生成模型，检索和优化模型即从语料库采样人类话语并编辑以适应当前的场景，这通常产生更加多样化/人类/有趣的话语！

Repetition problem/重复问题

简单解决方案，直接在 Beam 搜索中禁止重复n-grams，通常非常有效
更复杂的解决方案，在seq2seq中训练一个覆盖机制，这是客观的，灵感来自于机器翻译的设置，可以防止注意力机制多次注意相同的单词，定义训练目标以阻止重复，如果这是一个不可微函数生成的输出，然后将需要一些技术例如RL来训练

Lack of consistent persona problem/缺乏一致的人物角色问题

2016年，李等人提出了一个seq2seq对话模式，学会将两个对话伙伴的角色编码为嵌，生成的话语是以嵌入为条件的
最近有一个闲聊的数据集称为PersonaChat，包括每一次会话的角色(描述个人特质的5个句子的集合)，这提供了一种简单的方式，让研究人员构建 persona-conditional 对话代理

相关论文：
A Persona-Based Neural Conversation Model, Li et al 2016
Personalizing Dialogue Agents: I have a dog, do you have pets too?, Zhang et al, 2018

（下面内容，直到图片生成老师都没讲，这里只放课件内容了）

Negotiation dialogue/谈判对话

2017年，Lewis et al收集谈判对话数据集

两个代理协商谈判对话(通过自然语言)如何分配一组项目
代理对项目有不同的估值函数
代理人会一直交谈直到达成协议

详细内容请了解：Deal or No Deal? End-to-End Learning for Negotiation Dialogues, Lewis et al, 2017 https://arxiv.org/pdf/1706.05125.pdf

他们发现用标准的最大似然(ML)来训练seq2seq系统的产生了流利但是缺乏策略的对话代理，和Paulus等的摘要论文一样，他们使用强化学习来优化离散奖励(代理自己在训练自己)，RL 的基于目的的目标函数与 ML 目标函数相结合
但是存在潜在的陷阱：如果两两对话时，代理优化的只是RL目标，他们可能会偏离英语

详细内容请了解：

This observation led to an unfortunate media over-reaction: https://www.skynettoday.com/briefs/facebook-chatbot-language/
Deal or No Deal? End-to-End Learning for Negotiation Dialogues, Lewis et al, 2017 https://arxiv.org/pdf/1706.05125.pdf

在测试时，该模型通过计算展开在可能的响应之间进行选择：模拟对话的其余部分和预期的回报。
2018年，Yarats等人针对谈判任务提出了另一种对话模型，将策略层次与NLG层面分开
•每个话语xt都有一个对应的离散潜在变量zt
•zt学习成为一个很好的预测对话中的未来事件的预测器(未来的消息，策略的最终收获)，但不是xt本身的预测器
•这意味着zt学会了表达xt对对话的影响，而不是 xt的话
•因此，zt将任务的策略层次与NLG方面分开。
•这对于可控性、可解释性、更容易学习的策略等都很有用。
详细内容请查阅：Hierarchical Text Generation and Planning for Strategic Dialogue, Yarats et al, 2018 https://arxiv.org/pdf/1712.05846.pdf

（这个图可以自己了解了解...因为没讲，我也不懂...）

Conversational question answering: CoQA/会话式问答：CoQA

一个来自斯坦福NLP的新数据集
任务：回答关于以一段对话为上下文的文本的问题
答案必须写摘要地(不是复制)
QA / 阅读理解任务，和对话任务

详细内容请了解：CoQA: a Conversational Question Answering Challenge, Reddy et al, 2018 https://arxiv.org/pdf/1808.07042.pdf

Storytelling/讲故事

（差不多开始回归正课内容了）

神经讲故事的大部分工作使用某种提示来写故事

给定图像生成的故事情节段落
给定一个简短的写作提示生成一个故事
给定迄今为止的故事，生成故事的下一个句子（故事续写）

这和前两个不同，因为我们不关心系统在几个生成的句子上的性能
神经故事飞速发展：第一个故事研讨会于2018年举行，它举行比赛(使用五张图片的序列生成一个故事)

Generating a story from an image/从图像生成故事

有趣的是，这不是简单的有监督的图像字幕。没有可供学习的配对数据。

问题：如何解决缺乏并行数据的问题
回答：使用一个通用的 sentence-encoding space
Skip-thought 向量是一种通用的句子嵌入方法，想法类似于我们如何学通过预测周围的文字来学习单词的嵌入，使用 COCO (图片标题数据集)，学习从图像到其标题的 Skip-thought 编码的映射，使用目标样式语料库(Taylor Swift lyrics)，训练RNN-LM，将Skip-thought向量解码为原文，把两个放到在一起

Generating a story from a writing prompt/根据写作提示生成故事

2018年，Fan 等发布了一个新故事生成数据集 collected from Reddit’s WritingPrompts subreddit.
每个故事都有一个相关的简短写作提示

Fan 等也提出了一个复杂的 seq2seq prompt-to-story 模型

convolutional-based，这使它的速度比RNN-based seq2seq更快
封闭的多头多尺度的self-attention

self-attention 对于捕获远程上下文而言十分重要
门控允许更有选择性的注意机制
不同的注意力头在不同的尺度上注意不同的东西——这意味着有不同的注意机制用于检索细粒度和粗粒度的信息

模型融合

预训练一个seq2seq模型，然后训练第二个 seq2seq 模型访问的第一个 model 的隐状态
想法是，第一seq2seq模型学习通用LM，第二个model学习基于提示的条件

细节老师没过多解释，想了解最新的文本生成的可以自己了解下～

结果令人印象深刻

与提示相关
多样化，并不普通
在文体上戏剧性

但是

主要是氛围/描述性/场景设定，很少是事件/情节
生成更长时，大多数停留在同样的想法并没有产生新的想法——一致性问题

（剩下课件大部分内容都是略过了，直接进行NLG评估部分）

NLG evaluation/NLG评估

NLG的自动评估指标

基于词重叠的指标(BLEU，ROUGE，METROR，F1，等等)，我们知道他们不适合机器翻译，对于摘要而言是更差的评价标准，因为摘要比机器翻译更开放
不幸的是，与抽象摘要系统相比，提取摘要系统更受ROUGE青睐，对于对话甚至更糟，这比摘要更开放，类似的例子还有故事生成

Word overlap metrics are not good for dialogue/单词重叠度量不利于对话

橙色部分想我们展示：对话类和BLEU-2上人类得分之间相关性的一些图，但是我们根本没看到多少相关性，也就是 BLEU-2、Embedding average 和人类评价的相关性都不高，很不幸的是，还有一些其他论文表明了同样的事情，如下图：

Automatic evaluation metrics for NLG/NLG的自动评估指标

困惑度怎么样？
困惑度捕捉到我们的LM有多强大？但是不会告诉你关于生成的任何事情(例如，如果你的困惑度是未改变的，解码算法是不好的)

简单说困惑度会告诉我们模型有多强，但是不会告诉我们模型有多好～
词嵌入基础指标？
主要思想：比较词嵌入的相似度(或词嵌入的均值)，而不仅仅是重叠的单词。以更灵活的方式捕获语义。
不幸的是,仍然没有与类似对话的开放式任务的人类判断，产生很好的联系

（图中橙色部分显示了人类之间的相关性、判断以及基于词嵌入度量的某种平均值，看起来并不好，没有很大的相关性）

我们没有自动指标充分捕捉整体质量(即代表人类的质量判断)，我们能做什么呢？
通常策略是：我们可以定义更多的集中自动度量来捕捉生成文本的特定方面，如下：（不会告诉我们模型多么准确，但是会告诉我们多么流利、风格是否正确等等）

流利性(使用训练好的LM计算概率)
正确的风格(使用目标语料库上训练好的LM的概率)
多样性(罕见的用词，n-grams 的独特性)
相关输入(语义相似性度量)
简单的长度和重复
特定于任务的指标，如摘要的压缩率

虽然这些不衡量整体质量，他们可以帮助我们跟踪一些我们关心的重要品质

Human evaluation/人类评估

人类的判断被认为是黄金标准，当然，我们知道人类评价是缓慢而昂贵的
但是仅这些问题吗？还有金钱时间等因素
假如我们获得无限的人类的评估：实际上解决你所有的问题吗？
不！
因为进行人类有效评估非常困难，存在许多问题，例如：

人类评估是不一致的
人类评估可能是不合逻辑的
人类评估失去注意力
人类评估误解了你的问题
人类评估不能总是解释为什么他们会这样做

Detailed human eval of controllable chatbots/可控聊天机器人的详细人类评估

这个博士生在聊天机器人项目上工作的个人经验（PersonaChat），她们研究了可控性（特别是控制所产生的话语，如重复，特异性，回应相关性和问题询问）

详细资料：What makes a good conversation? How controllable attributes affect human judgments, See et al, 2019 https://arxiv.org/pdf/1902.08654.pdf

如何要求人的质量判断？
我们尝试了简单的整体质量（多项选择）问题，例如：

这次对话有多好？
这个用户有多吸引人？
这些用户中哪一个给出了更好的响应？
您想再次与该用户交谈吗？
您认为该用户是人还是机器人？

主要问题：

必然非常主观
回答者有不同的期望；这会影响他们的判断
对问题的灾难性误解（例如“聊天机器人非常吸引人，因为它总是回写”）
总体质量取决于许多潜在因素；他们应该如何被称重和/或比较？

最后，我们设计了一个详细的人的评估系统，该系统将影响聊天机器人整体质量的重要因素分离出来：

发现：

控制重复对于所有人类判断都非常重要
提出更多问题可以提高参与度
控制特异性（较少的通用话语）提高了聊天机器人的吸引力，趣味性和感知的听力能力。
但是，人类评估人员对风险的容忍度较低（例如无意义或非流利的输出）与较不通用的机器人相关联
总体度量“吸引力”（即享受）很容易最大化 - 我们的机器人达到了近乎人性化的表现
整体度量“人性化”（即图灵测试）根本不容易最大化 - 所有机器人远远低于人类表现
人性化与会话质量不一样！
人类是次优的会话主义者：他们在有趣，流利，倾听上得分很低，并且问的问题太少

Possible new avenues for NLG eval?

语料库级别的评价指标
- 度量应独立应用于测试集的每个示例，或整个语料库的函数
- 例如，如果对话模型对测试集中的每一个例子回答相同的通用答案，它应该被惩罚
评估衡量多样性安全权衡的评估指标
免费的人类评估
- 游戏化：使任务（例如与聊天机器人交谈）变得有趣，这样人类就可以为免费提供监督和隐式评估，作为评估指标
对抗性鉴别器作为评估指标
- 测试NLG系统是否能愚弄经过训练能够区分人类文本和AI生成的文本的识别器

Thoughts on NLG research, current trends, and the future/关于NLG研究、当前趋势和未来的思考

目前有三个令人兴奋的发展趋势（我看不懂55555）

将离散潜在变量纳入NLG，可以帮助在真正需要它的任务中建模结构，例如讲故事，任务导向对话等
严格的从左到右生成的替代方案，并行生成，迭代细化，自上而下生成较长的文本
替代teacher forcing的最大可能性培训，更全面的句子级别的目标函数（而不是单词级别）

5年前，NLP+深度学习研究像一个狂野的西部，一切都是新的，充满了不确定性

现在（2019年），已经没有那么狂野了…但NLG似乎是剩下最疯狂的部分之一

Neural NLG community is rapidly maturing/神经NLG社区正在迅速成熟

在NLP+深度学习的早期，社区主要将成功的非机动车交通方法转移到NLG任务中。
现在，越来越多的创新NLG技术出现，针对非NMT生成环境。
越来越多（神经）NLG研讨会和竞赛，特别关注开放式NLG，例如：

NeuralGen workshop
Storytelling workshop
Alexa challenge
ConvAI2 NeurIPS challenge

这些对于组织社区提高再现性、标准化评估特别有用，进步的最大障碍仍然是评估

8 things I’ve learnt from working in NLG/我在NLG工作学到的8件事

1、任务越开放，一切就越困难（评估变得困难，定义正在做的事情变得困难，告诉我们什么时候做的好了变得困难）
- 约束有时是受欢迎的
2、针对具体的改进目标可以更容易管理，而不是为了提高整体生成质量（例如为模型增加多样性，可能更容易实现和衡量，而不是因为评估问题而提高整体生成质量）
3、如果你使用一个LM作为NLG：改进LM（即困惑）最有可能提高生成质量（但也不是唯一提高生成质量的方法）
- 但这并不是提高生成质量的唯一途径
4、多看看我们的输出（一部分原因是没有任何单一指标可以告诉我们发生了什么，所以看看自己的输出以形成自己的意见，虽然比较耗时间，但是值得我们这么做）
5、你需要一个自动度量，即使它是不受影响的
- 您可能需要几个自动度量（之前也说过：越开放，可能需要越多的指标，例如流畅度、多样性等等）
6、如果我们做了人工评估，让问题尽可能的集中（如果开放性问题定义的非常模糊，可能别人也没法很好的评价）
7、在今天的NLP + 深度学习和 NLG中，再现性是一个巨大的问题。（NLG中更大）
- 请公开发布所有生成的输出以及您的论文（多分享，可能就是别人突变性成就的参考）
8、在NLG工作可能很令人沮丧（可能不知道怎么取得进步），但也很有趣

最后来一个主讲者聊天机器人的一些奇怪对话

你可能感兴趣的:(深度学习,人工智能,NLP,人工智能,深度学习,自然语言处理)

Marker可以快速且准确地将PDF转换为markdown格式。星霜笔记开源关注简介免费源码 pdf
MarkerMarker可以快速且准确地将PDF转换为markdown格式。支持多种文档类型（针对书籍和科学论文进行了优化）支持所有语言移除页眉/页脚/其他杂质格式化表格和代码块提取并保存图像以及markdown将大多数方程转换为latex支持在GPU、CPU或MPS上运行工作原理Marker是一个由深度学习模型组成的管道：提取文本，必要时进行OCR处理（启发式算法，surya，tesseract
“四预”驱动数字孪生水利：让智慧治水守护山河安澜 GeoSaaS 实景三维智慧城市人工智能 gis 大数据安全
近年来，从黄河秋汛到海河特大洪水，从珠江流域性洪灾到长江罕见骤旱，极端天气频发让水安全问题备受关注。如何实现“治水于未发”？数字孪生水利以“预报、预警、预演、预案”（四预）为核心，正在掀起一场水利治理的智慧革命。一、数字孪生水利：从物理世界到虚拟镜像的跃迁数字孪生水利并非简单的“数字建模”，而是通过高精度传感器、大数据、人工智能等技术，在虚拟空间构建与物理流域完全映射的“数字分身”，实现水情、工情
硬件NAS将成为电子垃圾？ DeepSeek+NAS 家用NAS WinNAS 飞牛NAS 人工智能安卓NAS
随着人工智能（AI）技术的快速发展，传统的NAS设备正面临一场深刻的变革。过去，NAS的主要功能是提供数据存储和共享服务，但在AI时代，单纯的存储功能已无法满足用户需求。未来的NAS必须集成本地AI能力，才能成为真正的AI-NAS。然而，当前市场上的NAS产品硬件配置普遍较低，无法支持本地AI的运行。因此，现有的硬件NAS在三年内可能会被淘汰，取而代之的将是集成了AI和NAS功能的家用AI服务器。
Hugging Face预训练GPT微调ChatGPT（微调入门！新手友好！） y江江江江机器学习大模型 gpt chatgpt
HuggingFace预训练GPT微调ChatGPT（微调入门！新手友好！）在实战中，⼤多数情况下都不需要从0开始训练模型，⽽是使⽤“⼤⼚”或者其他研究者开源的已经训练好的⼤模型。在各种⼤模型开源库中，最具代表性的就是HuggingFace。HuggingFace是⼀家专注于NLP领域的AI公司，开发了⼀个名为Transformers的开源库，该开源库拥有许多预训练后的深度学习模型，如BERT、G
【DeepSeek】全方位使用指南————简版諰. 人工智能 ai AI写作
一、平台概述DeepSeek（深度求索）是专注实现AGI的中国的人工智能公司，提供多款AI产品：智能对话（Chat）文生图（Art）代码助手（Coder）API开发接口企业定制解决方案二、注册与登录2.1账号创建访问官网https://www.deepseek.com点击右上角「注册」支持三种方式：手机号+短信验证邮箱注册（需验证邮件）第三方登录（微信/Google账号）2.2订阅计划套餐类型免费
Open-Sora - 为所有人实现高效的视频制作大众化小众AI AI开源音视频人工智能 AI编程
GitHub：https://github.com/hpcaitech/Open-Sora更多AI开源软件：发现分享好用的AI工具、AI开源软件、AI模型、AI变现-小众AI这是一款开源的SOTA（State-of-the-Art）视频生成模型，仅用20万美元（224张GPU）就能训练出商业级11B参数的视频生成大模型。它采用Python语言和PyTorch深度学习框架开发，具有生成速度快、资源消
Adam-mini：深度学习内存效率新突破 XianxinMao 人工智能深度学习人工智能
标题：Adam-mini：深度学习内存效率新突破文章信息摘要：Adam-mini优化器在深度学习领域展现出突破性潜力，尤其在内存效率和计算性能上表现卓越。相比AdamW，Adam-mini将内存效率提升了一倍，并通过减少学习率数量显著降低了内存消耗，同时保持了与AdamW相当甚至更好的性能。在训练十亿参数级别的大语言模型（LLM）时，Adam-mini实现了49.6%的吞吐量提升，并减少了33%的
【人工智能】注意力机制深入理解问道飞鱼机器学习与人工智能人工智能注意力机制
文章目录**一、注意力机制的核心思想****二、传统序列模型的局限性****三、Transformer与自注意力机制****1.自注意力机制的数学公式****四、注意力机制的关键改进****1.稀疏注意力（SparseAttention）****2.相对位置编码（RelativePositionEncoding）****3.图注意力网络（GraphAttentionNetwork,GAN）****
Transformer与图神经网络的融合与应用 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Transformer与图神经网络的融合与应用关键词：Transformer,图神经网络,注意力机制,图结构数据,图表示学习,图分类,图生成1.背景介绍近年来，深度学习技术在各个领域取得了显著的进展。其中，Transformer模型和图神经网络（GraphNeuralNetworks,GNNs）是两个备受关注的研究方向。Transformer最初应用于自然语言处理领域，通过自注意力机制实现了并行计
深度学习的颠覆性发展：从卷积神经网络到Transformer AI天才研究院 AI大模型应用入门实战与进阶 ChatGPT 大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍深度学习是人工智能的核心技术之一，它通过模拟人类大脑中的神经网络学习从大数据中抽取知识，从而实现智能化的自动化处理。深度学习的发展历程可以分为以下几个阶段：2006年，GeoffreyHinton等人开始研究卷积神经网络（ConvolutionalNeuralNetworks，CNN），这是深度学习的第一个大突破。CNN主要应用于图像处理和语音识别等领域。2012年，AlexKrizh
使用 OpenAI Chat 模型进行对话开发的入门指南 eahba python
技术背景介绍OpenAI的对话模型（ChatOpenAI）为开发者提供了强大的自然语言处理功能，可以实现高度交互的AI应用。这篇文章将帮助您快速入门，了解如何在您的应用中集成和使用这些模型，并探讨不同的功能特性。核心原理解析ChatOpenAI模型是基于OpenAI的GPT家族，能够理解上下文并产生对话式回应。最新版的模型不仅支持标准文本输入输出，还支持工具调用、结构化输出等高级特性，满足多种复杂
高性能计算:GPU加速与分布式训练 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能技术的飞速发展，深度学习模型的规模和复杂度不断提升，对计算能力的需求也越来越高。传统的CPU架构已经难以满足深度学习模型训练的需求，因此，GPU加速和分布式训练成为了高性能计算领域的研究热点。1.1.深度学习与计算挑战深度学习模型通常包含数百万甚至数十亿个参数，训练过程需要进行大量的矩阵运算和梯度更新，对计算资源的需求非常高。传统的CPU架构虽然具有较强的通用性，但其并行计
人工智能之数学基础：矩阵的范数每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能矩阵算法线性代数范数
本文重点在前面课程中，我们学习了向量的范数，在矩阵中也有范数，本文来学习一下。矩阵的范数对于分析线性映射函数的特性有重要的作用。矩阵范数的本质矩阵范数是一种映射，它将一个矩阵映射到一个非负实数。矩阵的范数前面我们学习了向量的范数，只有当满足几个条件的时候，此时才可以，那么矩阵也是一样的，当满足下面的条件的时候，才可以定义||A||为矩阵A的范数矩阵范数的性质连续性矩阵范数是连续的函数。即如果矩阵序
使用 MistralAI 平台进行开源模型托管与调用 VYSAHF python
MistralAI是一个提供开放源码模型托管的平台，致力于帮助开发者更轻松地使用和管理开源模型。通过该平台，你可以方便地调用强大的深度学习模型，并将其集成到你的应用中。本文将带你了解如何利用MistralAI提供的服务来进行模型的托管和调用。技术背景介绍MistralAI的服务包括了如聊天模型和嵌入模型等，这些模型适用于聊天机器人、文本嵌入等各种场景。使用这些模型需要注册并获取一个有效的API密钥
AI 大模型应用数据中心的数据清洗工具 SuperAGI2025 计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
1.背景介绍在人工智能大模型应用的浪潮中，数据清洗作为数据预处理的重要环节，对于提升模型性能和可靠性具有至关重要的作用。数据中心作为人工智能模型的运行环境，面临着海量数据流和多样化的数据类型，如何高效、准确地进行数据清洗，成为应用大模型的关键问题之一。本文将详细介绍AI大模型应用数据中心的数据清洗工具，包括核心概念、算法原理、具体操作步骤、应用场景等，旨在为AI大模型的实际应用提供参考。2.核心概
AI 大模型应用数据中心的数据迁移架构 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
AI大模型、数据中心、数据迁移、架构设计、迁移策略、性能优化、安全保障1.背景介绍随着人工智能（AI）技术的飞速发展，大规模AI模型的应用日益广泛，涵盖了自然语言处理、计算机视觉、语音识别等多个领域。这些AI模型通常需要海量的数据进行训练和推理，因此数据中心作为AI应用的基础设施，显得尤为重要。然而，随着AI模型规模的不断扩大，数据中心面临着新的挑战：数据规模庞大:AI模型的训练和推理需要海量数据
使用LangChain与Amazon Bedrock构建JCVD风格的Chatbot scaFHIO langchain python
技术背景介绍在人工智能时代，构建一个智能化的聊天机器人不仅是一个趋势，更是提升与用户互动体验的关键之一。本文将向你展示如何使用LangChain和AmazonBedrock构建一个仿效让·克劳德·范·达美（JCVD）风格的聊天机器人。我们将借助于Anthropic提供的Claude模型，通过AmazonBedrock强大的基础设施来实现这一目标。核心原理解析LangChain作为一个强大的框架，简
Cursor 终极使用指南：从零开始走向AI编程芯作者 DD：日记人工智能机器学习深度学习 AI编程
在数字化浪潮席卷全球的今天，人工智能（AI）已不再是遥不可及的概念，而是逐渐融入我们日常生活的方方面面。作为未来技术的核心驱动力，AI编程成为了众多开发者和技术爱好者争相探索的领域。而在这场技术革命中，Cursor——这一看似简单却功能强大的编程工具，正悄然成为连接初学者与AI编程高手的桥梁。本文将带你从零开始，逐步解锁Cursor的终极使用指南，让你在AI编程的道路上越走越远。一、初识Curso
知识管理系统：构建企业智慧大脑 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
第一部分：知识管理概述与重要性第1章：知识管理的定义与基本概念1.1.1知识管理的起源与发展知识管理（KnowledgeManagement，KM）起源于20世纪80年代，当时企业在市场竞争中逐渐意识到知识作为一种战略资源的重要性。早期的知识管理实践主要集中在知识的收集、存储和传播上。随着信息技术的发展，知识管理逐渐融入了更先进的技术手段，如数据挖掘、人工智能和大数据分析，使其成为一个跨学科、多领
暗光增强技术研究进展与产品落地综合分析（2023-2025） AndrewHZ 深度学习新浪潮图像处理算法动态范围计算机视觉深度学习 transformer 暗光增强
一、引言暗光增强技术作为计算机视觉与移动影像领域的核心研究方向之一，近年来在算法创新、硬件适配及产品落地方面取得了显著进展。本文从技术研究与产业应用两个维度，系统梳理近三年（2023-2025）该领域的关键突破，并对比分析主流手机厂商的影像技术优劣势。二、暗光增强技术研究进展1.算法创新：从传统模型到深度学习（1）Retinex理论的深度结合清华与ETH联合提出的Retinexformer（202
金融风控算法透明度与可解释性优化智能计算研究中心其他
内容概要金融风控算法的透明化研究面临模型复杂性提升与监管合规要求的双重挑战。随着深度学习框架在特征提取环节的广泛应用，算法可解释性与预测精度之间的平衡成为核心议题。本文从联邦学习架构下的数据协作机制出发，结合特征工程优化与超参数调整技术，系统性分析逻辑回归、随机森林等传统算法在召回率、F1值等关键指标上的表现差异。研究同时探讨数据预处理流程对风控决策鲁棒性的影响，并提出基于注意力机制的特征权重可视
H800核心性能优化技术智能计算研究中心其他
内容概要作为新一代AI加速卡的核心创新载体，H800通过异构计算架构与动态能效管理技术的协同设计，实现了从硬件底层到应用层的系统性优化。其技术突破聚焦于张量核心重构带来的计算密度提升、混合精度运算对资源利用率的增强，以及智能散热方案在复杂负载场景下的稳定性保障。这些创新不仅显著提升了30%以上的能效比，更通过精细化任务调度机制，解决了深度学习训练中高并发数据处理与模型参数同步的效率瓶颈。值得关注的
人工智能知识架构详解 CodeJourney. 数据库人工智能算法架构
人工智能（ArtificialIntelligence，简称AI）作为当今最具影响力和发展潜力的技术领域之一，正深刻地改变着我们的生活、工作和社会。从智能家居到自动驾驶，从医疗诊断到金融投资，人工智能的应用无处不在。要全面深入地理解和掌握人工智能，构建一个清晰、系统的知识架构至关重要。二、基础数学（一）线性代数线性代数是人工智能的重要数学基础之一。矩阵运算在数据表示和变换中起着核心作用。例如，在图
详解如何通过Python的BeautifulSoup爬虫+NLP标签提取+Dijkstra规划路径和KMeans聚类分析帮助用户规划旅行路线 mosquito_lover1 python beautifulsoup 爬虫 kmeans 自然语言处理
系统模块：数据采集模块（爬虫）：负责从目标网站抓取地点数据（如名称、经纬度、描述等）数据预处理模块（标签算法）：对抓取到的地点数据进行清洗和分类。根据地点特征（如经纬度、描述文本）打上标签（如“适合家庭”、“适合冒险”）。地理数据处理模块（地图API）：使用地图API获取地点的详细信息（如地址、距离、路径等）。计算地点之间的距离或路径。路径规划模块：根据用户输入的起点和终点，规划最优路径。支持多种
TikTokenizer 项目常见问题解决方案齐飞锴Timothea
TikTokenizer项目常见问题解决方案tiktokenizerOnlineplaygroundforOpenAPItokenizers项目地址:https://gitcode.com/gh_mirrors/ti/tiktokenizer项目基础介绍TikTokenizer是一个开源项目，主要用于文本处理，特别是将文本转化为可用于深度学习的格式。该项目是基于TensorFlow和Keras开发
TypeScript语言的计算机视觉苏墨瀚包罗万象 golang 开发语言后端
使用TypeScript进行计算机视觉：一个现代化的探索引言随着人工智能和机器学习的快速发展，计算机视觉（ComputerVision）成为了一个极具活力的研究领域。计算机视觉旨在使计算机能够“看”和“理解”数字图像或视频中的内容。近年来，TypeScript作为一种现代化的编程语言，因其类型安全和更好的开发体验，逐渐在前端和后端开发中得到了广泛应用。本文将探讨如何使用TypeScript进行计算
DeepSeek混合专家架构赋能智能创作智能计算研究中心其他
内容概要在人工智能技术加速迭代的当下，DeepSeek混合专家架构（MixtureofExperts）通过670亿参数的动态路由机制，实现了多模态处理的范式突破。该架构将视觉语言理解、多语言语义解析与深度学习算法深度融合，构建出覆盖文本生成、代码编写、学术研究等场景的立体化能力矩阵。其核心优势体现在三个维度：精准化内容生产——通过智能选题、文献综述自动生成等功能，将学术论文写作效率提升40%以上；
AI推动地理信息系统（GIS）软件的创新发展与应用拓展酥脆可口 facebook
摘要地理信息系统（GIS）软件作为空间数据处理与分析的核心工具，在城市规划、资源管理、环境监测等领域发挥着关键作用。本文深入探讨人工智能（AI）如何推动GIS软件的创新发展，分析AI技术在提升空间数据分析能力、优化地图制图、拓展应用场景等方面的重要作用，剖析面临的挑战，并对未来发展趋势进行展望，旨在为GIS行业借助AI实现升级提供理论与实践参考。一、引言传统GIS软件主要依赖基于规则的分析方法和人
人工智能之数学基础：数学对人工智能技术发展的作用每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习机器学习神经网络自然语言处理数学
本文重点数学是人工智能技术发展的基础，它提供了人工智能技术所需的数学理论和算法，包括概率论、统计学、线性代数、微积分、图论等等。本文将从以下几个方面探讨数学对人工智能技术发展的作用。概率论和统计学概率论和统计学是人工智能技术中最为重要的数学分支之一。概率论和统计学的应用范围非常广泛，包括机器学习、数据挖掘、自然语言处理、计算机视觉等领域。在人工智能技术中，概率论和统计学主要用于处理不确定性的问题，
人工智能之数学基础：线性子空间每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习线性代数线性子空间线性空间
本文重点在前面的课程中，我们学习了线性空间，本文我们我们在此基础上学习线性子空间。在应用中，线性子空间的概念被广泛应用于信号处理、机器学习、图像处理等领域。子空间的性质子空间是线性空间的一部分，它需要满足下面的性质：设V是数域F上的线性空间，W是V的一个非空子集。如果W对于V中的加法运算和数乘运算也构成F上的一个线性空间，则称W为V的线性子空间（或称向量子空间）。具体来说，设V是一个线性空间，W是
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &