zxhohai

自动文摘（Automatic document summarization）方法综述（四）——基于神经网络的（neural summarization）方法

前三篇博客（一）、（二）、（三）总结了抽取式自动文摘的一些经典方法，传统抽取式自动文摘方法将文档简单地看作是一组文本单元（短语、句子等）的集合，忽略了文档所表达的全局语义，难免“断章取义”。随着算力的提升，深度学习在很多应用中非常的火热也取得了state-of-the-art的性能，因此，将神经网络模型引入自动文摘任务是理所当然的，将文档用神经网络模型进行表示被称为神经文档模型（neural document model），neural document model采用低维连续向量表示文档语义信息非常有效。这篇博客将介绍几种经典的neural document model。

1、DocRebuild

该模型是北京大学发表在COLING2016上的一篇文章中提出来的，通过一个neural document model将文档用摘要句进行重构，同时保证选取的摘要句最小化重构误差（construction error）。

An Unsupervised Multi-Document Summarization Framework Based on Neural Document Model
在模型中，文档集中每一篇文档用neural document model表示，然后取平均作为文档集内容的表示。文档集内容重构包括：1）选取摘要句，并将摘要句用文档模型进行表示。2）计算重构误差。因此，多文档摘要任务转化成最优化问题，目标函数是最小化重构误差，选择的摘要句需满足这个误差最小。下图展示了DocRebuild的框架：

自动文摘（Automatic document summarization）方法综述（四）——基于神经网络的（neural summarization）方法_第1张图片

① neural document model是该框架的基础，直接决定了模型的性能。文中作者分别采用了两种非监督文档模型：Bag-of-Words(BoW)和Paragraph Vector(PV)。在BoW中，作者简单采用词袋模型，没有考虑单词之间的顺序和关系，每一个单词被表示成相应的word embedding，文档被表示成成单词向量的加权平均。PV模型是另一种文档模型，考虑了单词顺序。具体的可以参考word2vec和Paragraph Vector的论文。

② 在定义目标函数之前，需要定义如下符号： $D=\{d_1,d_2,\dots,d_n\}$ 表示多文档集， $D$ 中的文档都被处理成句子集合。 $C=\{s_1,s_2,\dots,s_m\}$ 表示候选句子集。 $S=\{s_1^*,s_2^*,\dots,s_l^*\}$ 表示摘要句子集，满足 $S\subset C$ ， $|S|\ll |C|$ 。 $\theta$ 表示摘要长度限制。重构误差通过摘要向量和文档向量之间的距离衡量：
$\begin{aligned} &\min_{S\subset C}\enspace ||DM(S^*)-\frac{1}{n}\sum_{i=1}^nDM(d_i)||_2^2\\ &s.t.\quad\: len(S^*)\leq\theta \end{aligned}$

其中， $D M$ 表示文档模型处理过程， $S^*$ 表示 $S$ 相应的摘要序列， $len(S^*)$ 表示摘要序列的长度。

③ 选择最优摘要集是一个NP-hard问题，在文中，作者提出了两种策略用于句子选择的效率和有效性。
句子过滤 $\quad$ 这个策略主要用于缩减搜索空间，通过过滤掉无关的噪声句，保留最有价值的句子作为候选句（candidate set），同时删除噪声句也有助于文档表示。具体地，作者首先对句子进行排序然后选取top-ranked句子作为候选。
BeamSearch Algorithm $\quad$ 为了提高搜索效率，作者提出了BeamSearch算法，算法的伪代码如下：

2、NN-SE

该模型由Cheng和Lapata在ACL 2016上提出：Neural Summarization by Extracting Sentences and Words。该论文中既提出了句子基于句子抽取的模型NN-SE，也提出了基于单词抽取的模型NN-WE，本博客中只讨论NN-SE。在判断一个句子是否属于摘要句时，传统方法依靠的是人工构建的特征。这篇文章中，作者提出了一个基于神经网络和连续句子特征的数据驱动方法。基于神经网络的方法的核心是一个encoder-decoder结构，encoder读取源序列并编码成一个连续向量，然后decoder从中生成目标序列。在decoder阶段，注意力机制（attention mechanism）通常被用来定位焦点区域（locate the focus）。

问题描述 $\quad$ 对一篇文档 $D=\{s_1,s_2,\dots,s_m\}$ ，基于句子抽取的自动文摘希望选取一个包含 $j$ 个句子 $(j < m)$ 的子集形成摘要。我们可以对 $D$ 中每一个句子打分，然后预测一个标签 $y_L\in\{0,1\}$ 指示其是否属于摘要句。对于有监督学习，目标函数可以设定为最大化所有句子标签 $\bold{y_L}=(y_L^1,y_L^2,\dots,y_L^m)$ 的似然：
$\log p(\bold{y_L}|D;\theta)=\sum_{i=1}^m\log p(y_L^i|D;\theta)$

NN-SE的关键成分包括一个基于神经网络的层次文档读取器（document reader）和一个基于注意力的层次内容抽取器（content extractor）。层次结构天然符合文档由单词、句子、段落甚至更大的单元合成。

Document Reader

作者首先采用一个单层卷积神经网络（CNN）和max-pooling操作获得句子级的向量表示。之后，采用一个标准的循环神经网络（RNN）建立文档向量表示。Convolutional Sentence Encoder $\quad$ 采用CNN进行句子表示主要有两个原因：①单隐层神经网络能够高效训练（没有长期依赖）；②CNN已经被成功地应用到句子级的分类任务中。假设 $d$ 表示word embedding的维度， $s=(w_1,\dots,w_n)$ 表示文档中的句子，因此一个句子可以表示成一个稠密矩阵 $W\in \mathbb{R}^{n\times d}$ 。接着就可以采用一个宽度为 $c$ 的卷积核 $K\in \mathbb{R}^{c\times d}$
$f_j^i=\tanh(W_{j:j+c-1}\otimes K+b)$

其中 $\otimes$ 表示矩阵的哈达马积（乘积）并求和所有元素。 $f_j^i$ 表示第 $i$ 个特征图的第 $j$ 个元素， $b$ 是偏置。采用最大池化操作获得一个单一特征（第 $i$ 个特征）：
$s_{i,K}=\max_jf_j^i$

实践中，在每个卷积核上，作者采用多个特征图计算了 $d$ 个特征，作为句子向量。同时，作者也采用了多个不同宽度的卷积核得到多个句子向量。最后，这些句子向量累加作为最终的句子表示。如下图sentence encoder阶段所示

自动文摘（Automatic document summarization）方法综述（四）——基于神经网络的（neural summarization）方法_第3张图片

Recurrent Document Encoder $\quad$ 在文档级别，作者采用了一个循环神经网络组合句子向量序列为一个文档向量。循环神经网络作者采用的是LSTM，假设一篇文档表示为 $d=(s_1,\dots,s_m)$ ，在 $t$ 时刻隐藏层 $h_t$ 计算如下：
$\begin{bmatrix} i_t \\ f_t \\ o_t \\ \hat{c}_t \end{bmatrix}= \begin{bmatrix} \sigma \\ \sigma \\ \sigma \\ \tanh \end{bmatrix}W\cdot \begin{bmatrix} h_{t-1} \\ s_t \end{bmatrix}$

$c_t=f_t\odot c_{t-1}+i_t\odot\hat{c}_t$

$h_t=o_t\odot\tanh(c_t)$

Sentence Extractor

在标准的sequence-to-sequence模型中，注意力机制作为生成下一个输出的一个中间环节，用来决定哪一块输入区域需要更加关注。相反地，本文中的句子抽取器（sentence extractor）在读入句子之后直接抽取显著的句子，抽取器是另一个循环神经网络，用来对句子进行标注，抽取器不仅考虑了每个句子的相关性，同时也考虑句子之间的冗余性。document reader和sentence extractor的完整结构如下图所示

自动文摘（Automatic document summarization）方法综述（四）——基于神经网络的（neural summarization）方法_第4张图片

在决定下一个标注时，同时考虑文档编码和之前句子的标签。假设encoder的隐藏层状态为 $(h_1,\dots,h_m)$ ，抽取器的隐藏层状态为 $(\bar{h}_1,\dots,\bar{h}_m)$
$\bar{h}_t=LSTM(p_{t-1}s_{t-1},\bar{h}_{t-1})$

$p(y_L(t)=1|D)=\sigma(MLP(\bar{h}_t:h_t))$

其中， $M L P$ 是一个多层神经网络，输入为 $\bar{h}_t$ 和 $h_t$ 的拼接， $p_{t-1}$ 表示extractor多大程度上认为前一个句子应该被抽取。在实践中，模型的训练和测试存在一个矛盾：在训练阶段，我们知道前一个句子的真实标签 $p_{t-1}$ ，然而在测试阶段， $p_{t-1}$ 是未知的，需要预测的。这个矛盾会造成预测误差的快速积累，特别是当错误发生在标注的早期。为了解决这个问题，作者采用了curriculum learning strategy：在训练的开始时，当 $p_{t-1}$ 没有正确预测，就将其改为正确的标签。

SummaRuNNer

SummaRuNNer由Nallapati等人在AAAI 2017上提出：SummaRuNNer: A Recurrent Neural Network based Sequence Model for Extractive Summarization of Documents。该模型既包含抽取式方法（SummaRuNNer）也包含生成式方法（SummaRuNNer-abs），本博客只讨论抽取式方法（SummaRuNNer）。作者将抽取式摘要看作是一个序列分类问题，采用GRU作为基本序列分类器的基本模块，GRU是一个包含两个门的循环神经网络：更新门 $u$ 和重置门 $r$ ，公式描述如下：
$\begin{aligned} u_j&=\sigma(W_{ux}x_j+W_{uh}h_{j-1}+b_u)\\ r_j&=\sigma(W_{rx}x_j+W_{rh}h_{j-1}+b_r)\\ h_j^{'}&=\tanh(W_{hx}x_j+W_{hh}(r_j\odot h_{j-1})+b_h)\\ h_j&=(1-u_j)\odot h_j^{'}+u_j\odot h_{j-1} \end{aligned}$

其中， $W$ 和 $b$ 是GRU-RNN的参数， $h_j$ 是时刻 $t$ 的实值隐藏层向量， $x_j$ 是相应的输入向量， $\odot$ 是哈达马积（乘积）。下图展示了模型框架图：

自动文摘（Automatic document summarization）方法综述（四）——基于神经网络的（neural summarization）方法_第5张图片

模型由一个两层的bi-directional GRU-RNN组成，第一层RNN操作在单词级，计算每个单词的隐藏层状态表示；第二层RNN操作在句子级，输入为word-level层的隐藏层向量经平均池化（average pooling）、首尾拼接而成的向量，得到的隐藏层向量作为文档中句子的表示。最后，sentence-level层隐藏层向量同样先经过平均池化、首尾拼接，然后再经过一个非线性变换，最终的结果作为整个文档的表示：
$d=\tanh(W_d\frac{1}{N_d}\sum_{j=1}^{N_d}[h_j^f,h_j^b]+b)$

其中， $h_j^f$ 和 $h_j^b$ 分别代表第 $j$ 个句子的前向、后向隐藏层状态， $N_d$ 表示文档句子数目， $[]$ 表示向量拼接操作。在分类时，每个句子会按序输入分类器：
$\begin{aligned} P(y_j=1|h_j,s_j,d)=\sigma( W_ch_j&\quad\quad \#(\mathrm{content})\\ +h_j^TW_sd&\quad\quad \#(\mathrm{salience})\\ -h_j^TW_r\tanh(s_j)&\quad\quad \#(\mathrm{novelty})\\ +W_{ap}p_j^a&\quad\quad \#(\mathrm{abs.\enspace pos.\enspace imp.})\\ +W_{rp}p_j^r&\quad\quad \#(\mathrm{rel.\enspace pos.\enspace imp.})\\ +b)&\quad\quad \#(\mathrm{bias\enspace term})\\ \end{aligned}$

其中， $y_j\in \{0,1\}$ ，指示第 $j$ 个句子是否属于文摘句， $h_j$ 是sentence-level隐藏层前向、后向（ $h_j^f,h_j^b$ ）状态的拼接， $s_j$ 是摘要的动态表示，指示在第 $j$ 个句子时，目前摘要的表示，换句话说， $s_j$ 是到句子 $j - 1$ 为止，sentence-level隐藏层状态 $h_i$ 的加权求和，权重是他们相应属于摘要句的概率：
$s_j=\sum_{i=1}^{j-1}h_iP(y_i|h_i,s_i,d)$

$W_{ap}p_j^a$ 和 $W_{rp}p_j^r$ 分别表示句子 $j$ 相对于文档的绝对重要度和相对重要度， $p_j^a$ 和 $p_j^r$ 分别表示绝对位置、相对位置嵌入（position embedding），也是模型的参数。训练的目标是最小化负对数似然（negative log-likehood）：
$l(W,b)=-\sum_{d=1}^N\sum_{j=1}^{N_d}(y_j^d\log P(y_j^d=1|h_j^d,s_j^d,d_d))+(1-y_j^d)\log(1-P(y_j^d=1|h_j^d,s_j^d,d_d))$

SWAP-NET

SWAP-NET模型由Jadhav和Rajan在ACL 2018上提出：Extractive Summarization with SWAP-NET: Sentences and Words from Alternating Pointer Networks。该模型创新性的使用一个两层的pointer network建模关键词和显著句之间的相关关系，SWAP-NET既能识别显著句也能识别关键词，然后将两者结合形成抽取式摘要。在我们的常识中，显著句中通常包含关键词，因此，SWAP-NET在选择句子时考虑了关键词的作用，这在以前的工作中是没有尝试的。作者通过一个two-level的encoder-decoder建模这种相互作用，一个用于words，一个用于sentences，同时，作者采用pointer-network建模注意力机制，用于从标注数据中学习重要的词和句子。decoder采用switch mechanism选择单词或句子，最终的摘要由选择的单词和句子综合而成。

输入文档 $D$ 可以写成句子的集合 $s_1,\dots,s_N$ 或者单词的集合 $w_1,\dots,w_n$ 。假设重要单词和句子序列是 $V=v_1,\dots,v_m$ ，其中 $v_j$ 既可以是句子也可以是单词。因此，训练目标可以写作（ $M$ 是模型参数）：
$P(V|M,D)=\prod_jp(v_j|v1,\dots,v_{j-1},M,D)$

SWAP-NET中，作者采用pointer-network表示注意力机制。对于一个包含 $n$ 个向量的序列 $X=x_1,\dots,x_n$ 以及其indices序列 $R=r_1,\dots,r_m$ ， $r_i\in [1,n]$ ，pointer network是一个encoder-decoder结构，目标是最大化 $p(R|X;\theta)=\sum_{j=1}^mp_\theta(r_j|r_1,\dots,r_{j-1},X;\theta)$ ，假设encoder和decoder的隐藏层状态分别是 $(e_1,\dots,e_n)$ 和 $(d_1,\dots,d_m)$ ，attention vector在第 $j$ 次输出时计算如下：
$u_i^j=v^T\tanh(W_ee_i+W_dd_j),\enspace i\in(1,\dots,n)\\ \alpha_i^j=\mathrm{softmax}(u_i^j),\enspace i\in(1,\dots,n)$

注意力机制帮助pointer network选出输入向量中概率最高的那个，因此，在解码阶段，能够有效地pointing输入：
$p(r_j|r_1,\dots,r_{j-1},X)=\mathrm{softmax}(u^j)$

下图展示了SWAP-NET的模型架构

自动文摘（Automatic document summarization）方法综述（四）——基于神经网络的（neural summarization）方法_第6张图片

$\mathrm{EW}$ 是单词编码器， $\mathrm{ES}$ 是句子编码器， $\mathrm{DW}$ 是单词解码器， $\mathrm{DS}$ 是句子解码器，输入文档包含单词 $[w_1,\dots,w_5]$ 、句子 $s_1,s_2]$ ，目标摘要序列是 $w_2,s_1,w_5$ 。下面具体介绍每一个模块

Encoder $\quad\mathrm{EW}$ 是一个bi-directional LSTM， $\mathrm{ES}$ 是一个LSTM。在输入之前，每一个单词被表示成一个 $K$ 维向量 $x_i$ （例如：word2vec），word embedding $x_i$ 然后被BiLSTM编码成 $\mathbf{e_i}$ ，最后一个隐藏层状态被用来表示整个句子，随后被 $\mathrm{ES}$ 编码 $\mathbf{E_k}=\mathrm{LSTM}(e_{k^l},E_{k-1})$ ，其中 $k^l$ 第 $k$ 个句子的是最后一个单词的下标， $E_k$ 是第 $k$ 个隐状态。

Decoder $\quad\mathrm{DW}$ 和 $\mathrm{DS}$ 都是LSTM，每一个decoder分别对句子和单词进行pointing，因此可以认为每次decoder的输出是输入encoder的序列的一个下标。假设 $m$ 是每一个decoder的解码步骤数， $\mathrm{DS}$ 生成的下标序列为 $T_1,\dots,T_m$ ， $T_j\in \{1,\dots,N\}$ ； $\mathrm{DW}$ 生成的下标序列为 $t_1,\dots,t_m$ ， $t_j\in \{1,\dots,n\}$ 。

Networks details $\quad$ 在第 $j$ 个解码步骤，采用一个binary switch $Q_j$ 决定是选择句子还是单词， $Q_j=0$ 表示选择单词， $Q_j=1$ 表示选择句子。具体地，首先定义 $\mathbf{h_j}$ 和 $\mathbf{H_j}$ 分别表示 $D W$ 和 $D S$ 第 $j$ 个隐藏层状态：
$h_j=LSTM(h_{j-1},a_{j-1},\phi(A_{j-1}))\\ H_j=LSTM(H_{j-1},A_{j-1},\phi(a_{j-1}))$

其中， $a_j=\sum_{i=0}^n\alpha_{ij}^we_i$ ， $A_j=\sum_{k=0}^N\alpha_{kj}^sE_k$ 。 $\phi$ 表示非线性变换，作者采用的是 $\tanh$ ，用来联系word-level encodings与sentence decoder，sentence-level encodings与word decoder。

自动文摘（Automatic document summarization）方法综述（四）——基于神经网络的（neural summarization）方法_第7张图片

第 $j$ 个解码步骤的switch概率 $p(Q_j|v_{<j},D)$ 计算概率如下：
$\begin{aligned} p(Q_j=1|v_{<j},D)&=\sigma(w_Q^T(H_{j-1},A_{j-1},\phi(h_{j-1},a_{j-1})))\\ p(Q_j=0|v_{<j},D)&=1-p(Q_j=1|v_{<j},D) \end{aligned}$

其中， $w_Q$ 是模型参数， $\sigma$ 是sigmoid函数， $\phi$ 是 $\tanh$ 函数。然后定义 $\alpha_{kj}^s=p(T_j=k|v_{<j},Q_j=1,D)$ 表示在第 $j$ 个解码步骤选择第 $k$ 个句子的概率， $\alpha_{ij}^w=p(t_j=i|v_{<j},Q_j=0,D)$ 表示在第 $j$ 个解码步骤选择第 $i$ 个单词的概率，计算公式分别如下：

$\alpha_{ij}^w=\mathrm{softmax}(v_t^T\phi(w_hh_j+w_te_i))\\ \alpha_{kj}^s=\mathrm{softmax}(V_T^T\phi(W_HH_j+W_TE_k))$

$v_t,w_h,w_t,V_T,W_H,W_T$ 是模型参数，最后， $v_j$ 由如下公式确定：
$v_j = \begin{cases} k=\arg \max_kp_{kj}^s &\text{if } \max_kp_{kj}^s>\max_ip_{ij}^w \\ i=\arg\max_ip_{ij}^w &\text{if } \max_ip_{ij}^w>\max_kp_{kj}^s \end{cases}$

$p_{kj}^s=\alpha_{kj}^sp(Q_j=1|v_{<j},D),\\ p_{ij}^w=\alpha_{ij}^wp(Q_j=0|v_{<j},D).$

损失函数定义为：
$l_j=-\log(p_{kj}^sq_j^s+p_{ij}^wq_j^w)-\log p(Q_j|v_{<j},D)$

在每一个解码步骤中，如果第 $j$ 个输出是单词，则 $q_j^w=1,q_j^s=0$ ；如果第 $j$ 个输出是句子，则 $q_j^w=0,q_j^s=1$ 。最终的摘要是由句子组成，因此需要确定每个句子的重要度：
$I(s_k)=\alpha_{kj}^s+\lambda\sum_{w_i\in s_k}\alpha_{il}^w$

在实验中，作者将 $\lambda$ 设置为1，最终的摘要由三句得分最高的句子组成。

NEUSUM

该模型同样发表在ACL 2018：Neural Document Summarization by Jointly Learning to Score and Select Sentences。句子打分和句子抽取是抽取式文摘系统的两个主要步骤，传统的方法将这两个过程独立开来，分别考虑。这篇论文中，作者提出了一个端到端（end-to-end）的神经网络框架联合学习句子打分和句子抽取。首先通过一个多层encoder得到句子表示，然后sentence extractor逐一抽取摘要句。抽取过程中，sentence extractor读入最新被抽取的句子，产生一个新的句子抽取状态，以此作为剩余句子的相对重要度得分。

对于包含 $L$ 个句子的文档 $\mathcal{D}=(S_1,S_2,\dots,S_L)$ ，抽取式摘要试图找出 $\mathcal{D}$ 的一个子集 $\mathcal{S}=\{\hat{S}_i|\hat{S}_i\in \mathcal{D}\}$ 作为摘要。在训练阶段，参考摘要 $\mathcal{S}^*$ 以及摘要 $\mathcal{S}$ 相对于评估函数 $r(\cdot)$ 的得分 $r(\mathcal{S}|\mathcal{S}^*)$ 是已知的。训练目标是学习一个打分函数 $f(\mathcal{S})$ 能够在测试阶段找出最佳摘要：
$\begin{aligned} \arg \max_{\mathcal{S}}&\quad f(\mathcal{S})\\ s.t.&\quad \mathcal{S}=\{\hat{S}_i|\hat{S}_i\in \mathcal{D}\}\\ &\quad |\mathcal{S}|\leq l. \end{aligned}$

其中， $l$ 是输出摘要的长度限制。在之前state-of-the-art的工作中，句子抽取策略主要是 $\text{MMR}$ 和 $\text{ILP}$ 。论文中，作者借用 $\text{MMR}$ 的思想：在给定已抽取句子的情况下，选择能最大化相对收益的句子。因此，模型训练的目标就是学得这个收益打分函数。更进一步，作者采用 $\text{ROUGE F1}$ 作为评估函数 $r(\cdot)$ ，因此，模型需要学得 $\text{ROUGE F1}$ 收益：
$g(S_t|\Bbb{S}_{t-1})=r(\Bbb{S}_{t-1}\cup{S_t})-r(\Bbb{S}_{t-1})$

其中， $\Bbb{S}_{t-1}$ 是已经选择的句子集合，省略了 $r(\cdot)$ 中的条件 $\mathcal{S*}$ 。在每一个时刻 $t$ ，摘要系统选择能最大化 $\text{ROUGE F1}$ 收益的句子，直至达到句子数目限制。下图展示了NEUSUM的架构：

自动文摘（Automatic document summarization）方法综述（四）——基于神经网络的（neural summarization）方法_第8张图片

Document Encoding $\quad$ 作者采用一个层次化文档编码器表示文档中的句子，分为sentence-level encoding和document-level encoding。sentence-level encoding读取第 $j$ 个输入句子 $S_j=(x_1^{(j)},\dots,x_{n_j}^{(j)})$ ，采用BiGRU得到句子表示 $\widetilde{s}_j$ ，其中GRU定义如下：
$\begin{aligned} z_i&=\sigma(W_z[x_i,h_{i-1}])\\ r_i&=\sigma(W_r[x_i,h_{i-1}])\\ \widetilde{h}_i&=\tanh(W_h[x_i,r_i\odot h_{i-1}])\\ h_i&=(1-z_i)\odot h_{i-1}+z_i\odot \widetilde{h}_i \end{aligned}$

$W_z,W_r,W_h$ 是权值矩阵。BiGRU由一个前向GRU和一个反向GRU组成，前向GRU从左向右读入word embedding，得到隐状态序列 $(\overrightarrow{h}_1^{(j)},\dots,\overrightarrow{h}_{n_j}^{(j)})$ ；反向GRU从右向左读入word embedding，得到另一个隐状态序列 $(\overleftarrow{h}_1^{(j)},\dots,\overleftarrow{h}_{n_j}^{(j)})$ ：
$\overrightarrow{h}_i^{(j)}=GRU(x_i^{(j)},\overrightarrow{h}_{i-1}^{(j)})\\ \overleftarrow{h}_i^{(j)}=GRU(x_i^{(j)},\overleftarrow{h}_{i+1}^{(j)})\\$

sentence level表示 $\widetilde{s}_j$ 是最后一个前向GRU与最后一个反向GRU隐状态的拼接：
$\widetilde{s}_j=\begin{bmatrix} \overrightarrow{h}_1^{(j)} \\ \overleftarrow{h}_{n_j}^{(j)} \end{bmatrix}$

同样，document level encoder采用另一个BiGRU，输入为 $(\widetilde{s}_1,\dots,\widetilde{s}_{L})$ ，前向GRU和反向GRU分别得到两个因状态序列 $(\overrightarrow{s}_1,\dots,\overrightarrow{s}_L)$ 、 $(\overleftarrow{s}_1,\dots,\overleftarrow{s}_L)$ ，document level表示 $s_i$ 同上：
${s}_i=\begin{bmatrix} \overrightarrow{s}_i \\ \overleftarrow{s}_j \end{bmatrix}$

Joint Sentence Scoring and Selection $\quad$ 给定前一个选择句子 $\hat{S}_{t-1}$ ，sentence extractor通过给剩余句子打分的形式决定下一个要选择的句子 $\hat{S}_t$ 。在对句子打分时，同时考虑其重要度和已经输出的摘要。因此，作者采用另一个GRU作为recurrent unit用来记住已经输出的摘要，采用一个多层感知机（MLP）对句子打分。具体来说，GRU接受前一个选择的句子 $\hat{S}_{t-1}$ 的document level表示 $s_{t-1}$ 作为输入，产生当前隐藏层状态 $h_t$ 。句子打分器是一个两层的MLP，输入是当前隐藏层状态 $h_t$ 以及 $s_i$ ，输出是 $S_i$ 的得分 $\delta(S_i)$ 。
$h_t=GRU(s_{t-1},h_{t-1})\\ \delta(S_i)=W_s\tanh(W_qh_t+W_ds_i)$

其中， $W_s,W_q,W_d$ 是网络参数，当选择第一个句子时，作者对GRU隐藏层状态 $h_0初始化如下$ ：
$\begin{aligned} h_0&=\tanh(Wm\overleftarrow{s}_1+b_m)\\ S_0&=\text{\O}\\ s_0&=\bf{0} \end{aligned}$

对所有句子打分完成后，选择收益值最大的那个：
$\hat{S}_t=\arg\max_{S_i\in \mathcal{D}}\delta(S_i)$

Objective Function $\quad$ 作者采用最优化模型预测 $P$ 与标注训练数据 $Q$ 之间的KL-散度。首先对 $\delta(S_i)$ 归一化得到预测分布 $P$ :
$P(\hat{S}_t=S_i)=\frac{\exp(\delta(S_i))}{\sum_{k=1}^L\exp(\delta(S_i))}$

考虑到标注数据中 $\mathcal{F1}$ 收益值可能是负值，作者采用 $M i n - M a x N o r m a l i z a t i o n$ 将收益值调整到 $[0, 1]$ ：
$g(S_i)=r(\Bbb{S}_{t-1}\cup \{S_i\})-r(\Bbb{S}_{t-1})\\ \widetilde{g}(S_i)=\frac{g(S_i)-\min(g(S))}{\max(g(S))-\min(g(S))}$

然后采用一个附加temperature $\tau$ 的 $\mathrm{softmax}$ 操作生成标注数据的分布 $Q$ 作为训练目标，tempature $\tau$ 是一个平滑因子
$Q(S_i)=\frac{\exp(\tau\widetilde{g}(S_i))}{\sum_{k=1}^L\exp(\tau\widetilde{g}(S_i))}$

因此，最小化 $K L$ 损失函数 $J$ ：
$J=D_{KL}(P||Q)$

总结

基于neural document model的方法，通常将摘要任务看作是一个序列标注问题，采用seq2seq的模式进行求解，首先采用 $(B i) L S T M$ 、 $(B i) G R U$ 循环神经网络或者 $C N N$ 等对句子编码，得到document-level的句子表示，然后同样采用 $R N N$ 进行句子抽取（输出该句子是否属于文摘句），在解码过程中通常也会加入注意力机制。

参考文献

[1] An Unsupervised Multi-Document Summarization Framework Based on Neural Document Model.
[2] Neural Summarization by Extracting Sentences and Words.
[3] SummaRuNNer: A Recurrent Neural Network based Sequence Model for Extractive Summarization of Documents.
[4] Extractive Summarization with SWAP-NET: Sentences and Words from Alternating Pointer Networks.
[5] Neural Document Summarization by Jointly Learning to Score and Select Sentences.

【自学笔记】Linux基础知识点总览-持续更新 Long_poem 笔记 linux 运维
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Linux基础知识点总览目录Linux简介文件和目录结构常用命令文件操作目录操作权限管理文本处理Shell脚本基础进程管理用户和组管理网络配置总结Linux基础知识点总览目录Linux简介文件和目录结构常用命令文件操作目录操作权限管理文本处理Shell脚本基础进程管理用户和组管理网络配置Linux简介Linux是一个基于Uni
LLM：软件测试的颠覆性力量 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LLM：软件测试的颠覆性力量关键词：大语言模型（LLM）、软件测试、人工智能、测试自动化、测试效率、质量保证、测试革新1.背景介绍在当今快速发展的软件行业中，测试一直是确保产品质量的关键环节。随着人工智能技术的飞速进步，特别是大语言模型（LargeLanguageModels，简称LLM）的出现，软件测试领域正经历着前所未有的变革。LLM凭借其强大的自然语言处理能力和广泛的知识储备，正在重塑我们对
卷积神经网络Batch Normalization的作用 arron8899 cnn batch 人工智能
BatchNormalization的作用（通俗版）1.像“稳定器”一样校准每层输入想象你在烤多层蛋糕，每层蛋糕的烘烤温度不同（相当于神经网络的每一层数据分布不同）。没有BN时，烤箱温度忽高忽低，导致有的层烤焦（梯度爆炸），有的层不熟（梯度消失）。BN的作用相当于给每一层装了一个自动温度调节器，实时将输入数据调整到标准温度（均值为0，方差为1），保证每层都能均匀受热，训练更稳定。2.让模型训练“少
使用Dall-E生成图像：文本到图像的魔力 shuoac 计算机视觉人工智能 python
使用Dall-E生成图像：文本到图像的魔力技术背景介绍Dall-E是OpenAI开发的一个强大的文本到图像生成模型，它能够根据自然语言描述创造出全新的数字图像。这一技术基于深度学习的方法，使得创意与AI图像生成的结合更具可能性。本文将介绍如何调用Dall-EAPI来生成图像，从而使开发者能够将这一技术应用到自己的项目中。核心原理解析Dall-E利用大型语言模型（LLM）从用户提供的文本描述中提取详
深入了解盘古大模型：技术、应用与未来 Hardess-god Literature review 人工智能
随着人工智能技术的迅猛发展，预训练大模型已成为AI领域最前沿、最热门的研究方向之一。近年来，中国自主研发的大模型之一——盘古模型（PanGuModel）逐渐进入公众视野，凭借其强大的性能和广泛的应用前景，引发了行业内外的广泛关注。什么是盘古大模型？盘古大模型是华为公司联合多家科研机构共同研发的超大规模预训练语言模型。该模型以中文数据为主进行训练，旨在推动中文自然语言处理（NLP）以及跨模态应用的技
【从零开始学习计算机科学】软件测试（三）回归测试、系统测试与验收测试贫苦游商学习软件测试回归测试系统测试验收测试测试工具 ab测试
【从零开始学习计算机科学】软件测试（三）回归测试、系统测试与验收测试回归测试回归测试的组织和实施回归测试集回归测试的范围自动回归测试框架自动回归测试框架的技术特点回归测试克服的几个问题回归测试人员应掌握的测试手段回归用例库的维护系统测试系统测试的组织和分工系统测试的过程系统测试方法用户界面测试用户界面测试-符合标准和规范用户界面测试-一致性用户界面测试-直观性用户界面测试-灵活性用户界面测试-舒适
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。 985小水博一枚呀深度学习人工智能
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。文章目录【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。1.滑坡灾害早期隐患的概念与特征概念主要特征2.通过光学
人工智能 - 通用 AI Agent 之 LangManus、Manus、OpenManus 和 OWL 技术选型天机️灵韵具身智能人工智能人工智能具身智能智能体
一、核心项目概览1.Manus（闭源通用AIAgent）定位：全球首个全流程自动化通用AIAgent，GAIA基准测试SOTA水平。核心能力：全流程自动化：从任务规划（如撰写报告）到执行（代码生成、表格制作）的端到端处理。智能纠错机制：基于沙箱环境的实时错误反思与调整（类似CodeAct技术）。云端依赖：需联网运行，集成浏览器操作、信息检索等工具。局限性：闭源且采用邀请制，二手市场邀请码溢价至数万
《自动化开发之路：使用 Jenkins、GitLab CI 与 GitHub Actions 构建高效 CI/CD 流水线》清水白石008 python Python题库自动化 jenkins gitlab
《自动化开发之路：使用Jenkins、GitLabCI与GitHubActions构建高效CI/CD流水线》前言在现代软件开发中，持续集成（CI）与持续部署/交付（CD）已成为必不可少的实践。构建自动化流水线不仅可以加快开发迭代速度，还能显著提升代码质量，降低手工操作所带来的风险。在这篇文章中，我们将探讨如何利用三种主流工具——Jenkins、GitLabCI以及GitHubActions，实现从
HarmonyOS5开发：手把手教你用 Ark-TS UI 做一个会 “动” 的计数器：从代码到原理全解析 harmonyos-next
今天咱们用鸿蒙5的Ark-TSUI做一个简单又有趣的计数器应用。点击按钮数字就会增加，而且界面还能自动更新。通过这个案例，你能轻松理解Ark-TSUI的核心玩法。一、最终效果长什么样？打开应用，你会看到一个大按钮，上面写着“点击加1”。每次点击按钮，按钮上方的数字就会变大。比如第一次点击变成“1”，第二次变成“2”，依此类推。整个过程不需要手动刷新页面，数字会自动变化。二、完整代码长这样types
NLP高频面试题（七）——GPT和Bert的mask有什么区别？ Chaos_Wang_ NLP常见面试题自然语言处理 gpt bert
GPT和BERT的Mask机制对比：核心区别与优化策略在NLP领域，GPT和BERT是最具代表性的预训练语言模型之一。它们都在训练过程中使用了Mask机制来引导模型学习语言表示，但具体实现方式和目标却有所不同。本文将深入探讨GPT和BERT的Mask方法的核心区别，并分析其优化策略。1.BERT的Mask机制：基于MLM（MaskedLanguageModel）BERT（Bidirectional
【MySQL】事务熬夜超级玩家 MySQL数据库 mysql android 数据库
目录基本概念事务操作自动提交事务开启事务提交事务回滚事务代码示例事务的特性ACID事务的隔离级别读未提交readuncommitted读已提交readcommitted可重复读repeatableread序列化（串行）serializable操作示例基本概念在MySQL中的事务（Transaction）是由存储引擎实现的，在MySQL中，只有InnoDB存储引擎才支持事务事务处理可以用来维护数据库
知识图谱中NLP新技术魔王阿卡纳兹知识图谱入门大数据治理与分析知识图谱自然语言处理人工智能
知识图谱与自然语言处理（NLP）的结合是当前人工智能领域的前沿方向，其技术发展呈现多维度融合与场景深化的特点。以下从核心技术突破、应用场景创新及未来趋势三个层面，系统梳理知识图谱中NLP的最新进展：一、核心技术突破基于预训练模型的图谱构建与增强预训练语言模型与知识嵌入融合：以BERT、KEPLER为代表的模型通过联合优化知识嵌入（KE）和语言建模目标，将知识图谱中的结构化知识融入预训练过程，显著提
微软 LIDA 库：基于大模型的自动化数据分析与可视化窝窝和牛牛 microsoft 数据分析
微软LIDA库：基于大模型的自动化数据分析与可视化一、核心架构与LLM交互流程调用LLM生成数据摘要基于LLM推理分析目标LLM生成可视化代码结合图像生成模型优化原始数据Summarizer模块结构化摘要GoalExplorer模块可视化目标列表VizGenerator模块可执行图表代码Infographer模块风格化信息图表二、LLM交互核心功能1.多模型支持架构兼容主流LLM服务商：通过统一接
4（四） Jmeter自动化报表html生成夜晚打字声工具 jmeter 自动化运维
从JMeter3.0开始已支持自动生成动态报告，我们可以更容易根据生成的报告来完成我们的性能测试报告。如何生成html测试报告如果未生成结果文件（.jtl）,可运行如下命令生成报告:jmeter-n-ttest.jmx-lresult.jtl-e-o/tmp/ResultReport参数:-n：以非GUI形式运行Jmeter-t：source.jmx脚本路径-l：运行结果保存路径（.jtl）,此文
Nginx负载均衡策略详解：从轮询到智能分发，打造高可用服务架构 egzosn nginx 负载均衡架构运维
Nginx负载均衡策略详解：从轮询到智能分发，打造高可用服务架构一、负载均衡的核心价值当单台服务器无法承载高并发流量时，负载均衡通过将请求分发到多台服务器，实现：横向扩展：突破单机性能瓶颈故障隔离：自动剔除异常节点动态调度：根据策略优化资源利用率二、Nginx原生负载均衡策略1.轮询(RoundRobin)配置示例：upstreambackend{server192.168.1.10:8080;s
Shell 脚本：自动化运维的利器 Waitccy linux 服务器运维
Shell脚本：自动化运维的利器一、引言在计算机的世界里，效率就是一切。当我们需要频繁执行一系列命令时，手动输入不仅繁琐，还容易出错。Shell脚本就是为解决这类问题而生的强大工具。它允许用户将一系列的命令组合在一起，形成一个可执行的脚本文件，从而实现自动化任务，提高工作效率。无论是系统管理员进行服务器维护，还是开发者进行项目部署，Shell脚本都发挥着重要的作用。本文将详细介绍Shell脚本的基
给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
解析大模型归一化：提升训练稳定性和性能的关键技术秋声studio 口语化解析深度学习人工智能大模型归一化
引言在深度学习领域，特别是在处理大型神经网络模型时，归一化（Normalization）是一项至关重要的技术。它可以提高模型的训练稳定性和性能，在加速收敛方面发挥了重要作用。本文将深入探讨大模型归一化的原理、常见方法及其应用场景，并结合实际案例和代码示例进行说明。一、归一化的作用与理论基础归一化的主要目的是为了提高模型的训练稳定性和性能。具体来说，归一化有以下几个关键作用：提高训练稳定性：在神经网
Python 应用部署云端实战指南 —— AWS、Google Cloud 与 Azure 全解析清水白石008 python Python题库 python aws azure
Python应用部署云端实战指南——AWS、GoogleCloud与Azure全解析在当下云计算飞速发展的时代，将Python应用部署到云平台已成为大多数开发者和企业的首选。无论是构建Web服务、API接口，还是自动化任务调度，云平台都能为我们提供高可靠性、弹性伸缩与简便管理的优势。本文将详细阐述如何将Python应用分别部署到AWS、GoogleCloud与Azure，并介绍各平台下涉及的部署工
C++基础系列【26】排序和查找算法程序喵大人 C++基础系列 c语言算法开发语言 c++
博主介绍：程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/音视频/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章，首发gzh，见文末记得订阅专栏，以防走丢C++基础系列专栏C语言基础系列专栏C++大佬养成攻略专栏C++训练营排序与查找算法的重要性不用过多介绍了吧，面试也经常考察。
探索安全的开发之路：Eclipse Steady深度揭秘尚竹兴
探索安全的开发之路：EclipseSteady深度揭秘steadyEclipseSteady:这是一个开源的持续集成和持续部署工具，用于自动化软件的开发和部署过程。它提供了一个基于Web的界面，用于创建和管理软件项目的构建和部署流程。适合用于需要自动化软件开发和部署的开发团队。特点包括简单易用、丰富的插件生态系统和与Maven和Jenkins的紧密集成。项目地址:https://gitcode.c
使用 Selenium 控制现有 Edge 窗口以规避爬虫检测秋叶原の黑猫数据库
在网络爬虫开发中，网站的防爬机制常常会检测自动化工具（如Selenium）启动的浏览器实例。为了绕过这种检测，一种有效的方法是利用Selenium连接到手动打开的现有浏览器窗口，而不是每次都启动一个新的实例。本文将详细介绍如何使用Selenium控制现有的MicrosoftEdge浏览器窗口，并结合代码示例展示实现过程。1.背景介绍：为什么需要控制现有窗口？传统的Selenium脚本会通过WebD
一篇文章带你了解-selenium工作原理详解程序员笑笑软件测试 selenium 测试工具软件测试自动化测试功能测试程序人生职场和发展
前言Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7,8,9,10,11），MozillaFirefox，Safari，GoogleChrome，Opera等。主要功能包括：测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能
《Python实战进阶》No28: 使用 Paramiko 实现远程服务器管理带娃的IT创业者 Python实战进阶 python 服务器开发语言
No28:使用Paramiko实现远程服务器管理摘要在现代开发与运维中，远程服务器管理是必不可少的一环。通过SSH协议，我们可以安全地连接到远程服务器并执行各种操作。Python的Paramiko模块是一个强大的工具，能够帮助我们实现自动化任务，如代码部署、批量命令执行和文件传输。本集将深入讲解Paramiko的核心功能，并通过实战案例展示如何高效管理远程服务器。核心概念和知识点SSH协议的基本原
Selenium工作原理详解天才测试猿 selenium 测试工具自动化测试软件测试测试用例 python 职场和发展
Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7,8,9,10,11），MozillaFirefox，Safari，GoogleChrome，Opera等。主要功能包括：测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用
深入解析深度学习中的过拟合与欠拟合诊断、解决与工程实践古月居GYH 深度学习人工智能
一、引言：模型泛化能力的核心挑战在深度学习模型开发中，欠拟合与过拟合是影响泛化能力的两个核心矛盾。据GoogleBrain研究统计，工业级深度学习项目中有63%的失败案例与这两个问题直接相关。本文将从基础概念到工程实践，系统解析其本质特征、诊断方法及解决方案，并辅以可复现的代码案例。二、核心概念与通熟易懂解释简单而言，欠拟合是指模型不能在训练集上获得足够低的误差。换句换说，就是模型复杂度低，模型在
新书速览|云原生Kubernetes自动化运维实践全栈开发圈云原生运维 kubernetes
《云原生Kubernetes自动化运维实践》本书内容：《云原生Kubernetes自动化运维实践》以一名大型企业集群运维工程师的实战经验为基础，全面系统地阐述Kubernetes（K8s）在自动化运维领域的技术应用。《云原生Kubernetes自动化运维实践》共16章，内容由浅入深，逐步揭示K8s的原理及实际操作技巧。第1章引领读者踏入Kubernetes的世界，详细介绍其起源、核心组件的概念以及
GitLab：构建自动化流水线教程_2024-07-18_02-20-35.Tex chenjj4003 游戏开发 gitlab 自动化运维 github 安全 git elasticsearch
GitLab：构建自动化流水线教程GitLab基础介绍GitLab的历史与发展GitLab是一个开源的版本控制系统，最初由乌克兰开发者DmitriyZaporozhets和ValerySizov在2011年创建。它最初是作为GitHub的替代品而设计的，旨在提供一个自我托管的Git仓库管理解决方案。随着时间的推移，GitLab不断发展，引入了持续集成/持续部署（CI/CD）功能，使其成为一个全面的
行业分析---小米汽车2024全年财报智能汽车人人工智能行业研究汽车自动驾驶
1背景其实，关于小米汽车，笔者之前已经多次介绍过了，包括小米汽车成功的原因、智驾进展以及雷军个人的魅力，见博客《自动驾驶---小米汽车智驾进展》和《微自传系列---雷军》。小米汽车取得的成绩，出乎很多人的意料，其它新势力车企花了5---10年的时间，小米汽车三年就成功造出了第一辆车，在小米SU7月销2万+的同时，获得了非常不错的口碑。并且在刚刚发布的财报中，小米汽车在第一个完整财年的财务表现也是相
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$