CNN Basic Model

卷积层

扩充输入层维度，引入新特征

值最大代表只保留这些特征中最强的，而抛弃其它弱的此类特征。
优点：

MaxPooling 能减少模型参数数量，有利于减少模型过拟合问题。
对于NLP任务来说，Max Pooling 有个好处：可以把变长的输入X整理成固定长度的输入。
缺点：
Max Pooling 基本抛弃位置信息。但在 NLP 的应用场合中，特征出现的位置信息是很重要的（比如主语出现位置一般在句子头，宾语一般出现在句子尾等等，这些位置信息对于分类任务来说还是很重要的）。
有时候有些强特征会出现多次，Pooling 只保留一个最大值，所以即使某个特征出现多次，现在也只能看到一次，就是说同一特征的强度信息丢失了。

K-Max Pooling可以取所有特征值中得分在 Top–K 的值，并保留这些特征值原始的先后顺序。

把某个Filter对应的Convolution层的所有特征向量进行分段，切割成若干段后，在每个分段里面各自取得一个最大特征值。

Chunk-Max Pooling 保留了多个局部Max特征值的相对顺序信息，尽管并没有保留绝对位置信息，但是因为是先划分Chunk再分别取Max值的，所以保留了比较粗粒度的模糊的位置信息；
如果多次出现强特征，则也可以捕获特征强度。
Event Extraction via Dynamic Multi-Pooling Convolutional Neural Networks
Local Translation Prediction with Global Sentence Representation

分类所需要的关键特征的位置信息很重要，那么类似Chunk-Max Pooling这种能够粗粒度保留位置信息的机制应该能够对分类性能有一定程度的提升作用。比如情感分析。