CaptainSG

NLP-基础知识问题汇总

问答题汇总

作业题1: 画出Transformer的结构图,

1: 按照你的理解讲一下原理
transformer是seq2seq的结构，通过输入一组源数据和与之匹配对应的目标数据，通过多头注意力机制，前馈全联阶层等结构，对模型进行训练。
2: 为什么self-attention可以替代seq2seq?
解码端能有效聚焦编码器的输出结果，改善编码器输出是单一定长张量；编码器端相当于是个特征提取的过程；

作业题2: 机器翻译中的Attention机制中, 如何理解Q, K, V? 分别代表什么, 如何起作用?

Attention: 给出数据，关注里面的关键信息配置不同权重得出最终比较好的结果
Q：最初的文本，也就是embedding后的文本向量
K：文本的关键信息
V: 经过处理后精炼出来的文本信息

3.fasttext:

3.1谈一谈对fasttext的认识, 能做什么? 原理是什么? 相比于word2vec有什么优势?

fasttext是NLP领域常用的工具包，可以进行文本分类和训练词向量；
原理：
1. fastText是一种基于skip-gram模型的新扩展，它会使用subword的信息，将每个词被表示成一个字符级n-gram词袋(a bag of character n-grams)。每个向量表示与每个字符级n-gram相关联，而词(word)则可以看成是这些n-gram向量表示的求和(sum)。
  1. n-gram：按照字节顺序进行大小为n的窗口滑动操作，形成n长度字节片段的序列；
  2. fasttext模型包括输入层，隐含层，输出层；输入是多个经向量表示的单词输出是分类任务，隐含层是对多个词向量的叠加平均
  3. 多层softmax线性多分类
优势：
- 使用词embedding而非词本身作为特征；
- 字符的n-gram特征引入对分类效果会有些提升
- word2vec是基于词汇的，每个单词生成一个向量，忽视单词的形态特征；fasttext采用的n-gram是基于字符来生成向量的，
  1. 对于低频词汇生成的词汇向量效果会更好，n-gram可以在不同的词语之间共享；
  2. 训练词库之外的单词，仍然可以构建它们的词向量
- 训练速度快于word2vec

3.2: 为什么要用fasttext做文本分类? 是因为训练快还是预测快? 还有什么其他原因?

使用方便
训练速度和预测数度都很快
对于低频词汇生成的词汇向量效果会更好，n-gram可以在不同的词语之间共享

4.词向量

1: 词向量都有哪些表示方法?
2: 经典的方法 or 你自己理解的方法是如何训练词向量的? (尽量详细描述, 甚至于需要哪些超参数的设置, 以及设置多少, 为什么这样设置?)
3: 这种训练是有监督还是无监督, 如何理解?
4: 训练好的词向量如何评价? (大胆的说出你的想法)
5: 你的方法可以解决一词多义的问题吗? (苹果, 杯具), 如果能为什么? 如果不能有何改进方法?

5. 神经网络的训练中如何判断过拟合?如果防止过拟合, 都有哪些办法?请详细说明。

1.神经网络训练结果，在训练集上效果比较好，准确率高，损失小，但是在验证集上效果比较差，这时就是过拟合；
2. 解决方法：
（1）进行数据增强：通过对训练数据进行增强处理，NLP上有回译，cv上有图像旋转等
（2）正则化：由于模型过拟合可能是模型过于复杂，在模型训练的时候，添加正则化惩罚项；
L1正则化：L2正则化
（3）dropout：通过让部分神经元失活，减弱神经元之间的协同作用，通过限制神经元活性，减弱神经元之间的拟合程度
（4）早停：观察在验证集上的训练结果，当在验证集上结果不再下降，提前中止模型训练
（5）丰富样本，提高样本数量

6。CRF和HMM的对比

1: 各自有哪些假设?
- HMM：齐次马尔科夫链假设：任意状态的隐藏状态只依赖于它前一个隐藏状态
  
  观测独立性假设：任意时刻的观测状态只依赖于当前时刻的隐藏状态
- CRF：数据独立同分布，齐次马尔科夫假设
  
  条件概率，词性序列中，部分词性出现次数为1，假定动词或者副词后不会再次出现动词或者副词
2: 两者有什么区别?
- HMM是生成式，HMM能使用的前提是基于两个假设；HMM模型中当前输出只依赖于当前标签，当前标签只依赖于上一个标签
- CRF是判别式， CRF也采用了齐次马尔科夫假设，但是CRF采用了全局特征，把观测序列当作整体
3: 描述一下CRF在预测过程中用到了哪个算法?以及具体的算法过程?
- 维特比算法：
  - 1。初始化局部状态
  - 2。动态规划递推后续时刻的局部状态
  - 3。计算目标时刻最大的隐藏状态序列出现的概率，
  - 4。利用局部状态回shuo
    维特比

7。说一说对自动超参数调优方法的理解。

网格搜索：网格搜索是超参数调优中的一个方法。根据经验确定一系列超参数的值，通过对不同超参数设定不同的组合，获得不同的结果；

优点：搜索效果好

缺点：速度慢，需要较大的算力和空间
随机搜索：搜索并尝试所有参数值，从指定的分布中采样固定数量的参数设置

优点：速度快些

缺点：结果最优无法保证
贝叶斯优化：

给定优化的目标函数(广义的函数，只需指定输入和输出即可，无需知道内部结构以及数学性质)，通过不断地添加样本点来更新目标函数的后验分布(高斯过程,直到后验分布基本贴合于真实分布。简单的说，就是考虑了上一次参数的信息，从而更好的调整当前的参数。

与网格搜索与随机搜索相比：
1. 贝叶斯调参采用高斯过程，考虑之前的参数信息，不断地更新先验；网格搜索未考虑之前的参数信息。
2. 贝叶斯调参迭代次数少，速度快；网格搜索速度慢,参数多时易导致维度爆炸。
3. 贝叶斯调参针对非凸问题依然稳健；网格搜索针对非凸问题易得到局部优最。

8. 说一说你个人在某个模型训练过程中遇到的难题，如何解决和调优的?

模型训练参数维度不匹配，解决：通过进行模型从输入到输出进行维度分析，查找代码出错的地方。

9.如何设计一个"猜你喜欢"的推荐系统?

推荐系统的模块如下
1. 用户行为日志：记录用户行为，属于数据统计
2. 数据ETL-1：将用户日志转换为推荐算法所需要的数据格式。对原始的用户行为等数据进行清洗、加工，如字段、属性、格式化等，作为下一步推荐算法的输入。
3. 推荐算法：是个性化推荐最主要的部分，包括通过用户行为计算相关内容以及推荐结果等。
4. 数据ETL-2: 将推荐算法得到的结果进一步加工为存储模块的输入数据。对推荐算法产生的结果进行清洗、格式化等，作为下一步存储模块的输入。
5. 用户画像存储：存储用户的偏好以及行为数据，如对内容关键字的偏好、点击过哪些内容等。
  - 存储用户的偏好以及行为数据等信息。对于偏好，采用标签量化来表示，是一种随着时间衰减的值。对于用户画像，是批量写入、实时读取，所以存储要着重考虑读的性能。可以选择使用Redis集群作为技术方案，能够最大满足读的性能，缺点是Redis的成本昂贵且不支持auto index。也可使用Hbase作为存储，使用ElasricSearch构建二级索引，以应对根据多种维度聚集用户的需求(比如过滤某一个标签下的所有用户)。
6. 推荐结果存储：存储各种推荐算法产生的推荐结果，可以分为两部分：{用户 : itemList}推荐结果，为用户推荐的内容列表；{item : itemList}推荐结果，与item相关的内容列表。
  - 对各种推荐算法计算出的推荐结果的存储。存储空间要求大，格式复杂。对于存储的容量和读写性能要求都比较高。可以选择使用Redis集群作为此部分的存储方案。
7. 服务调用模块：整合推荐结构，对外提供提供推荐的调用接口。
用户行为日志接入：

在线业务系统的日志接入数据高速公路，再由数据高速公路迅速运转到离线数据处理平台和在线流计算平台；离线数据处理平台周期性地以批处理方式加工过去一段时间的数据，得到人群标签和其他模型参数，存放在高速缓存中，供在线业务系统使用，与此同时，在线流计算平台实时对线上的日志数据做处理，对离线计算出的数据进行补充、修正等；在线业务系统综合离线特征和在线特征使用一定的逻辑得到输出供业务使用，产生的日志流入数据高速公路。

10.说一说最近看过的一篇论文谈谈从论文中得到的收获, 以及从论文给你的启发是否可以应用到你曾经做过的项目中? (如果最近没看标准论文, 可以用看博客, 知乎的帖子, 学习了新知识来代替)

fasttext工具

以前的认知：
- 作用：文本分类，训练词向量
- 使用方法：分类时调用工具包中的train_supervised方法，指定符合要求的输入文本即可
  
  可以通过设定学习率lr，批次大小epoch， wordngram， softmax层的结构loss,
  
  也可以通过autotuneValidationFile实现参数自动调优
  
  训练词向量：调用train_unsupervised方法，通过输入词嵌入维度dim，训练模式cbow或者skipgram选择不同的模式，循环次数和学习率等超参数进行
最近作业时看了fasttext有关的内容，对该工具有了更多的认识

模型架构：与CBOW相似，不同的时fasttext预测的是标签，而cbow预测的是中间词,fastText模型架构:其中x1,x2,…,xN−1,xN表示一个文本中的n-gram向量，每个特征是词向量的平均值。这和前文中提到的cbow相似，cbow用上下文去预测中心词，而此处用全部的n-gram去预测指定类别

层次softmax: 在标准的softmax中，计算一个类别的softmax概率时，我们需要对所有类别概率做归一化，在这类别很大情况下非常耗时，因此提出了分层softmax(Hierarchical Softmax),思想是根据类别的频率构造霍夫曼树来代替标准softmax，通过分层softmax可以将复杂度从N降低到logN，
n-gram特征：n-gram是基于语言模型的算法，基本思想是将文本内容按照字节顺序进行大小为N的窗口滑动操作，最终形成窗口为N的字节片段序列。

1.为罕见的单词生成更好的单词向量：根据上面的字符级别的n-gram来说，即是这个单词出现的次数少，但是组成单词的字符和其他单词有共享的部分，因此这一点可以优化生成的单词向量
2、在词汇单词中，即使单词没有出现在训练语料库中，仍然可以从字符级n-gram中构造单词的词向量
3、n-gram可以让模型学习到局部单词顺序的部分信息, 如果不考虑n-gram则便是取每个单词，这样无法考虑到词序所包含的信息，即也可理解为上下文信息，因此通过n-gram的方式关联相邻的几个词，这样会让模型在训练的时候保持词序信息

11.RNN相关

1: 为什么RNN会比CNN更容易出现梯度消失或爆炸, 有哪些改进方案?
- 在RNN网络中，循环神经网络在很长的时间序列中，每个时间步采用相同的操作来构建非常深的计算，并且模型参数共享，每个时间步的参数都是一样的，当参数中有较大或者较小的值时，经过比较多次的训练后，更容易产生梯度消失或者爆炸；
  
  而cnn中每层参数矩阵W是不同的，而且初始化时可设定参数之间独立同分布，可以相互抵消
- 改进方案：通过改进RNN结构，采用LSTM结构
  
  进行梯度裁减：设定阈值，当梯度小于阈值时，更新的梯度为阈值
2: RNN可以采用Relu激活函数吗?为什么?
- 可以
3: 画出LSTM的单元结构图, 以及其中涉及到的计算公式?
4: 相比于RNN处理序列数据, 我们可以用CNN处理同样的文本吗?如何实施? 有哪些需要特殊处理的地方?请尽可能详细的给出说明或图示.(不必要写代码)
- 1。输入：需要对输入进行处理；文本输入是一个一位向量，我们需要将输入转换成二维向量用于 cnn输入，这点通过embedding可以实现
- 2。对于输入长度，文本没有固定的长度，而且不能随意对长度进行裁减，否则会引起语义缺失；所以要对输入做处理
  - 可以使用RNN的输出作为cnn的输入
- 3。需要对卷积核做处理。CNN中卷积核一般采用方形，在文本处理中，可以采用条形卷积

输入层

输入层是句子中的词语对应的wordvector依次（从上到下）排列的矩阵，假设句子有 n 个词，vector的维数为 k ，那么这个矩阵就是 n × k 的(在CNN中可以看作一副高度为n、宽度为k的图像)。
第一层卷积层

输入层通过卷积操作得到若干个Feature Map，卷积窗口的大小为 h ×k ，其中 h 表示纵向词语的个数，而 k 表示word vector的维数。通过这样一个大型的卷积窗口，将得到若干个列数为1的Feature Map
池化层

接下来的池化层，文中用了一种称为Max-over-timePooling的方法。这种方法就是简单地从之前一维的Feature Map中提出最大的值，文中解释最大值代表着最重要的信号。可以看出，这种Pooling方式可以解决可变长度的句子输入问题（因为不管Feature Map中有多少个值，只需要提取其中的最大值）。最终池化层的输出为各个Feature Map的最大值们，即一个一维的向量。
全连接+softmax层

池化层的一维向量的输出通过全连接的方式，连接一个Softmax层，Softmax层可根据任务的需要设置（通常反映着最终类别上的概率分布）

12.神经网络的训练中如何判断过拟合?如果防止过拟合, 都有哪些办法?请详细说明。

14. CRF和HMM的对比

1: 各自有哪些假设?
- HMM：齐次马尔科夫链假设：任意状态的隐藏状态只依赖于它前一个隐藏状态
  
  观测独立性假设：任意时刻的观测状态只依赖于当前时刻的隐藏状态
- CRF：数据独立同分布，齐次马尔科夫假设
  
  条件概率，词性序列中，部分词性出现次数为1，假定动词或者副词后不会再次出现动词或者副词
2: 两者有什么区别?
- HMM是生成式，HMM能使用的前提是基于两个假设；HMM模型中当前输出只依赖于当前标签，当前标签只依赖于上一个标签
- CRF是判别式， CRF也采用了齐次马尔科夫假设，但是CRF采用了全局特征，把观测序列当作整体
3: 描述一下CRF在预测过程中用到了哪个算法?以及具体的算法过程?
- 维特比算法：
  - 1。初始化局部状态
  - 2。动态规划递推后续时刻的局部状态
  - 3。计算目标时刻最大的隐藏状态序列出现的概率，
  - 4。利用局部状态回shuo

15.查阅关于BERT模型的相关文档知识, 记录一下你的收获, 可以将文章的链接和重要的点写下来, 以及你的收获。

参考答案: http://52.83.69.131:8989有详细解答

16. bert相关（重要）

16.1: 详述Bert模型的结构特点。

embedding层由三层embedding层组合而成，三个层分别是
TokenEmbedding, SegmentEmbedding, PositionEmbedding
双向的transformer
Bert只有transformer的encorder
使用transformer而不是bi-LSTM做encoder，可以有更深的层数、具有更好并行性。并且线性的Transformer比lstm更易免受mask标记影响，只需要通过self-attention减小mask标记权重即可，而lstm类似黑盒模型，很难确定其内部对于mask标记的处理方式
模型的基本参数：
12层Layer，12个头，768的隐藏层，110M的参数

16.2 bert模型训练中的关键点

2: 详述Bert训练过程中的关键点。(提示: 训练中增添了什么任务, 如何做的词替换等)
- 2.1: 四大关键词: Pre-trained, Deep, Bidirectional Transformer, Language Understanding
  - a: Pre-trained: 首先明确这是一个预训练的语言模型, 未来所有的开发者可以直接继承!
    - 整个Bert模型最大的两个亮点都集中在Pre-trained的任务部分。
  - b: Deep:
    - Bert_BASE: Layer = 12, Hidden = 768, Head = 12, Total Parameters = 110M
    - Bert_LARGE: Layer = 24, Hidden = 1024, Head = 16, Total Parameters = 340M
    - 对比于Transformer: Layer = 6, Hidden = 2048, Head = 8, 是一个浅而宽, 说明Bert这样深而窄的模型效果更好 (和CV领域的总体结论基本一致)。
  - c: Bidirectional Transformer: Bert的一个创新点, 它是一个双向的Transformer网络。
    - 原始的Transformer其实是一个单向的网络, 和GPT一致, 见上图。
  - d: Language Understanding: 更加侧重语言的理解, 而不仅仅是生成 (Language Generation)
- 2.2: Bert的语言输入表示包含了3个组成部分: (见上图)
  - 词嵌入张量: word embeddings
  - 语句分块张量: segmentation embeddings
  - 位置编码张量: position embeddings
- 2.3: Bert的预训练中引入两大核心任务 (这两个任务也是Bert原始论文的两个最大的创新点)
  - a: 引入 Masked LM (带mask的语言模型训练)
    - a.1: 在原始训练文本中, 随机的抽取15%的token作为即将参与mask的对象。
    - a.2: 在这些被选中的token中, 数据生成器并不是把他们全部变成[MASK], 而是有下列3个选择:
      - a.2.1: 在80%的概率下, 用[MASK]标记替换该token, 比如my dog is hairy -> my dog is [MASK]
      - a.2.2: 在10%的概率下, 用一个随机的单词替换该token, 比如my dog is hairy -> my dog is apple
      - a.2.3: 在10%的概率下, 保持该token 不变, 比如my dog is hairy -> my dog is hairy
    - a.3: Transformer Encoder在训练的过程中, 并不知道它将要预测哪些单词? 哪些单词是原始的样子? 哪些单词被遮掩成了[MASK]? 哪些单词被替换成了其他单词? 正是在这样一种高度不确定的情况下, 反倒逼着模型快速学习该token的分布式上下文的语义, 尽最大努力学习原始语言说话的样子!!! 同时因为原始文本中只有15%的token参与了MASK操作, 并不会破坏原语言的表达能力和语言规则!!!
  - b: 引入Next Sentence Prediction (下一句话的预测任务)
    - b.1: 目的是为了服务问答, 推理, 句子主题关系等NLP任务。
    - b.2: 所有的参与任务训练的语句都被选中参加。
      - 50%的B是原始文本中实际跟随A的下一句话。(标记为IsNext, 代表正样本)
      - 50%的B是原始文本中随机抽取的一句话。(标记为NotNext, 代表负样本)
    - b.3: 在该任务中, Bert模型可以在测试集上取得97-98%的准确率。
- 2.4: 关于基于Bert的模型微调(fine-tuning)
  - 只需要将特定任务的输入, 输出插入到Bert中, 利用Transformer强大的注意力机制就可以模拟很多下游任务。(句子对关系判断, 单文本主题分类, 问答任务(QA), 单句贴标签(命名实体识别))
  - 微调的若干经验:
    - batch size: 16, 32
    - epochs: 3, 4
    - learning rate: 2e-5, 5e-5
    - 全连接层添加: layers: 1-3, hidden_size: 64, 128
  - [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ffen03lF-1590755362477)(/Users/zhudejun/Desktop/2020-05-09 – 直播课/BERT3.png)]

16.3: Bert模型本身有何优点和缺点?

优点: Bert的基础建立在transformer之上, 拥有强大的语言表征能力和特征提取能力。在11项NLP基准测试任务中达到了state of the art。同时再一次证明了双向语言模型的能力更加强大。
缺点:
- 1: 可复现性差, 基本没法做, 只能拿来主义直接用!
- 2: 训练过程中因为每个batch_size中的数据只有15%参与预测, 模型收敛较慢, 需要强大的算力支撑!
引申:
- 1：深度学习就是表征学习 (Deep learning is representation learning)
  - 整个Bert在11项语言模型大赛中, 基本思路就是双向Transformer负责提取特征, 然后整个网络加一个全连接线性层作为fine-tuning微调。但即便如此傻瓜式的组装, 在NLP中著名的难任务-NER(命名实体识别)中, 甚至直接去除掉了CRF层, 照样大大超越BiLSTM + CRF的组合效果, 这去哪儿说理去???
- 2: 规模的极端重要性 (Scale matters)
  - 不管是Masked LM, 还是下一句预测Next Sentence Prediction, 都不是首创的概念, 之前在其他的模型中也提出过, 但是因为数据规模 + 算力局限没能让世人看到这个模型的潜力, 那些Paper也就不值钱了。但是到了谷歌手里, 不差钱的结果就是Paper值钱了!!!
- 3: 关于进一步的研究展示了Bert在不同的层学习到了什么。
  - 低的网络层捕捉到了短语结构方面的信息。
  - 单词和字的特征表现在3-4层, 句法信息的特征表现在6-9层, 句子语义信息的特征表现在10-12层。
  - 主谓一致的特征表现在8-9层 (属于句法信息的一种)。

17.fasttext

17.1 asttext模型在大量类别上能够快速训练的原因?(从模型结构上深入分析)

参考答案:
- 1:fasttext模型是结构简单，仅由Embedding层，GAP层和输出层组成，适用于大规模文本分类的高效选择之一。使用n-gram特征，层次softmax是fasttext模型的两大显著特征。
- 2: 模型结构简单，参数量相比大型模型(如BERT)较少，即提高训练效率又提高推断效率。
- 3: 当业务场景中存在大量目标类别时，fasttext的输出层使用层次softmax提升训练效率。
- 4: 关于层次softmax
  - 4.1: 层次softmax是一种使用最优二叉树结构替代网络原有输出层(全连接层)的方式。
  - 4.2: 提升训练效率的内在原理: 在训练阶段，由于二叉树是根据预先统计的每个标签数量的占比构造的哈夫曼树（最优二叉树），根据哈夫曼树的性质，使得占比最大的标签节点路径最短，又因为路径中的节点代表参数量，也就意味着这种方式需要更新的参数最少，因此提升训练速度。
  - 4.3: 该方式对模型推断(预测)是否有影响: 在预测阶段，相比全连接层速度略有提升，因为运算参数减少了1/N，N是标签总数。
  - 4.4: 是否存在一定弊端: 因为最优二叉树的节点中存储参数，而样本数量最多的标签对应的参数又最少，可能出现在某些类别上欠拟合，影响模型准确率。因此，若非存在大量目标类别产生的训练低效，首选具有全连接层的输出层。

17.2 - 为了提升fasttext模型的评估指标都做了哪些优化?

参考答案:
- 1: 迁移词向量，使模型初始化的参数为迁移参数。
- 2: 对数据进行增强，对于中文文本数据，一般是选择回译增强法，扩充正负样本的数量。
- 3: 根据文本分类目标和业务要求修改损失函数（这种方法实现难度较大，一般不采用) 。
备选答案(建议学生背下来的说法):
- 在项目中，我们首先使模型初始化参数为迁移参数，这样我们的模型训练时，起始的验证准确率由原来的50%提升至63%，最终准确率也提升了大概7%。而且我们还对正负样本数据分别进行回译增强，在原有的数据集基础上，我们分别上采样了正负样本各1000条，有效扩展了数据特征维度，将验证准确率由之前的87%提升至90%。

18.BiLSTM +CRF

18.1: 详述命名实体识别任务的模型架构? 为什么这样组合模型? CRF在这里面起了什么样的作用? 没有CRF层行不行?

模型架构：采用了BiLSTM + CRF的模型架构；CRF在BiLSTM之后，BiLSTM输出为每一个标签的分值，并将这些词作为CRF的输入
CRF 层用来添加约束，可以从数据中获得约束性规则，以降低非法序列出现的概率；比如：
- 命名实体总以B开头，而不是I
- 开头和它后续的命名实体标签应属于同一命名实体，具有相同的label
BiLSTM用来实现命名实体识别，没有CRF也可以，CRF只是起到了增加约束，提高准确率的作用，实现命名实体识别主要是靠BiLSTM实现的，但是增加CRF后对命名实体识别的准确率有提升。

18.2: 具体的类代码中, 你是怎么理解训练函数没有用到forward()函数, 反倒是预测的时候去用forward()了?

forward函数只是在类实例化后，使用实例名可以直接调用的函数
案例中只是在forward中写了预测函数没有写训练函数
在实际开发中可以灵活使用，同样可以使用其他函数名来实现模型训练

18.3: 具体写出你的模型调优策略, 并进行训练, 给出训练集和测试集的准确率, 提交日志文件和截图。

19.句子相关性模型

19.1 句子主题相关模型的意义, 为什么要存在? 有哪些方案可以实现?

在多轮对话中，需要判断用户最近两句话的主题是否一致，以决定回答是否根据上一次回复讨论相关问题
1. 直接使用bert模型，bert模型可以用来判断两句话的相关性
2. 使用bert模型，并对模型作出微调，可以对使用场景更有针对性，提高该场景下的准确率

19.2 主逻辑服务的代码逻辑, 你认为有哪些可以改进的点? 提出方案并写出伪代码解释。(如果有真实代码做了实验并运行成功, 请一并提交.py文件+具体说明的文本文件+截图)

可以改进的点：
- 1. 对历史查询结果进行统计，找到出现频率最高的几个疾病名称，返回给用户

20 NLP 生成式任务

20.1 你做过哪几个案例属于生成式任务? 用了什么模型架构? 有何优缺点?

莎士比亚风格文本生成：使用了GRU模型，优点：模型结构简单，在捕捉长序列语义关联时，能有效抑制梯度消失或者爆炸；缺点：不能完全解决梯度消失的问题，而且不能进行并行运算，大数据时效率低
- 英译法：encoder-decoder(seq2seq)架构，编码器和解码器都是用了GRU：优点：分为encoder和decoder两部分，输入输出长度没有限制。

20.2传统seq2seq架构在解决生成式任务时有什么优点? 有什么缺点? 如何改进, 请详细说明。

优点：输入和输出的文本长度可以不统一，不限制，应用范围广泛
缺点：encoder和decoder之间的唯一联系是固定长度的语义向量c

c无法表达出整个序列完整的信息,不利于解码器端应用注意力机制

后输入的内容对先输入的内容有影响；

改进：
- 采用transformer进行改进
- 引入attention机制，在encoder和decoder端都可以使用

21.简述文本摘要任务实现

如果你面对"文本摘要"这个任务, 就是从一大段文本中得出概括主题内容和中心思想的摘要内容, 你会如何搭建你的模型? (尽可能详细的说明)

比如你的训练数据什么样子, 什么格式?
训练数据：一段文本；标签：文本摘要
比如你的模型准备采用什么架构?
seq2seq ,transformer
甚至给出你的核心类代码 class Model()的源码)
PGN

22. transformer模型相关知识点汇总

你可能感兴趣的:(NLP总结,python,自然语言处理)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
LeetCode 148. 排序链表：归并排序的细节解析进击的小白菜 2025 Top100 详解 leetcode 链表算法
文章目录题目描述一、方法思路：归并排序的核心步骤二、关键实现细节：快慢指针分割链表1.快慢指针的初始化问题2.为什么选择`fast=head.next`？示例1：链表长度为偶数（`1->2->3->4`）三、完整代码实现四、复杂度分析五、总结题目描述LeetCode148题要求对链表进行排序，时间复杂度需为O(nlogn)，且空间复杂度为O(logn)。由于链表的特殊结构（无法随机访问），归并排序
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Cesium加载各类数据总结 zhu_zhu_xia cesium JavaScript javascript
接触到的加载数据类型：源地图、shp、Geojson、png、wms、地形底图一.Cesium加载各类底图#此类加载的本质在于newCesium.ImageryProvider()Apidefination：“Providesimagerytobedisplayedonthesurfaceofanellipsoid.Thistypedescribesaninterfaceandisnotinten
【前端】jQuery数组合并去重方法总结
在jQuery中合并多个数组并去重，推荐使用原生JavaScript的Set对象（高效简单）或$.unique()（仅适用于DOM元素，不适用于普通数组）。以下是完整解决方案：方法1：使用ES6Set（推荐）//定义多个数组constarr1=[1,2,3];constarr2=[2,3,4];constarr3=[3,4,5];//合并数组并用Set去重constmergedArray=[...
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
无线鼠标产品整体技术分析总结悟空胆好小计算机外设
无线鼠标产品对比分析，以小米为例文章目录无线鼠标产品对比分析，以小米为例一.小米无线鼠标产品对比1.1小米无线鼠标XMSMSB05YM2.4G单模款1.2小米无线鼠标XMSMSB01YM2.4G+BT双模款二.**单模鼠标与双模的区别****1.连接方式****2.通信性能与可靠性****3.功耗管理****4.适用场景****5.技术扩展性**6.**小结**三.无线鼠标产品技术重点分析3.1.
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
玩转Docker | 使用Docker部署gopeed下载工具心随_风动玩转Docker docker 容器运维
玩转Docker|使用Docker部署gopeed下载工具前言一、gopeed介绍Gopeed简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署gopeed服务下载镜像创建容器检查容器状态检查服务端口安全设置四、访问gopeed应用五、测试与下载六、总结前言在当今信息爆炸的时代，高效地获取和管理网络资源变得尤为重要。无论是下载大型文件还是进行日常的数据传输，一个稳
javascript高级程序设计第3版——第12章 DOM2与DOM3 weixin_30687587 javascript 数据结构与算法 ViewUI
12章——DOM2与DOM3为了增强D0M1，DOM级规范定义了一些模块。DOM2核心：为不同的DOM类型引入了一些与XML命名空间有关的方法，还定义了以编程方式创建Document实例的方法；DOM2级样式：针对操作元素的样式而开发；其特性总结：1.每个元素都有一个关联的style对象，可用来确定和修改行内样式；2.要确定某个元素的计算样式，可使用getComgetComputedStyle（）
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {