轻量级Transformer模型ConvBERT架构及完整源码实现

28章:使用Local dependency轻量级Transformer模型ConvBERT架构内幕及完整源码实

1BERT依赖global self-attention而带来的问题分

2BERT不同Layercomputation redundancy

3,使用local dependency的数学原理分

4local dependency的工程实

5convolution head数学原理剖

6,构建mixed attention block

7ConvBertTokenizer源码解

8,把TF模型的checkpoints加载入pytorch模型

9ConvBertEmbeddings完整源码分

10ConvBertPreTrainedModel完整源码分

11SeparableConv1D完整源码分

12ConvBertAttention完整源码分

13ConvBertSelfAttention完整源码分

14ConvBertSelfOutput完整源码分

15GroupedLinearLayer完整源码分

16ConvBertIntermediate完整源码实现分

17ConvBertLayer完整源码实现分

18ConvBertOutput完整源码实现分

19ConvBertEncoder完整源码实现分

20ConvBertPredictionHeadTransform完整源码实现分

21ConvBertModel完整源码实现分

22ConvBertGeneratorPredictions完整源码实现分

23ConvBertForMaskedLM完整源码实现分

24ConvBertClassificationHead完整源码实现分

25ConvBertForSequenceClassification完整源码实现分

26ConvBertForMultipleChoice完整源码实现分

27ConvBertForTokenClassification完整源码实现分

28ConvBertForQuestionAnswering完整源码实现分

29ConvBertConfig代码分

29章:使用Control code的文本生成Transformer模型CTRL架构内幕及完整源码实

1,能够使用第一个Token作为control code的数学原理分

2,控制生成内容的stylecontenttask-specific行为的架构设

3control code的来源:co-occure

4,生产coherent内容的关键是什么

5,基于CLMCTRL 设计实

6syntactically coherent textsemantically coherent text

7CTRLTokenizer源码完整实现解

8CTRLTokenizer源码完整实现解

9positional_encoding源码完整实现解

10scaled_dot_product_attention源码完整实现解

11MultiHeadAttention源码完整实现解

12EncoderLayer源码完整实现解

13CTRLPreTrainedModel源码完整实现解

14CTRLLMHeadModel源码完整实现解

15CTRLModel源码完整实现解

16CTRLForSequenceClassification源码完整实现解

30章:使用disentangled attention机制Transformer模型DeBERTa架构内幕及完整源码实

1,使用两个vector来编码每个wordcontentposition

2,在pretraining阶段使用output enhanced mask decoder取代softmax layermasked words预测的数学原理剖

3DebertaEmbeddings完整源码实现解

4DebertaPreTrainedModel完整源码实现解

5Disentangled Attention算法剖

6DebertaTokenizer完整源码实现解

7XDropout完整源码实现解

8StableDropout完整源码实现解

9XSoftmax完整源码实现解

10ContextPooler完整源码实现解

11DebertaLayerNorm完整源码实现解

12DebertaSelfOutput完整源码实现解

13build_relative_position完整源码实现解

14DebertaAttention完整源码实现解

15DebertaIntermediate完整源码实现解

16DebertaOutput完整源码实现解

17DebertaLayer完整源码实现解

18DebertaEncoder完整源码实现解

19DisentangledSelfAttention完整源码实现解

20DebertaModel完整源码实现解

21DebertaForMaskedLM完整源码实现解

22DebertaPredictionHeadTransform完整源码实现解

23DebertaLMPredictionHead完整源码实现解

24DebertaOnlyMLMHead完整源码实现解

25DebertaForSequenceClassification完整源码实现解

26DebertaForTokenClassification完整源码实现解

27DebertaForQuestionAnswering完整源码实现解

31章:基于dual-encoder机制的开发QA问答Transformer模型Dense Passage Retrieval (DPR)架构内幕及完整源码实

1,基于open-domain Q&A常见实现及问题分

2sparse vector space问题及解决方

3Dense vectordual-encoder架构设

4,小规模数据训练任务有效性数学原理剖

5DPRQuestionEncoderTokenizer完整源码实现详

6decode_best_spans完整源码实现详

7get_best_spans完整源码实现详

8CustomDPRReaderTokenizerMixin完整源码实现详

9DPRReaderTokenizer完整源码实现详

10DPRContextEncoderOutput完整源码实现详

11DPRQuestionEncoderOutput完整源码实现详

12DPRReaderOutput完整源码实现详

13DPRPreTrainedModel完整源码实现详

14DPREncoder完整源码实现详

15DPRSpanPredictor完整源码实现详

16DPRPretrainedContextEncoder完整源码实现详

17DPRPretrainedQuestionEncoder完整源码实现详

18DPRPretrainedReader完整源码实现详

19DPRContextEncoder完整源码实现详

20DPRQuestionEncoder完整源码实现详

21DPRReader完整源码实现详

22,高效的Dense Vector Retrieval技术解

32章:基于Fourier TransformTransformer模型FNet架构内幕及完整源码实

1BERTAttention本质和功能再思

2fourier transform数学原理剖

3,使用fourier transform取代self-attention layer

4,为什么采用fourier transformfewer parametersmore memory efficient

5fourier transform有效性带来的“mix” input tokens操作的思

6FNet处理longer input lengths的设计及实

7PreTrainedTokenizer源码完整实现剖

8get_special_tokens_mask源码完整实现剖

9tokenize源码完整实现剖

10FNetTokenizer源码完整实现剖

11FNetEmbeddings源码完整实现剖

12fourier_transform方法源码完整实现剖

13FNetBasicFourierTransform源码完整实现剖

14FNetFourierTransform源码完整实现剖

15FNetBasicOutput源码完整实现剖

16FNetOutput源码完整实现剖

17FNetIntermediate源码完整实现剖

18FNetLayer源码完整实现剖

19FNetEncoder源码完整实现剖

20FNetPooler源码完整实现剖

21FNetPredictionHeadTransform源码完整实现剖

22FNetLMPredictionHead源码完整实现剖

23FNetOnlyMLMHead源码完整实现剖

24FNetOnlyNSPHead源码完整实现剖

25FNetPreTrainingHeads源码完整实现剖

26FNetPreTrainedModel源码完整实现剖

27FNetForPreTrainingOutput源码完整实现剖

28FNetModel源码完整实现剖

29FNetForPreTraining源码完整实现剖

30FNetForMaskedLM源码完整实现剖

31FNetForNextSentencePrediction源码完整实现剖

32FNetForSequenceClassification源码完整实现剖

33FNetForMultipleChoice源码完整实现剖

34FNetForTokenClassification源码完整实现剖

35FNetForQuestionAnswering源码完整实现剖

你可能感兴趣的:(transformer,架构,自然语言处理,深度学习)