【博学谷学习记录】超强总结,用心分享丨人工智能 自然语言处理 BERT、GPT、ELMO对比学习简记
目录三模型架构BERTGPTELMO三者差异点三模型架构BERT优点在11个NLP任务上取得SOAT成绩.利用了Transformer的并行化能力以及长语句捕捉语义依赖和结构依赖.BERT实现了双向Transformer并为后续的微调任务留出足够的空间.缺点BERT模型太大,太慢.BERT模型中的中文模型是以字为基本token单位的,无法利用词向量,无法识别生僻词.BERT模型中的MLM任务,[M