pipeline内部发生了什么?(PyTorch)

pipeline内部发生了什么?

    • 前言
    • 参考说明
    • 过程说明

前言

最近一直疑惑Hugging Face的Transformers库中的pipeline函数的具体是干了什么,多方询问以及翻看了Hugging Face的官方说明,终于是弄清楚了其原理,记录一下~

参考说明

https://www.youtube.com/watch?v=1pedAIvTWXk

过程说明

如图所示,pipeline的内部可以分为三个阶段:预处理、通过模型传递输入和后处理。
pipeline内部发生了什么?(PyTorch)_第1张图片

  • 首先,将纯文本转换成模型可以理解的数字,所以使用了一个分词器tokenizer,因此需要使用 AutoTokenizer 类及其 from_pretrained 方法,来保证所有这些预处理都以与模型预训练时完全相同的方式完成。
  • 然后,这些数字通过模型model生成Logits。Transformers 提供了一个 AutoModel 类,使用其中的 from_pretrained 方法。
  • 最后,后处理。因为从模型中获得的作为输出的值本身并不一定有意义,所以后处理就是将这些Logits转换成相应的输出。

你可能感兴趣的:(nlp,深度学习,pytorch,深度学习,nlp)