NLP One-hot与TF-IDF原理+面试必考知识点

无聊,整理下之前学过的基础知识把~

文章目录

  • 1、One-hot
    • 1.1、one-hot 为何出现
    • 1.2、one-hot 原理
    • 1.3、one-hot 缺点
  • 2、TF-IDF
    • 2.1、tf-idf思想、原理
    • 2.2、tf-idf优点
    • 2.3、tf-idf缺点
    • 2.4、tf-idf应用场景

1、One-hot

1.1、one-hot 为何出现

答:

  • 计算机无法识别文本,需将文本数字化。

1.2、one-hot 原理

答:

  • 用一个很长的向量来表示一个词,向量长度为词典的大小N,每个向量只有一个维度为1,其余维度全部为0,为1的位置表示该词语在词典的位置。

你可能感兴趣的:(算法岗面试,NLP,自然语言处理,tf-idf,深度学习,算法)