NMF 非负矩阵分解

矩阵: 行为doc, 列为word, 构成一个矩阵A  n * m. n个doc,m个word

 

NMF: A(nm) = B(nq) * C(qm)

其中:

B称作权重矩阵, 每行为一个doc, 每列为一个特征;【行就是该doc有哪些特征构成, 特征权重是多少】

C称作特征矩阵, 每行为一个特征,每列为一个word; 【行就是该特征由哪些word构成以及word的权重】

 

通常q << n, 达到降维的目的

 

 

tf-idf, 可以达到特征选择的目的, 同时也可以得到doc中特征的权重

你可能感兴趣的:(c)