2020-11-26学习笔记

24号所看论文知识点的学习

1. PCA降维

论文里的PCA降维主要是用来在构建平衡树的时候使用。因为在构建平衡树的时候需要先将相似的item放在一个节点上,效率才更高,所以需要一个类似聚类的操作。代码中实现了3种方法:knn-based、PCA-based以及random-based。代码中的实验结果发现使用PCA-based效率更高。

PCA(Principal component analysis, 主成分分析)可以用主成分近似的表示原始数据,可以理解为发现数据的原始结构;也可以把数据由少数主成分表示,可以理解为对数据降维。具体的推导,性质和算法略。(可以参考《统计学习方法》)

2. VAE-based embedding

给自己留个坑。还没学。

3. 24号论文对应源代码学习

你可能感兴趣的:(2020-11-26学习笔记)