阐述目前为止的学习进度和资料(自用)

归一化
X-平均值/最大值-最小值
放在二维上去理解,最大值-最小值是该线段长度,X-平均值是该点的长度,
体现在公式层面意义上就是该点的值在该线段的比例,
因为这个点是在线段上的,平均值也是线段上的,所以得出来的结果相当于是被压缩但不减少信息量

关系系数
https://www.zhihu.com/question/20852004/answer/134902061
首先要理解方差的意义,对比协方差的方程
协方差可以理解为两个变量在各个点位斜率变化情况
方差就是协方差的极端情况,把两个变量浓缩成一个,所以公式是平方
同时协方差应用时,我们需要考虑的情况仅仅是结果是正数,负数,还是0
因为公式问题,在放大数值的情况下,结果会被数值上的大小所影响
因此在协方差基础上除于标准差,形似于标准化
就会得到一个“”标准化后的协方差“”,即关系系数

PCA
https://www.bilibili.com/video/BV1X54y1R7g7?from=search&seid=6949441269440523794
PCA就是高维转低维,中心化-拟合出各点距离最短的那条线-旋转坐标系-比对信息量(会损失一小部分源数据的信息)

核心可以比喻成勾股定理 ,通过维度1和维度2在坐标系的空间,在尽量不减少信息量的情况下得到C

你可能感兴趣的:(阐述目前为止的学习进度和资料(自用))