weixin_42001089

PCA SVD原理详解及应用

本文分为两大部分即PCA和SVD，每一部分下又分为原理和应用两小部分

说明：本文代码参考Peter Harrington编写的Machine Learning in Action,感兴趣的小伙伴可以去看一下，笔者认为这本书还不错

注意：本篇重在说明公式推导，关于具体使用的话python有专门的机器学习库已经集成，直接用就可以啦，可以在读完本文的理论部分后再去看笔者另一篇应用了PCA的关于人脸识别的一个简单例子https://blog.csdn.net/weixin_42001089/article/details/79989788

废话不多说开始吧

PCA:

（1）原理

$(1)XV=\lambda V$

$(2)XV=V\Sigma \Rightarrow X=V\Sigma V^{-1}=V\Sigma V^{T}$

公式（1）是我们熟悉的求特征值的式子，假设X是m*m，我们根据其求出了 $\lambda _{1},\lambda _{2},\cdots \lambda _{m}$ 特征值以及每个特征值对应的特征向量。

---------------------------------------------------------------------------------------------------------------------------------------------------------------

关于怎么求特征值这里简单举一个小例子：会的话直接跳过就可以啦

$X=\begin{pmatrix} 2 & 1\\ 1& 2 \end{pmatrix}$

$\begin{vmatrix} 2-\lambda &1 \\1 & 2-\lambda \end{vmatrix}=(2-\lambda )^{2}-1=0\Rightarrow \lambda _{1}=1,\lambda _{2}=3$

我们通过上面求得该矩阵的2个特征值分别为1和3

$\bigl(\begin{smallmatrix} 2-1 &1 \\ 1 & 2-1 \end{smallmatrix}\bigr)=\bigl(\begin{smallmatrix} 1 &1 \\ 1 & 1 \end{smallmatrix}\bigr)\Rightarrow \bigl(\begin{smallmatrix} 1 &1 \\ 0 & 0 \end{smallmatrix}\bigr)$

上面通过矩阵化简可以得到解为 $k\left ( 1,-1 \right )^{T}$

同理3这个特征值对应 $\bigl(\begin{smallmatrix} 2-3 & 1\\ 1 & 2-3 \end{smallmatrix}\bigr)= \bigl(\begin{smallmatrix} -1 & 1\\ 1 & -1 \end{smallmatrix}\bigr)\Rightarrow \bigl(\begin{smallmatrix} -1 & 1\\ 0 & 0 \end{smallmatrix}\bigr)$ 的解为： $k\left ( 1,1 \right )^{T}$

所以特征向量分别是 $\left ( 1,-1 \right )^{T} , \left ( 1,1 \right )^{T}$

---------------------------------------------------------------------------------------------------------------------------------------------------------------

这里的 $\Sigma$ 是一个对角矩阵，对角线上值就是所有的特征值，那么可以看到X最后可以根据（2）进行分解，一般的习惯 $VV^{T}=E$

所以 $V^{-1}=V^{T}$

------------------------------------------------------------------------------------------------------------------------------------------------------------------

对应到上面的例子中特征向量应该是：

$\left ( \frac{1}{\sqrt{2}}, \frac{-1}{\sqrt{2}} \right )^{T} ,\left ( \frac{1}{\sqrt{2}}, \frac{1}{\sqrt{2}} \right )^{T}$

注意当求矩阵单个特征值时是 $XV=\lambda V$ ，但当所有特征值放一起后是 $XV=V\Sigma$ 而不是 $XV=\Sigma V$ 这种形式。

即分解结果为： $\bigl(\begin{smallmatrix} 2 &1 \\ 1 & 2 \end{smallmatrix}\bigr)=\bigl(\begin{smallmatrix} \frac{1}{\sqrt{2}} &\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & \frac{-1}{\sqrt{2}} \end{smallmatrix}\bigr)\bigl(\begin{smallmatrix} 3 &0 \\ 0 & 1 \end{smallmatrix}\bigr)\bigl(\begin{smallmatrix} \frac{1}{\sqrt{2}} &\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & \frac{-1}{\sqrt{2}} \end{smallmatrix}\bigr)$

---------------------------------------------------------------------------------------------------------------------------------------------------------------------

（2）应用

在实际降维时，往往先要转化坐标轴，使坐标轴尽可能的覆盖多的数据，即找数据最大方差的位置，其往往给出了数据的最重要信息，比如找到后我们记该方向为x轴，那么其y轴就是与x轴垂直的方向。

所以思路就是找先将原始矩阵每一个元素减去其自身均值进行标准归一化，然后求得其协方差，最后再求协方差的特征值和特征向量，注意不是求原矩阵的特征值和特征向量。

---------------------------------------------------------------------------------------------------------------------------------------------------------------

好了，代码也应该很简单啦：

def pca(datamat,N=3):
    meanVals = mean(datamat,axis=0)
    meanRemoved = datamat - meanVals
    covmat = cov(meanRemoved,rowvar=0)
    eigVals,eigVects = linalg.eig(mat(covmat))
    eigValInd = argsort(eigVals)
    eigValInd = eigValInd[:-(N+1):-1]
    redEigVects = eigVects[:,eigValInd]
    lowDDataMat = meanRemoved*redEigVects
    reconMat = (lowDDataMat *redEigVects.T)+meanVals
    return lowDDataMat ,reconMat

就是在求出协方差的特征值后进行排序，然后选取前N名（eigValInd）特征值及其对应的特征向量（redEigVects）

然后lowDDataMat就是其将原始矩阵降维后，变成的新维度，该维度与原始矩阵相比，行数不变，列数降维到N，但却保留了原始矩阵所蕴含的大部分信息

reconMat就是我们用lowDDataMat来重构回原始矩阵，为什么会是这样呢?

$Cov = low\times red^{T}+meanVals=(meanRemoved\times red)\times red^{T}+meanVals=meanRemoved\times (red\times red^{T})+meanVals=meanRemoved+meanVals=datamat$

这里将 redEigVects 简写为red，证明过程使用到了上面所说的 $VV^{T}=E$

重构只是为了验证一下而已，我们真正想要的正是lowDDataMat即返回的第一个矩阵。即假设datamat是m*m,那么降维后便是m*N

-------------------------------------------------------------------------------------------------------------------------------------------------------------

但上面分解的前提是X必须为方阵那如果X不是方阵呢即是m*n，这时候SVD隆重登场

---------------------------------------------------------------------------------------------------------------------------------------------------------------------

注意：上面的PCA的原始矩阵虽说可以不是方阵，但我们也不是求原始矩阵的特征值和特征向量呀，是求的其协方差，其协方差即 $cov = E((X-E(X)(X-E(X)^{T})$ 这里的协方差cov一定是方阵对吧，所以其本质还是对方阵进行的分解，而下面介绍的svd正是直接对不是方阵的情况进行分解

--------------------------------------------------------------------------------------------------------------------------------------------------------------------

SVD

(1)原理

首先看一下SVD矩阵分解公式：

$(3)X_{m\times n}= U_{m\times m} \Sigma_{m\times n} V_{n\times n}^{T}$

这里的 $\Sigma_{m\times n}$ 其实是一个对角矩阵，对角线上面的值就称为奇异值， $U_{m\times m}$ 和 $V_{n\times n}$ 分别称为左奇异矩阵、右奇异矩阵

-------------------------------------------------------------------------------------------------------------------------------------------------------------------

对比一下方阵求特征值的公式：

（1）方阵分解那里对角线是特征值，这里是奇异值

（2）方阵分解那里左右维数相同，互为逆矩阵（和 $V^{-1}$ ）,而这里是左右奇异矩阵

可以看到这两种分解在形式上大体相似，只是维数不同

-------------------------------------------------------------------------------------------------------------------------------------------------------------

这里的 $U,\Sigma ,V$ 该怎么求呢？

先来看一下U：

$(XX^{T})v=\lambda v$ 我们求 $XX^{T}$ 的特征值和特征向量，然后将所有的特征向量展开放到一个矩阵，该矩阵就是U

$(X^{T}X)v=\lambda v$ 我们求 $X^{T}X$ 的特征值和特征向量，然后将所有的特征向量展开放到一个矩阵，该矩阵就是V

注意这里我们将U和V中所有特征向量也进行了归一化，即 $UU^{T}=E , VV^{T}=E$

----------------------------------------------------------------------------------------------------------------------------------------------------------------

这里简单证明一下：

$(4)XX^{T}=U\Sigma V^{T}\times V\Sigma ^{T}U^{T}=U\Sigma ^{2}U^{T}\Rightarrow \left ( XX^{T} \right )U=U\Sigma ^{2}$

$(5)X^{T}X=V\Sigma ^{T}U^{T}\times U\Sigma V^{T}=V\Sigma ^{2}V^{T}\Rightarrow (X^{T}X)V=V\Sigma ^{2}$

通过（4）和（5）可以看到U和V其实分别就是 $XX^{T}$ 和 $X^{T}X$ 各自所有特征向量展开合并的矩阵

---------------------------------------------------------------------------------------------------------------------------------------------------------------

那么 $\Sigma$ 怎么求呢，从上面的简单证明可以明显看出，其就是特征值的平方根，

好了最后总结一下，当我们拿到一个 $X_{m\times n}$ 矩阵需要分解时，首先是求 $XX^{T}$ 的特征值和对应的特征向量，将所有特征向量合并为一个矩阵，该矩阵就是U，给所有特征值开平方根就是奇异值，即得到 $\Sigma$ ，然后求 $X^{T}X$ 的特征值和特征向量，同样将所有特征向量合并为一个矩阵，该矩阵就是V（不难看到，其实两次的特征最后求得结果应该是一样的）

到这里我们就将SVD的分解原理叙述完毕啦，回头看看其实还是挺简单的对吧，下面来看看SVD的具体用途：

(2)应用

想PCA取前几个比较大的特征值一样，这里SVD是取前几个比较大奇异值

用的比较多的应该就是推荐系统里面的吧

假设现在有一个矩阵，每一行代表一个用户，每列代表一个物品

	辣条	薯片	可乐	冰红茶
小花	0	0	2	4
小明	0	0	2	5
小李	3	6	0	0

其中的数字是评价等级1~5 , 0代表没有评价

我们将该矩阵分解， $X_{3\times 4}=U_{3\times 3}\Sigma _{3\times 4}V_{4\times 4}\approx U_{3\times 2}\Sigma _{2\times 2}V_{2\times 4}$

这里假设我们取2个奇异值，那么便可以近似分解

可以看到原本是使用黄色来重构X，现在只使用红色就可以近似重构X，即达到了降维目的，那么这里的 $U_{3*2}$ 具体是什么含义呢？

它其实就是将每个用户映射到二维（原先是4维，分别代表辣条，薯片，可乐，冰红茶），在这两维中，小花和小明相似度相近，而小李

这位另一类，这和原始的评分矩阵反应出来的一样，即小花和小明相似度相近，而小李这位另一类，原先4个维度，现在我们只用2个维度就可以反应出同样的信息，这不就是降维了吗（至于这两个维度是什么新的含义呢？我们不必管，或是零食和饮料又或是其他的），总之这里对于每个用户来说，将原来的4维降为了2维，但其中还是包含原始原始矩阵的信息。同理 $V_{2\times 4}^{T}$ 是对每个物品来说，将原来的3维降为2维，即原始矩阵是这样的：每个物品下面有3个用户，而这里是，每个物品下面有2类人。

其实上面两种解释对应着两种不同的推荐策略：基于用户(客户数不变，即行数不变，压缩列数，归类物品)和基于物品(物品数不变，即列数不变，压缩行数，归类客户)。

在python中有现成的库可以用.来进行SVD矩阵分解，其返回的是三个矩阵，分别对应 $U,\Sigma ,V$

--------------------------------------------------------------------------------------------------------------------------------------------------------------

例如：

U,Z,V = linalg.svd(datamat)

这里的datamat就是我们要分解的矩阵。

现在比如一共求出有10个奇异值，我们取3个来进行降维，即我们要将原始矩阵的列数压缩到3维（也可以理解为对于每一个用户来说，原来是对很多商品进行了评价，现在我们要将其总结一下，使其结果是对总结后的3类商品进行的评价），即这里是求V:

$X=U\Sigma V^{T}\Rightarrow XV=U\Sigma \Rightarrow U=XV\Sigma ^{-1}$

假设原来datamat是15*10，那么降维后这里的X_tran就是15*3啦

同理如果是给行降维，即将人进行分类，就是说求V

$X=U\Sigma V^{T}\Rightarrow V^{T}=\Sigma ^{-1}U^{T}X\Rightarrow V=X^{T}U(\Sigma ^{-1})^{T}\Rightarrow V=X^{T}U(\Sigma ^{T})^{-1}\Rightarrow V=X^{T}U\Sigma ^{-1}$

X_tran = datamat.T*U[:,:3]*mat(eye(4)*U[:3]).I

假设原来datamat是15*10，那么降维后这里的X_tran就是3*10啦

--------------------------------------------------------------------------------------------------------------------------------------------------------------

现实中一般是行数对于列数（客户多，商品少），所以多采用基于商品，即要得到V

假设现在我们要给用户a推荐物品，那怎么做呢？

首先我们使用 $V=X^{T}U\Sigma ^{-1}$ 降维得到V，然后我们从datamat中先筛选出来客户a还没有买过的物品标号集合为R1，因为我们要从这里面挑出一些物品推荐给a,以及其评价过物品的集合R2，最后就是遍历R1，看其每一个物品和R2中每一个物品的相似度再乘以权重（即评价）

-----------------------------------------------------------------------------------------------------------------------------------------------------------------------

可能上面说的有点不好理解，看一下代码吧，就好多啦：

代码参考;《机器学习实战》Peter Harrington著，李锐等译

def Similarity(datamat,user,simways,item):
    n = shape(datamat)[1]
    simTotal = 0.0
    ratSimTotal = 0.0
    U,Z,V = linalg.svd(datamat)
    X_tran = datamat.T*U[:,:3]*mat(eye(4)*U[:3]).I 
    for j in range(n):
        userRating = datamat[user,j]
        if userRating==0 or j==item:
            continue
        similarity = simways(X_tran[item,:].T,(X_tran[j,:].T)
        simTotal += similarity
        ratSimTotal +=similarity * userRating
     if simTotal=0:
         return 0
     else:
         return ratSimTotal/simTotal

上面的函数有四个输入，原始矩阵，要给哪个用户推荐，计算相似度的方法，以及当前推荐物品的id

从中可以看到我们取了3个奇异值

 X_tran = datamat.T*U[:,:3]*mat(eye(4)*U[:3]).I

对应我们求V的过程，即X_tran就是我们取3个奇异值后对应的V

if userRating==0 or j==item:
            continue

对应部分就是说要计算item和已经评过分的物品的相似度，加入j之前也没评价过，那比较就没有意义啦，这里就相当于上面我们说的处理出R2的过程

similarity = simways(X_tran[item,:].T,(X_tran[j,:].T)

部分就是求两个向量的相似度

ratSimTotal +=similarity * userRating

部分就是相似度乘以权重，不难想象，如果j的评分高，则userRating高，权重大，此时如果相似度也高，那么最后结果也高，如果j的评分底，相似度高，相当于带来的惩罚也越多（和评分差的相似度高，当然要给与高惩罚）

return ratSimTotal/simTotal

部分就是将结果该归一化到1~5评分等级中

好啦！！！！！！！！！！！！！！！！！

有了上面的评分函数，接下来就是在外面遍历R1就可以啦

def recommend(datamat,user,N=3,simways):
    unratedItems = nonzero(datamat[user,:].A==0)[1]
    if len(unratedItems) == 0:
        return 'you rated everything'
    itemScores = []
    for item in unratedItems:
        estimatedScore = Similarity(datamat,user,simways,item)
        itemScores.append((item, estimatedScore))
    return sorted(itemScores,key=lambda x:x[1],reverse=True)[:N]

这里的 unratedItems就是我们上面讨论的R1集合，N参数就是我们要给该用户推荐物品的个数

--------------------------------------------------------------------------------------------------------------------------------------------------------

关于上面的simways即相似度的量化方法有很多，比较容易相当的就是欧式距离和余弦相似度，除此之外的就是皮尔逊相关系数，本文主要讲解SVD，这里就不展开说明相似度的事情啦，网上搜索一下，都很简单。

最后说一下两者的联系，其实svd可以用来做pca的，因为在pca阶段我们主要求得是 $XX^{T}$ 特征值和特征向量，对吧（暂不考虑减去均值），而在求svd的左奇异矩阵（U）过程中，也是求得是 $XX^{T}$ 特征值和特征向量对吧，也就是说这里的SVD奇异值的平方就是pca中的特征值对吧，其实在SVD的分解过程中，不用像我们上面讨论的那样先求 $XX^{T}$ ， $X^{T}X$ 特征值和特征向量方法进行分解，而是有很多快速算法，但我们可以根据SVD的结果进行PCA对吧，其实scikit-learn内部的PCA也是用SVD做的

结束啦！！！！！哪里有不对还望大佬指正

深入详解人工智能机器学习算法——逻辑回归算法猿享天开人工智能基础知识学习人工智能机器学习算法逻辑回归
引言逻辑回归（LogisticRegression）是机器学习中一种基本而重要的分类算法。在这篇文章中，我们将深入解析逻辑回归的各个方面，包括其基础知识、数学原理、实现方法、以及应用场景。我们还将通过具体的代码示例和应用案例，帮助您全面理解逻辑回归算法。第一部分：逻辑回归的基础知识1.1什么是逻辑回归？逻辑回归是一种用于解决二分类问题的回归分析方法。尽管名字中带有“回归”，逻辑回归的目标是将预测结
人工智能机器学习基本概念详解猿享天开人工智能基础知识学习机器学习人工智能
人工智能机器学习基本概念详解机器学习（MachineLearning,ML）是人工智能（ArtificialIntelligence,AI）的一个重要分支，旨在让计算机系统自动从数据中学习并进行预测或决策，而无需明确的编程指令。本文将详细探讨机器学习的基本概念，包括监督学习、无监督学习、强化学习及其应用示例。一、机器学习的基本概念1.1数据数据是机器学习的基础。机器学习模型通过分析数据来识别模式和
基于新版PyCharm、Anaconda3、django3框架开发内容发布系统 mys328 pycharm django ide
1：环境安装搭建python有多个版本，可通过Anaconda3来管理python版本从而在多个版本之间进行切换。原先我们团队使用的环境是Anaconda3-2019.07、pycharm-professional-2018.3.5、python3.7，并做了一些爬虫项目，后来由于人工智能机器学习的需要，于是升级版本，使用新的2023版本的，Anaconda3-2023.07-1，pycharm-
花书学习笔记-深度学习概念 iwill323 人工智能深度学习
目录什么是机器学习函数类别机器学习举例步骤第一步：猜测函数第二步：定义Loss第三步：优化从线性到非线性：从函数逼近的角度理解多个特征变量逼近连续曲线表示更有弹性的模型总结用多个Featuresigmoid->ReLU从机器学习到深度学习早期的人工智能机器学习表征学习(representationlearning)深度学习总结主题SupervisedLearningSelf-supervisedL
【深度学习】初识深度学习 wmh1024 深度学习人工智能
初识深度学习什么是深度学习关系：人工智能机器学习深度学习卷积神经网络深度学习和机器学习的关系：机器学习：随着数据量增加会改进性能的算法深度学习：使用多层神经网络学习。深度学习是机器学习的子集。传统系统和深度学习的区别：传统编程系统：定义规则，输入数据获取输出（定义f(x)、x求得y）深度学习系统：输入答案和数据，输出规则（定义x、y求得f(x)，且f(x)具有泛化性）规则f(x)规则f(x)数据x
机器学习 | 深入理解并掌握核心概念亦世凡华、 #机器学习机器学习人工智能深度学习基础概念经验分享
在如今数字化时代的浪潮下，机器学习已经成为人工智能领域的璀璨明星。它像一面魔镜，赋予计算机系统学习和改进的能力，让机器能够从海量数据中提取规律、预测未来，甚至做出智能决策。本专栏将带您踏上机器学习的奇妙之旅，探索其原理、方法和应用。我们将揭开机器学习背后的神秘面纱，解释监督学习、无监督学习、强化学习等不同类型的机器学习算法。目录初识人工智能机器学习概述机器学习算法分类模型评估深度学习概述Jupyt
Python基础语法 Python私教 python python chrome 开发语言
计算机的组成硬件系统CPU：中央处理器存储器：内存，外存输入设备：鼠标，键盘输出设备：显示器，打印机软件系统系统软件：操作系统应用软件：微信、QQ、浏览器等Python简介Python是非常流行的编程语言，主要是因为：简单、易学、适应人群广泛免费、开源应用领域广泛自动化运维自动化测试网络爬虫数据分析人工智能机器学习Web开发注释注释的作用：对代码做解释说明，提高代码的可读性，便于别人阅读代码。被注
人工智能-机器学习-深度学习概念整理洛杉矶县牛肉板面深度学习机器学习深度学习人工智能
目录1.人工智能-ArtificialIntelligence2.机器学习-MachineLearning3.深度学习-DeepLearning4.人工智能机器学习深度学习三者之间的关系5.人工智能的流派6.特征工程-FeatureEngineering7.表示学习8.贡献度分配9.独热码10.word2vec11.神经网络12.端到端学习1.人工智能-ArtificialIntelligence
Ubuntu从ISO创建USB启动盘的工具 python测试开发
图片.pngStartupDiskStartupDiskCreator是Ubuntu中的内置应用程序。要使用它，启动盘创建程序Ubuntu图片.png参考资料讨论qq群630011153144081101本文涉及的python测试开发库谢谢点赞！本文相关海量书籍下载2018最佳人工智能机器学习工具书及下载(持续更新)UNetBootin安装sudoadd-apt-repositoryppa:gez
学习笔记目录雪的期许 go python 机器学习
文章目录⌨️编程基础编程语言工具使用️人工智能机器学习书籍/仓库经典算法评估指标深度学习书籍/仓库模型/数据加工优化方法⌨️编程基础编程语言go语言学习笔记工具使用git使用笔记️人工智能机器学习书籍/仓库机器学习资料-张北海经典算法Bagging和Boosting概念及区别随机森林–Randomforest（Bagging方法）XGBoost的原理、公式推导、Python实现和应用评估指标多分类
机器学习背景介绍与基本概念盛夏未来机器学习算法基础机器学习监督学习回归深度学习
机器学习背景介绍与基本概念人工智能机器学习神经网络深度学习基本概念数据挖掘和机器学习的关系训练数据/验证数据/测试数据监督学习/无监督学习/半监督学习回归/分类/聚类人工智能人工智能（ArtificialIntelligence），英文缩写为AI。是指使用某种算法来实现机器来模拟人的智能或者超越人的智能。人工智能并不是指任何的具体的算法，它只是一个模糊的、大概的概念。机器学习机器学习（Machin
上海交大全球午餐会——大语言模型机器学习ChatGPT（主讲人：赵海） zRezin 聊天机器人直播观后感 nlp 科技
实现强人工智能，从脑计划到与训练模型：在过去的十年中，一段时间很热，后面被人工智能机器学习盖过去了目前脑计划的现状不能宣布失败，仍在进行，但是没有之前那么热。预训练模型正在走向脑计划的方向。特别注意母语窗口是一次性获得的，后面就不容易学习其他语言了语言模型进化史：80年代诞生第一代，后面是连续空间的语言模型。语言概率链式法则改变：是有全空模型，自己模型不久之前：预训练+微调现在：大模型量变引起质变
数据分析工程师_第01讲Google python指南与数据科学python进阶程序员酱油哥 Python基础
第01讲Googlepython指南与数据科学python进阶目录0.python简介深度学习/人工智能机器学习大数据1.寻求帮助2.python运算python基本数据类型、变量、运算、表达式3.变量4.表达式5.字符串字符串切片/slice字符串函数列表/List列表切片流程控制判断条件ifelse循环列表推导式与或非集合/set字典/dict高级排序函数函数：不定长度的参数文件读写统计文件中
Python模块详细介绍 LoisMay Python python 经验分享开发语言
文章目录一、模块介绍二、导入模块的基本格式三、两种格式的优缺点四、补充知识五、循环导入问题六、判断文件类型七、模块的查找顺序一、模块介绍1.如何理解模块模块可以看成一个完整的功能非常强的大代码体使用了模块就相当于你也有这个功能了使用模块编程就相当于站在巨人的肩膀上(智能语音人工智能机器学习......)2.模块分类1>.内置模块内置模块就是python自带的可以直接调用的模块eg：importti
使用python语言、django开发框架、mysql数据库实现简单在线图书推荐系统基于用户的协同过滤推荐算法人工智能机器学习可视化数据分析爬虫个性化图书推荐系统 linge511873822 基于用户的协同过滤推荐算法 python 基于项目的协同过滤推荐算法 python django mysql 可视化数据分析图书推荐系统爬虫机器学习
使用python语言、django开发框架、mysql数据库实现简单在线图书推荐系统基于用户的协同过滤推荐算法人工智能机器学习可视化数据分析爬虫个性化图书推荐系统SimpleBookRecWebPy一、项目简介1、开发工具和使用技术Python3及以上版本，Django3.6及以上版本，mysql8，navicat数据库管理工具或者sqlyog数据库管理工具，bootstrap前端框架，boots
零基础入门影像组学与人工智能七刀人工智能人工智能机器学习 python
下载地址：点这里没有csdn账号的点这里下载：点这里├─第一章人工智能与影像组学在临床研究中的应用│2.人工智能、影像组学在医学研究领域的应用实例.mp4│【试听】人工智能与影像组学是什么？在临床研究中有哪些应用？.mp4│【试听】机器学习临床SCI思路解读.mp4│├─第二章轻松入门机器学习，搞定人工智能基础│1.理论基础：如何做人工智能机器学习研究？.mp4│2.工具基础：轻松入门Python
人工智能（Machine Learning）—— 机器学习 lghgqsy 人工智能机器学习
转载：https://blog.csdn.net/qq_27297393/article/details/82284384机器学习一、人工智能、机器学习与深度学习人工智能机器学习经典机器学习基于神经网络的机器学习浅层学习深层学习(深度学习)强化学习迁移学习二、机器学习基本类型1.有监督学习有监督学习:根据已知的输入和输出，建立联系它们的模型，根据该模型对未知输出的输入进行判断。1)回归：以无限连续
周志华《机器学习》西瓜书新出算法推导视频！（超级详细）深度之眼订阅号
如果你对人工智能跃跃欲试，第一步该怎么办？我通常的做法是，先收集人工智能有关的信息，或者问问身边正在学习的师兄师姐，寻求他们的方法或建议。如果你已经开始学习，并且了解一点机器学习这个概念，那么你就应该知道这本书“周志华《机器学习》”，号称人工智能领域中文版开山之作这是一本面向中文读者的机器学习教科书，适合正在学习机器学习的学生，以及对人工智能机器学习感兴趣的人士。为了让读者通过本书对机器学习有所了
人工智能机器学习现实里的童话xklss
机器学习资料下面是机器学习的资料，让你更深层次的了解以及学习机器学习链接：https://pan.baidu.com/s/1mpze_NnwMJox6TCiL0vX9g密码：u6hy还需要别的python相关资料，请联系QQ：1538444890Ｏ（∩＿∩）Ｏ谢谢
【免费分享淘宝视频教程】pyhton大数据人工智能神经网络爬虫零基础视频教程从入门到精通-百度云 weixin_41341299 Python Python视频教程 Python爬虫
00、Python安装包开发工具、注册01、Python入门到项目实战篇02、Python大数据入门到实战篇03、Python数据分析与数据挖掘篇04、Python高等数学与程序算法篇05、Python人工智能机器学习篇06、Python人工智能神经网络量化交易篇07、Python机器人与自然语言处理篇百度云下载地址：回复关键词Python教程获取下载地址
Windows10+UBUNTU-18.04 -20.04完整新手安装教程大山8606 ubuntu 操作系统 linux 神经网络深度学习
Windows10+UBUNTU双系统新手安装完全教程由于人工智能机器学习，开始学习Python旅程，并花费大量精力时间搭建Windows10下的Python环境，CUDA、TensorFlow、Keras、pytorch、OpenCV………经历各种坑、各种尝试。终于能成功搭建Windows10下的学习环境，顺利跑神经网络程序，一阵窃喜，哈哈哈，感觉良好，小有成绩！忽然发现网上查的资料大都是在Ub
人工智能机器学习-飞桨神经网络与深度学习 Williamtym 深度学习深度学习机器学习 paddlepaddle
飞桨神经网络与深度学习-机器学习目录飞桨神经网络与深度学习-机器学习1.机器学习概述2.机器学习实践五要素2.1.数据2.2.模型2.3.学习准则2.4.优化算法2.5.评估标准3.实现简单的线性回归模型3.1.数据集构建3.2.模型构建3.3.损失函数3.4.模型优化3.5.模型训练3.6.模型评估4.多项式回归4.1.数据集构建4.2.模型构建4.3.模型训练4.4.模型评估5.Runner类
数字化企业安全指南-数字化 IT阿土
数字化企业是信息化企业的升级版，信息化关注的是流程信息化，关注的是业务人财物的信息化运作。数字化是过程数字化的产物，在信息化的基础上扩大了数据采集处理分析应用的范围，信息从录入到采集，信息从结构化到非结构化，信息化模型从业务专业模式到人工智能机器学习和深度学习的自动化模式，数据规模从节俭到奢靡，相对于信息，数字化数据的稀疏矩阵有效性降低。
计算机专业套装书书单推荐人邮异步社区程序人生职业素养程序员修炼
1、深度学习经典教程深度学习+动手学深度学习“花书”与沐神大作双剑合璧，入门深度学习看这一套就够了，来自一线科学家的经验总结，人工智能机器学习AI算法数据科学领域的重磅作品。理论+实战，一套书帮你get深度学习的各种知识。动手学深度学习内容简介：本书旨在向读者交付有关深度学习的交互式学习体验。书中不仅阐述深度学习的算法原理，还演示它们的实现和运行。与传统图书不同，本书的每一节都是一个可以下载并运行
人工智能机器学习数据集收集整理--持续更新中 generalz
关键词：机器学习；人工智能；数据集；标准数据集；自然语言处理；图像识别自然语言处理相关数据集1、实体/名词语义关系标记数据集【DavidS.Batista】2、HackerNews数据集(2006年以来约1/4文章)【Kaggle】3、酒店评价数据集【Kaggle】4、来自StackOverflow平台的Python语言问答数据集【Kaggle】5、来自StackOverflow品台的R语言问答数
【人工智能技术专题】「入门到精通系列教程」打好AI基础带你进军人工智能领域的全流程技术体系（机器学习知识导论）洛神灬殇人工智能机器学习深度学习
零基础带你进军人工智能领域的全流程技术体系和实战指南（机器学习基础知识）前言专栏介绍专栏说明学习大纲前提条件面向读者学习目标核心内容机器学习的概念定义回顾人工智能机器学习概念国外知名学者对机器学习的定义中文翻译机器学习发展历程机器学习和人工智能的关系机器学习和人类学习的对比人类学习的行为处理模式机器学习的行为处理模式经典的「垃圾邮件过滤」应用应用程序原理分析机器学习三要素数据（数据驱动）训练集与数
ChatGPT对未来教育的影响：教师学生需要掌握这个新能力 Do1twell 人工智能机器学习 chatgpt 学习深度学习
美国人工智能公司OpenAI的大语言模型ChatGPT在推出约两个月后，1月已达到1亿月活跃用户，成为历史上增长最快的消费者应用程序。目录01.诞生过程02.背后的技术03.颠覆的行业04.对教育的未来变化01.诞生过程2018年6月，拥有1.17亿参数的GPT1启动，以往的人工智能机器学习要对学习内容事先要做标记，但GPT1可以对未标记文本的不同语料库进行语言模型的生成性预训练，然后对每个特定任
如何给ai机器提供学习数据_人工智能机器学习中的数据伦理 weixin_26704853 人工智能机器学习大数据 python java
如何给ai机器提供学习数据Ethicsisanimportantaspectoflifeandunethicalofanythingissimplyharmfulandscary.Thesameprincipleisalsovalidandlegitimateinthetechnicalworld.Withtheevolutionofbigdataandhighperformantcomputin
2019年上半年收集到的人工智能机器学习方向干货文章城市中迷途小书童
2019年上半年收集到的人工智能机器学习方向干货文章10种机器学习方法，掌握了就可以称霸朋友圈人工智能常见算法简介机器学习中的最优化算法总结最萌算法学习来啦，看不懂才怪！TheNextStep人工智能的学习，需要学习哪些算法和数学知识呢？需要什么学历？一文读懂机器学习项目的完整生命周期80+机器学习数据集，还不快收藏人工智能常见算法简介目前最实用的机器学习算法，你认为是哪几种？算法工程师必须要知道
Python和Java二选一该学啥？大方老师讲单片机硬件工程师自动化智能 javascript java-ee java 前端框架架构
Python和Java二选一该学啥？有网友说Python和Java之间选择一门进行学习，现在很纠结该选哪个。不知道这两种语言都有什么前景？选java，选java，选java！！！千万别听某些人说的什么python人工智能机器学习，是未来的发展balabala的。python对于人工智能工程师来说，最多也就相当螺丝刀与修理工，懂么，只是一种工具，且是工具之一。就业要求也比较简单，985211硕士。达
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe

PCA SVD原理详解及应用

本文分为两大部分即PCA和SVD，每一部分下又分为原理和应用两小部分

说明：本文代码参考Peter Harrington编写的Machine Learning in Action,感兴趣的小伙伴可以去看一下，笔者认为这本书还不错

废话不多说开始吧

PCA:

公式（1）是我们熟悉的求特征值的式子，假设X是m*m，我们根据其求出了特征值以及每个特征值对应的特征向量。

这里的是一个对角矩阵，对角线上值就是所有的特征值，那么可以看到X最后可以根据（2）进行分解，一般的习惯

所以

在实际降维时，往往先要转化坐标轴，使坐标轴尽可能的覆盖多的数据，即找数据最大方差的位置，其往往给出了数据的最重要信息，比如找到后我们记该方向为x轴，那么其y轴就是与x轴垂直的方向。

所以思路就是找先将原始矩阵每一个元素减去其自身均值进行标准归一化，然后求得其协方差，最后再求协方差的特征值和特征向量，注意不是求原矩阵的特征值和特征向量。

但上面分解的前提是X必须为方阵那如果X不是方阵呢即是m*n，这时候SVD隆重登场

SVD

首先看一下SVD矩阵分解公式：

这里的其实是一个对角矩阵，对角线上面的值就称为奇异值，和分别称为左奇异矩阵、右奇异矩阵

这里的该怎么求呢？

先来看一下U：

我们求的特征值和特征向量，然后将所有的特征向量展开放到一个矩阵，该矩阵就是U

我们求的特征值和特征向量，然后将所有的特征向量展开放到一个矩阵，该矩阵就是V

注意这里我们将U和V中所有特征向量也进行了归一化，即

那么怎么求呢，从上面的简单证明可以明显看出，其就是特征值的平方根，

到这里我们就将SVD的分解原理叙述完毕啦，回头看看其实还是挺简单的对吧，下面来看看SVD的具体用途：

用的比较多的应该就是推荐系统里面的吧

可以看到原本是使用黄色来重构X，现在只使用红色就可以近似重构X，即达到了降维目的，那么这里的具体是什么含义呢？

它其实就是将每个用户映射到二维（原先是4维，分别代表辣条，薯片，可乐，冰红茶），在这两维中，小花和小明相似度相近，而小李

其实上面两种解释对应着两种不同的推荐策略：基于用户(客户数不变，即行数不变，压缩列数，归类物品)和基于物品(物品数不变，即列数不变，压缩行数，归类客户)。

在python中有现成的库可以用.来进行SVD矩阵分解，其返回的是三个矩阵，分别对应

现实中一般是行数对于列数（客户多，商品少），所以多采用基于商品，即要得到V

假设现在我们要给用户a推荐物品，那怎么做呢？

关于上面的simways即相似度的量化方法有很多，比较容易相当的就是欧式距离和余弦相似度，除此之外的就是皮尔逊相关系数，本文主要讲解SVD，这里就不展开说明相似度的事情啦，网上搜索一下，都很简单。

结束啦！！！！！哪里有不对还望大佬指正

你可能感兴趣的:(人工智能机器学习)

公式（1）是我们熟悉的求特征值的式子，假设X是m*m，我们根据其求出了 $\lambda _{1},\lambda _{2},\cdots \lambda _{m}$ 特征值以及每个特征值对应的特征向量。

这里的 $\Sigma$ 是一个对角矩阵，对角线上值就是所有的特征值，那么可以看到X最后可以根据（2）进行分解，一般的习惯 $VV^{T}=E$

所以 $V^{-1}=V^{T}$

这里的 $\Sigma_{m\times n}$ 其实是一个对角矩阵，对角线上面的值就称为奇异值， $U_{m\times m}$ 和 $V_{n\times n}$ 分别称为左奇异矩阵、右奇异矩阵

这里的 $U,\Sigma ,V$ 该怎么求呢？

$(XX^{T})v=\lambda v$ 我们求 $XX^{T}$ 的特征值和特征向量，然后将所有的特征向量展开放到一个矩阵，该矩阵就是U

$(X^{T}X)v=\lambda v$ 我们求 $X^{T}X$ 的特征值和特征向量，然后将所有的特征向量展开放到一个矩阵，该矩阵就是V

注意这里我们将U和V中所有特征向量也进行了归一化，即 $UU^{T}=E , VV^{T}=E$

那么 $\Sigma$ 怎么求呢，从上面的简单证明可以明显看出，其就是特征值的平方根，

可以看到原本是使用黄色来重构X，现在只使用红色就可以近似重构X，即达到了降维目的，那么这里的 $U_{3*2}$ 具体是什么含义呢？

在python中有现成的库可以用.来进行SVD矩阵分解，其返回的是三个矩阵，分别对应 $U,\Sigma ,V$