SIGAI_csdn

理解主成分分析 (PCA)

原创声明：本文为 SIGAI 原创文章，仅供个人学习使用，未经允许，不得转载，不能用于商业目的。

导言

主成分分析法 (PCA) 是一种常用的数据分析手段。对于一组不同维度之间可能存在线性相关关系的数据，PCA能够把这组数据通过正交变换变成各个维度之间线性无关的数据。经过 PCA 处理的数据中的各个样本之间的关系往往更直观，所以它是一种非常常用的数据分析和预处理工具。PCA 处理之后的数据各个维度之间是线性无关的，通过剔除方差较小的那些维度上的数据我们可以达到数据降维的目的。在本文中，我们将介绍 PCA的原理、应用以及缺陷。

为什么要有 PCA

如果数据之中的某些维度之间存在较强的线性相关关系，那么样本在这两个维度上提供的信息有就会一定的重复，所以我们希望数据各个维度之间是不相关的 (也就是正交的)。此外，出于降低处理数据的计算量或去除噪声等目的，我们也希望能够将数据集中一些不那么重要 (方差小) 的维度剔除掉。例如在下图中，数据在 x 轴和 y 轴两个维度上存在着明显的相关性，当我们知道数据的 x 值时也能大致确定 y 值的分布。但是如果我们不是探究数据的 x 坐标和 y 坐标之间的关系，那么数据的 x 值和 y 值提供的信息就有较大的重复。在绿色箭头标注的方向上数据的方差较大，而在蓝色箭头方向上数据的方差较小。这时候我们可以考虑利用蓝色和绿色的箭头表示的单位向量来作为新的基底，在新的坐标系中原来不同维度间线性相关的数据变成了线性不相关的。由于在蓝色箭头方向上数据的方差较小，在需要降低数据维度的时候我们可以将这一维度上的数据丢弃并且不会损失较多的信息。如果把丢弃这一维度之后的数据重新变化回原来的坐标系，得到的数据与原来的数据之间的误差不大。这被称为重建误差最小化。PCA 就是进行这种从原坐标系到新的坐标系的变换的。

图 1: 示意图

如何计算PCA

数据经过 PCA 变换之后的各个维度被称为主成分，各个维度之间是线性无关的。为了使变换后的数据各个维度提供的信息量从大到小排列，变换后的数据的各个维度的方差也应该是从大到小排列的。数据经过 PCA 变换之后方差最大的那个维度被称为第一主成分。

我们先来考虑如何计算第一主成分。假设每一条原始数据是一个 m 维行向量，数据集中有 n 条数据。这样原始数据就可以看作一个 n 行 m 列的矩阵。我们将其称为 X，用代表数据集中的第 i 条数据(也就是 X 的第 i 和行向量)。这里为了方便起见，我们认为原始数据的各个维度的均值都是 0。当原始数据的一些维度的均值不为 0 时我们首先让这一维上的数据分别减去这一维的均值，这样各个维度的均值就都变成了 0。为了使 X 变化到另一个坐标系，我们需要让 X 乘以一个 m × m 的正交变换矩阵 W。W 视为由列向量组成。我们让X和W进行矩阵相乘之后就可以原始数据变换到新的坐标系中。

T = XW

为了使变换不改变数据的大小，我们让 W 中的每个列向量 wi 的长度都为 1，也就是。T 中的各个列向量为。为了使第一主成分 (t1) 的方差最大，

上述最优化问题中 w1 的长度被限制为 1，为了求解 w1，我们将其变成如下的形式:

因为当 C 是一个不为零的常数时，

这时候求解出的是 w1 的方向。我们只要在这个方向上长度取长度为 1的向量就得到了结果。是一个非常常见的瑞利熵，其更一般的形式是

这里的 M 是一个厄米特矩阵 (Hermitian Matrix)，在本文中我们可以将其认为是一个实对称矩阵;x 是一个长度不为零的列向量。求解瑞利熵的最值需要对实对称矩阵的对角化有一定的了解。这里的很显然是一个实对称矩阵。对一个实对称矩阵进行特征值分解，我们可以得到:

这里的 D 是一个对角矩阵，对角线上的元素是特征值;P =< p1, p2, ..., pn >，每个 pi 都是一个长度为 1 的特征向量，不同的特征向量之间正交。我们将特征值分解的结果带回瑞利熵中可以得到

这里的这时有。这样就构成了一个一维凸包。根据凸包的性质我们可以知道，当最大的 λi 对应的 αi = 1 时整个式子有最大值。所以当 x 的为最大的特征值对应的特征向量时瑞利熵有最大值，这个最大值就是最大的特征值。根据这个结论我们就可以知道 w1 就是 XT X 的最大的特征值对应的特征向量，第一主成分 t1 = Xw1。这样我们就得到了计算第一主成分的方法。接下来我们继续考虑如何计算其他的主成分。因为 W 是一个正交矩阵，所以

因为 wk 和 w1, w2, ..wk−1 正交，

为了使第 k 个主成分在与前 k - 1 个主成分线性无关的条件下的方差最大，那么 wk 应该是第 k 大的特征值对应的特征向量。经过这些分析我们就能发现变换矩阵 W 中的每个列向量就是的各个特征向量按照特征值的大小从左到右排列得到的。

接下来我们对如何计算 PCA 做一个总结:

1、把每一条数据当一个行向量，让数据集中的各个行向量堆叠成一个矩阵。

2、将数据集的每一个维度上的数据减去这个维度的均值，使数据集每个维度的均值都变成 0，得到矩阵 X。

3、计算方阵的特征值和特征向量，将特征向量按照特征值由大到小的顺序从左到右组合成一个变化矩阵 W。为了降低数据维度，我们可以将特征值较小的特征向量丢弃

4、计算 T = XW，这里的 T 就是经过 PCA 之后的数据矩阵。

除了这种方法之外，我们还可以使用奇异值分解的方法来对数据进行 PCA处理，这里不再详细介绍。

PCA 的应用

首先我们来看一下 PCA 在数据降维方面的应用。我们在 MNIST 数据集上进行了测试。我们对 MNIST 的测试集中的每一幅 28×28 的图片的变成一个 784 维的行向量，然后把各幅图片拼接成的行向量堆叠一个 784×10000 的数据矩阵。对这个数据矩阵进行 PCA 处理。处理得到的特征值的分布如下图。通过图片我们可以看出前面一小部分的特征值比较大，后面的特征值

图 2: MNIST 数据集特征值的分布

都比较接近于零。接下来我们取前 200，300 个主成分对数据进行重建。我们发现使用前 200 个主成分重建的图像已经能够大致分辨出每个数字，使用前 300 个主成分重建的图像已经比较清晰。根据实验我们可以发现 PCA 能够在丢失较少的信息的情况下对数据进行降维。

PCA 在自然语言处理方面也有比较多的应用，其中之一就是用来计算词向量。word2vec 是 Google 在 2013 年提出了一个自然语言处理工具包，

图 3: 原始图像

图 4: 使用前 200 个主成分重建的图像

图 5: 使用前 300 个主成分重建的图像

其思想是用一个向量来表示单词，意思和词性相近的单词对应的向量之间的距离比较小，反之则单词之间的距离比较大。word2vec 原本是使用神经网络计算出来的，本文中的 PCA 也可以被用于计算词向量。具体的做法为: 构建一个单词共生矩阵，然后对这个矩阵进行 PCA 降维，将降维得到的数据作为词向量。使用这种方法构造出的词向量在单独使用时效果虽然不如使用神经网络计算出的词向量，但是将神经网络构造出来的词向量和使用 PCA 降维得到的词向量相加之后得到的词向量在表示词语意思时的效果要好于单独使用神经网络计算出来的词向量。

图 6: 一个共生矩阵的例子，

图片来自于斯坦福大学公开课 cs224n 课件

PCA 的缺陷

虽然 PCA 是一种强大的数据分析工具，但是它也存在一定的缺陷。一方面，PCA 只能对数据进行线性变换，这对于一些线性不可分的数据是不利的。为了解决 PCA 只能进行线性变换的问题，Schölkopf, Bernhard 在 1998 年提出了 Kernel PCA。Kernel PCA 在计算 M =的时候不是直接进行相乘，而是使。这里的K(xi,xj)是一个与支持向量机中类似的核函数。这样就能够对数据进行非线性变换。另一方面，PCA 的结果容易受到每一维数据的大小的影响，如果我们对每一维数据乘以一个不同的权重因子之后再进行 PCA降维，得到的结果可能与直接进行PCA降维得到的结果相差比较大。对于这个问题，Leznik 等人在论文Estimating Invariant Principal Components Using Diagonal Regression 中给出了一种解决方案。除此之外，PCA 要求数每一维的均值都是0，在将原始数据的每一维的均值都变成0时可能会丢失掉一些信息。虽然PCA有这些缺陷，但是如果合理的利用，PCA 仍然不失为一种优秀的数据分析和降维的手段。

参考文献

Pearson, K. (1901). ”On Lines and Planes of Closest Fit to Systems of Points in Space”.http://stat.smmu.edu.cn/history/pearson1901.pdf. Philosophical Magazine. 2 (11):559–572.
Principal component analysis(主成分分析). https://en.wikipedia.org/wiki/Principal_component
Rayleigh quotient(瑞利熵). https://en.wikipedia.org/wiki/Rayleigh_quotient.Wikipedia.
Hermitian matrix(厄米特矩阵). https://en.wikipedia.org/wiki/Hermitian_matrix.Wikipedia.
Yann LeCun. [MNIST 数据集] (http://yann.lecun.com/exdb/mnist/).
Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg Corrado, Je rey Dean.(2013)”Distributed Representations of Words and Phrases and their Compositionality”.https://arxiv.org/pdf/1310.45 arxiv.org.
Schölkopf, Bernhard (1998). ”Nonlinear Component Analysis as a Kernel Eigenvalue Problem”. Neural Computation. 10: 1299–1319. doi:10.1162/089976698300017467.
Leznik, M; Tofallis, C. 2005 [uhra.herts.ac.uk/bitstream/handle/2299/715/S56.pdf Estimating Invariant Principal Components Using Diagonal Regres-
sion.]

原创声明：本文为 SIGAI 原创文章，仅供个人学习使用，未经允许，不得转载，不能用于商业目的。

推荐阅读

[1] 机器学习-波澜壮阔40年 SIGAI 2018.4.13.

[2] 学好机器学习需要哪些数学知识？SIGAI 2018.4.17.

[3] 人脸识别算法演化史 SIGAI 2018.4.20.

[4] 基于深度学习的目标检测算法综述 SIGAI 2018.4.24.

[5] 卷积神经网络为什么能够称霸计算机视觉领域？ SIGAI 2018.4.26.

[6] 用一张图理解SVM的脉络 SIGAI 2018.4.28.

[7] 人脸检测算法综述 SIGAI 2018.5.3.

[8] 理解神经网络的激活函数 SIGAI 2018.5.5.

[9] 深度卷积神经网络演化历史及结构改进脉络-40页长文全面解读 SIGAI 2018.5.8.

[10] 理解梯度下降法 SIGAI 2018.5.11

[11] 循环神经网络综述—语音识别与自然语言处理的利器 SIGAI 2018.5.15

[12] 理解凸优化 SIGAI 2018.5.18

[13]【实验】理解SVM的核函数和参数 SIGAI 2018.5.22

[14]【SIGAI综述】行人检测算法 SIGAI 2018.5.25

[15] 机器学习在自动驾驶中的应用—以百度阿波罗平台为例（上） SIGAI 2018.5.29

[16] 理解牛顿法 SIGAI 2018.5.31

[17] 【群话题精华】5月集锦—机器学习和深度学习中一些值得思考的问题 SIGAI 2018.6.1

[18] 大话Adaboost算法 SIGAI 2018.6.1

[19] FlowNet到FlowNet2.0：基于卷积神经网络的光流预测算法 SIGAI 2018.6.4

深入解析React Server Components：服务端组件技术革新
深入解析ReactServerComponents：服务端组件技术革新前言React团队提出的ServerComponents（服务端组件）是一项突破性的技术演进，它重新定义了React应用的架构模式。本文将全面剖析这一技术，帮助开发者理解其核心价值和应用场景。什么是ServerComponents？ServerComponents是React的一种新型组件，它们只在服务端执行，具有以下关键特性：
从网页到游戏，WebSocket、Socket、TCP 和 HTTP 的真实差别云心雨禅云计算网络游戏 websocket tcp/ip http 信息与通信
前言在现代网络世界中，WebSocket、Socket、TCP和HTTP就像四位性格迥异的通信使者。它们各司其职，有的擅长短平快的交流，有的精通持久连接的深情对话。但你是否真正理解它们之间的区别？又该如何为你的项目选择最合适的“通信方式”？今天，我们就来揭开这些神秘协议的面纱，用小白也能听懂的语言，带你走进网络世界的“语言系统”。一、四位“通信使者”HTTP：礼貌周到的“前台接待员”HTTP是我们
初见：冬天开的猫印象繁星月影
跟随着八月的雨的足迹，邂逅了一只优秀博学的猫。于辛丑年甲午月壬辰日晚，与友冬天开的猫初见，缘于友八月的雨文理解是一门艺术中的评论。由于这段对话，我也很好奇啊，于是我也去见识见识这脑洞大开想象力丰富的人儿，悄悄的关注一下，向优秀的友学习，打算悄悄的去膜拜友的文。猫姐姐，在这看不出年龄距离，看大家都这样称呼，感觉比较亲切。之前猫的签名“你好，我这有些故事”，正好我也是喜欢看故事的人，喜欢听故事。后来签
前言风中玉
坚持写，不放弃。勇敢写。写出特色，写出心声。写出特别的声音。写出创作者的灵魂。周一正式开始创新小说，用心写，写好小说。我相信，在创作的路上要有决心，更要相信自己，不怕孤独，不怕没人理解。不怕没人表扬。在成功的路上总是孤独而艰辛的。加油，风中玉！无论成败！
HTML+CSS+JS binzhenliziyuan javascript html css
HTML+CSS+JSHTML基础1.HTML文件中的DOCTYPE是什么作用？2.HTML、XML、XHTML之间有什么区别？3.前缀为data-开头的元素属性是什么？4.谈谈你对HTML语义化的理解？5.HTML5对比HTML4有哪些不同之处？6.meta标签有哪些常用用法？7.img标签的srcset的作用是什么？8.响应式图片处理优化:Picture标签9.在script标签上使用defe
为什么我们要调用API？用“点外卖”理解程序员的生存智慧
你有没有想过：为什么用手机点奶茶时，不用自己去茶园摘茶叶、买奶精、找杯子？因为有人早已把这些麻烦事打包成“服务”，你只需“点一点”就能享受结果。程序员写代码同理——调用API，就像点外卖：无需自己种粮食、养奶牛、建厨房，直接调用他人封装好的功能，把精力聚焦在更核心的事上。今天，我们用最通俗的语言，聊聊为什么对程序员来说，“调用API”比“自己从头做”更聪明。一、操作系统：你家的“全能大
理解函数参数及arguments 学的会的前端
函数参数的确定ECMAScript中函数的参数在内部使用一个数组来表示的。函数接收到的始终是这个数组，而不关心数组中有多少个参数或者参数的类型是什么。functionfn(name,age,sex){console.log(name);console.log(age);console.log(sex);}fn('xiao',23,'nv');//xiao23nvconsole.log('-----
Transformer：自注意力驱动的神经网络革命引擎大千AI助手人工智能 Python #OTHER transformer 神经网络深度学习 google 人工智能机器学习大模型
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从语言理解到多模态智能的通用架构基石⚙️一、核心定义与历史意义Transformer是由Google团队在2017年论文《AttentionIsAllYouNeed》中提出的深度学习架构，其颠覆性创新在于：完全摒弃RNN/CNN：仅依赖自注意力机制（S
[特殊字符] LLM（大型语言模型）：智能时代的语言引擎与通用推理基座大千AI助手人工智能 Python #OTHER 语言模型人工智能自然语言处理 LLM 大模型 Transformer
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从千亿参数到人类认知的AI革命一、核心定义与核心特征LLM（LargeLanguageModel）是基于海量文本数据训练的深度学习模型，通过神经网络架构（尤其是Transformer）模拟人类语言的复杂规律，实现文本理解、生成与推理任务。其核心特征可概
DDD核心知识解析我是廖志伟 Java场景面试宝典 DDD Domain-Driven Design Software Architecture
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
ShardingSphere详解我是廖志伟 Java场景面试宝典 ShardingSphere Distributed Database Middleware
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
微服务架构核心技术我是廖志伟 Java场景面试宝典 Service Governance Microservices Distributed Systems
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Spring MVC 技术解析我是廖志伟 Java场景面试宝典 Spring MVC Java Web MVC Design Pattern
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
领域驱动设计核心解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Spring技术全解析我是廖志伟 Java场景面试宝典 Spring Framework IoC Container AOP
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
2021-08-10：误判的心理——查理·芒格对人类心理学研究所在 [1] 会说话的河马
昨天谈到盲点很难发现，涉及了一点人的心理。今天想了想，想停下来稍微来聊一下人复杂的心理。心理学其实是一门实证主义的学科，并不是很多人理解伪科学。同时心理学确又是不断在自我颠覆的学科，很多今天人理解的心理学现象的解释，已经经历过很多个理论或版本的演绎了。因为工作关系，需要学习心理学。不是专业学这个的门外汉要学一点专业性很强的学科，总是避免不要要找大众读物来科普自己。在汗牛充栋的心理学大厦门前，我拜读
并发编程核心技术我是廖志伟 Java场景面试宝典 Concurrency Java Multithreading
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
ShardingSphere技术解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
并发编程与MyBatis核心解析我是廖志伟 Java场景面试宝典 Concurrent Programming Java MyBatis
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
【生活感悟】婚姻的本质是什么？豪小
下午刚刚得知堂姐离婚了。十几年的婚姻就在今天结束了，堂姐夫在朋友圈说，既然给不了幸福，就给你自由，从今往后各自安好。以前我总是不能理解为什么相爱的人不能在一起，就像我不能理解朋友口中一对夫妻因为双方父母的催婚，而勉强的在一起。我现在能理解了，因为涉及的因素太多了。不想谈恋爱。因为麻烦又伤心，直接结婚更省事。站在我自己的角度，不知道怎么去表达听到堂姐的离婚的事，心里会堵得慌，因为近二十年的夫妻感情不
ShardingSphere 架构解析我是廖志伟 Java场景面试宝典 Database Distributed Systems ShardingSphere
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
html sql连接mysql数据库_HTML连接sql数据库旋风1968 html sql连接mysql数据库
怎样从HTML网页中获取SQL数据库里的数据我现在是一名学生，第一学期快结束了，老师要CSS布局HTML小编今天和大家分享我们每个学习小组用C#做HTML是无法读取数据库的，HTML是页面前端脚本语言，要想从HTML网页中获取SQL数据库里的数据，需要借助JSP或ASP或PHP或RUBY等语言来实现。简单的关系可以这样理解：数据库JSP或ASP或PHP或RUBY等语言HTML如：在JSP页面中显示
2018.11.24 不爱吃糖的黑色dog
深深的孤独和寂寞，生活一点一点回到正轨，需求也慢慢变的更多，欲望啊！渴求被理解的欲望，求而不得，孤独寂寞纷至沓来。图片发自App
不知道为啥，就是觉得在直播间刷礼物和买东西好傻周逸文
不能理解两种人：一种，给主播刷礼物的；第二种就是在直播间买东西的。人家比你有钱，你给他刷啥礼物，这种人不能叫傻，应该叫脑残。之前一直不理解到底是什么样的人在干这件事，直到我在现实生活中遇到了一个活生生例子——暂且叫他L先生吧。L先生是90后，爱装逼，还没钱。但是他把工资的一半都打赏给了一个不怎么红的小主播，我都惊呆了。我问他：“你认识她？她是你的朋友吗？”我是觉得给认识的人刷点礼物，支持一下她的直
安在当下安素姐姐
中午闺蜜几个吃饭，不知怎么就聊起了喝酒的事。对于我的酒量，大家纷纷表示，不敢苟同，还是少喝为妙！确实，酒量几乎为零的我，从工作开始这三十年来，只要喝酒，每每以失败告终。也有过几次不得不喝的惨痛经历，让自己痛下决心不就喝酒了。可是，这件事情说起来容易做起来难。就拿我的老师来说，2012年时，我的老师说她要戒酒了。而且还在自己的博客里高调地宣布：我要戒酒了。从那以后，老师还真是很少喝酒了。我非常理解她
向着开满鲜花的峡谷——读《根鸟》梦轩斋
向着开满鲜花的峡谷——读《根鸟》梦轩，20201014【读】根鸟不是鸟，是一个男孩，一个不太一样的男孩。他梦想成为一个出色的猎手，却在白鹰的指引下，要去解救一个掉进峡谷的女孩子——紫烟。那是一片长满了百合花的峡谷，水边、坡上、岩石旁、大树下，到处都是，不疯不闹，静谧美好。这是根鸟自己的梦。而根鸟却不觉得是梦。尽管所有的人都不理解，甚至嘲笑他。除了他的父亲。根鸟家只有他和父亲，他的母亲，在他一岁的时
给教师的建议（第62条）栗子的栗_1a02
给教师的建议（第62条）让学生生活在思考的世界里人应当首先在思考领域里成为劳动者他读这些书不是为了去记熟它和背诵它，而是出于一种思考、认识、发现和好奇的需要，只有这样，这个学生才会成为一个会思考的劳动者。怎样才能使思考的活动在学校里占据统治地位，怎样才能使思考、认识、发现、理解和求知的需要，成为一个人的最主要的精神需要呢？这里就需要运用教师的智慧。在每一个年轻的心灵里，都存放着求知好学。渴求知识的
17.论语~譬如北辰，领导者的最高境界，是不打扰会飞的鱼topyux
子曰：为政以德，譬如北辰，居其所而众星拱之。这句话直译过来就是，如果你用德行，来这里国家就如北极星养殖，需要在自己本来的位置就够了，重心依然会围绕着你。理解孔子的这句话呢？我们先从老子最为人熟知的一句话说起，治大国若很小，先当小鱼，小虾在锅里的时候不能总去翻动它们，否则就会搅得一团糟之大国也是如此，不能总是折腾。我们举个最简单的例子，就是不要像乾隆那样，总是下江南劳民伤财。一本书叫复杂，这本书讲了
Redis——API的理解和使用莫问以
一、全局命令1、查看所有键keys*下面插入了3对字符串类型的键值对：127.0.0.1:6379>sethelloworldOK127.0.0.1:6379>setjavajedisOK127.0.0.1:6379>setpythonredis-pyOKkeys*命令会将所有的键输出：127.0.0.1:6379>keys*1)"python"2)"java"3)"hello"2、键总数dbsi
【V8.0 - 语言篇 II】AI的“文案扫描仪”：解剖脚本，量化内容的“灵魂骨架” 爱分享的飘哥 AI视频内容智能分析人工智能
在上一篇《AI的“标题嗅觉”：用向量技术闻出爆款标题的味道》中，我们成功地赋予了AI“嗅觉”，让它能理解标题的深层语义。但我们都知道，标题只是“开胃菜”，真正决定观众能否“吃”得津津有味，甚至“再来一碗”（点赞、关注）的，是那几百上千字的文案/脚本——这才是视频的“主菜”。“一篇好的文案，就像一栋精心设计的建筑。它有承重墙（核心观点），有漂亮的窗户（金句），有引导人流的楼梯（叙事结构），还有吸引人
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

理解主成分分析 (PCA)

导言

为什么要有 PCA

如何计算PCA

PCA 的应用

PCA 的缺陷

你可能感兴趣的:(理解主成分分析 (PCA))