小麦粒

PCA（一）

文章目录

一、知识点
- 1.1 概念理解
- 1.2 常见降维算法
二、PCA(Principal Component Analysis)降维
- 2.1 PCA无监督降维技术
- 2.2 PCA算法步骤：
- 2.3 低维空间维数d的选取
- 2.4 PCA降维的准则
- 2.5 降维的优化目标
- 2.6 PCA算法的数学基础
三、核PCA
四、奇异值分解
五、主成分数目分析方法
- 5.1 随机
- 5.2 累积变异的百分比
- 5.3 变异的百分比
六、LDA一种监督学习的降维技术
- 6.1 LDA理解
- 6.2 LDA总结
- 6.3 LDA与PCA的相同点
- 6.4 LDA与PCA的不同点
七、奇异值分解（SVD）
- 7.1 SVD用于PCA
- 7.2 SVD小结
- 7.3 SVD的应用
八、应用
有趣的事，Python永远不会缺席
培训说明

一、知识点

1.1 概念理解

所谓的降维就是指采用某种映射方法，将原高维空间中的数据点映射到低维度的空间中，即PCA通过线性变换将原始数据变换为一组各维度线性无关的表示，可用于提取数据的主要特征分量，常用于高维数据的降维。在降低维度的过程中，我们想要保留更多的特征，PCA就是经过数学推导，保留最多特征同时降维的方法。
PCA是一个线性方法，由于PCA只是简单对输入数据进行变换，所以它既可以用在分类问题，也可以用在回归问题。非线性的情况可以使用核方法kernelized PCA，但是由于PCA有良好的数学性质、发现转换后特征空间的速度、以及再原始和变换后特征间相互转换的能力，在降维或者说特征抽取时，它已经可以满足大部分情况。
给定原始空间，PCA会找到一个到更低维度空间的线性映射。因为需要使所有样本的投影尽可能分开，则需要最大化投影点的方差。
具有如下性质
1.保留方差是最大的
2.最终的重构误差（从变换后回到原始情况）是最小的
降维有两种方法

特征消除：将会直接清除那些我们觉得不重要的特征，这会使我们丢失这些特征中的很多信息。
特征提取：通过组合现有特征来创建新变量，可以尽量保存特征中存在的信息。

1.2 常见降维算法

主成分分析PCA(Principal Component Analysis)
线性判别分析LDA(LinearDiscriminantAnalysis)
奇异值分解SVD（Singular Value Decomposition）
因子分析FA（factor analysis）
独立成分分析ICA（Independent Component Correlation Algorithm）
局部线性嵌入LLE（Locally Linear Emding）
拉普拉斯矩阵Laplacian Eigenmaps

二、PCA(Principal Component Analysis)降维

2.1 PCA无监督降维技术

PCA（主成分分析）就是一种常见的特征提取方法,会将关系紧密的变量变成尽可能少的新变量，使这些新变量是两两不相关的,于是就可以用较少的综合指标分别代表存在于各个变量中的各类信息。

2.2 PCA算法步骤：

1）对所有样本进行中心化操作

2）计算样本的协方差矩阵

3）对协方差矩阵做特征值分解

4）取最大的d个特征值对应的特征向量，构造投影矩阵W
　具体PCA操作步骤
1）将原始数据按列组成n行m列矩阵X

2）将X的每一行（代表一个属性字段）进行零均值化，即减去这一行的均值

3）求出协方差矩阵

4）求出协方差矩阵的特征值及对应的特征向量

5）将特征向量按对应特征值大小从上到下按行排列成矩阵，取前k行组成矩阵P

6）Y=PX即为降维到k维后的数据

2.3 低维空间维数d的选取

通常低维空间维数d的选取有两种方法：
1）通过交叉验证法选取较好的d
2）从算法原理的角度设置一个阈值，比如t=0.95，然后选取使得下式成立的最小的d值：

Σ（i->d）λi/Σ（i->n）λi>=t，其中λi从大到小排列

2.4 PCA降维的准则

最近重构性：重构后的点距离原来的点的误差之和最小
最大可分性：样本点在低维空间的投影尽可能分开

2.5 降维的优化目标

降维问题的优化目标：将一组N维向量降为K维（K大于0，小于N），其目标是选择K个单位（模为1）正交基，使得原始数据变换到这组基上后，各字段两两间协方差为0，而字段的方差则尽可能大（在正交的约束下，取最大的K个方差）。

2.6 PCA算法的数学基础

假设我们有M条数据，每个数据有N个特征，被称为样本集X。

对于矩阵X而言，其协方差矩阵为：（协方差矩阵的计算方法可以自行查阅资料，在此不作赘述）
特征矩阵X中可能存在很多冗余的信息，那么现在我们将其映射到另外一个特征空间中，得到矩阵Z
Z的协方差矩阵为D。
可以发现Z的协方差矩阵也为一个对角矩阵，对角线的值是方差，其余值是协方差，为0，代表向量正交。
我们将特征空间转换的过程写作Z = XU，代入矩阵D，可知：

也就是说 U = Q 。

U 就是矩阵 C 特征向量所组成的矩阵。

矩阵 D 对角线上每个值就是矩阵 C 的特征值。

三、核PCA

针对非线性数据集进行降维。核类别有：线性、多项式、sigmoid、余弦值、预先计算的、RBF。
PCA: Principle Component Analysis, PCA 主成分分析，计算代价高昂，只适用于特征向量间
（1）存在线性相关的环境下。
（2）将数据集中心化；
（3）找出数据集的相关矩阵和单位标准偏差值；
（4）将相关矩阵分解成它的特征向量和值；
（5）基于降序的特征值选择Top-N特征向量；
（6）投射输入的特征向量矩阵到一个新空间。

四、奇异值分解

奇异值分解：Singular Value Decomposition, SVD, 与PCA不同，直接作用于原始数据矩阵。SVD把mn矩阵分解成三个矩阵的乘积：A = USV^T 。
（1）U：左奇异矩阵，mk矩阵。
（2）V：右奇异矩阵，nk矩阵。
（3）S：该矩阵的对角线值为奇异值，kk矩阵。

五、主成分数目分析方法

5.1 随机

我们只需要选择一个合适的特征数目即可。
这种方法高度依赖于数据集本身的特征以及我们想要分析的内容是什么
例如在二维平面内将多维数据进行可视化是非常有用的。
那么我们只需要将多维的数据逐渐缩小，直至成为二维数据为止。

5.2 累积变异的百分比

我们通过计算每个成分因子能够解释原始数据变异的百分比。
然后将不同成分因子所能解释的变异百分比相加。
我们就得到了一个值，被称之为累积变异百分比。
在PCA的过程中，我们将选择能使得这个值最接近于1的维度个数。
-

显然可以看出，随着成分数目的增加，累积变异百分比逐渐增加。

当我们需要累积变异百分比大于0.8时，我们至少需要6个主成分因子。

通常不建议使得累积百分比等于1，这将会导致有些主成分带来冗余信息。

5.3 变异的百分比

我们通过计算每个成分因子能够解释原始数据变异的百分比。
如上图所示，我们也可以选择三个成分。
因为当我们增加第四个主成分因子时，会发现其变异的百分比很小。
而且增加它对于累积变异的百分比没有太大的影响。只有略微的增加。
如果我们把 D 中的特征值按照从大到小，将特征向量从左到右进行排序。
然后取其中前 k 个，经过转换（Z = XU），就得到了我们降维之后的数据矩阵 Z
这样我们就成功的把N维数据降低到了K维

LDA一种监督学习的降维技术

六、LDA一种监督学习的降维技术

6.1 LDA理解

（1）LDA线性判别分析也是一种经典的降维方法，LDA是一种监督学习的降维技术，也就是说它的数据集的每个样本是有类别输出的。

（2）这点和PCA不同。PCA是不考虑样本类别输出的无监督降维技术。LDA的思想可以用一句话概括，就是“投影后类内方差最小，类间方差最大”。要将数据在低维度上进行投影，投影后希望每一种类别数据的投影点尽可能的接近，而不同类别的数据的类别中心之间的距离尽可能的大。

（3）例子：假设我们有两类数据分别为红色和蓝色，如下图所示，这些数据特征是二维的，我们希望将这些数据投影到一维的一条直线，让每一种类别数据的投影点尽可能的接近，而红色和蓝色数据中心之间的距离尽可能的大。

另外一种判断的方式是：通过最小化原数据和投影后的数据之间的均方误差。

（4）LDA除了可以用于降维以外，还可以用于分类。

一个常见的LDA分类基本思想是假设各个类别的样本数据符合高斯分布，这样利用LDA进行投影后，可以利用极大似然估计计算各个类别投影数据的均值和方差，进而得到该类别高斯分布的概率密度函数。
当一个新的样本到来后，我们可以将它投影，然后将投影后的样本特征分别代入各个类别的高斯分布概率密度函数，计算它属于这个类别的概率，最大的概率对应的类别即为预测类别。

6.2 LDA总结

（1）LDA算法既可以用来降维，又可以用来分类，但主要还是用于降维。在进行图像识别相关的数据分析时，LDA是一个有力的工具。

（2）LDA的中心思想是最大化类间间隔和最小化类内距离。

（3）LDA对数据做了一些很强的假设，尽管这些假设在实际中并不一定完全满足，但LDA已被证明是非常有效的一种降维方法。主要是因为线性模型对噪声的鲁棒性比较好，当表达能力有局限性，可以通过引入核函数扩展LDA以处理分布较为复杂的数据。

每个类数据都是高斯分布
各个类的协方差相等

（4）LDA的优点

在降维过程中可以使用类别的先验知识，而不像PCA这样的无监督学习则无法使用类别先验知识。
LDA在样本分类信息依赖均值而不是方差的时候，比PCA之类的算法较优。

（5）LDA的缺点

LDA不适合对非高斯分布样本进行降维，PCA也有这个问题。
LDA降维最多降到类别数k-1的维数，如果降维的维度大于k-1，则不能使用LDA。当然有一些LDA的进化版算法可以绕开这个问题。
LDA在样本分类信息依赖方差而不是均值的时候，降维效果不好。
LDA可能过拟合数据。

6.3 LDA与PCA的相同点

（1）两者均可以对数据进行降维。

（2）两者在降维时均使用了矩阵特征分解的思想。

（3）两者都假设数据符合高斯分布。

6.4 LDA与PCA的不同点

投影方向不同
PCA选择的是投影后方差最大的方向。PCA假设方差越大，信息量越多，用主要成分来表示原始数据可以去除冗余的维度，达到降维。
LDA选择的是投影后类内方差小、类间方差大的方向。其用到了类别标签信息，为了找到数据中具有判别性的维度，使得原始数据在这些方向上投影后，不同类别尽可能区分开。
LDA是有监督降维方法，而PCA是无监督的降维方法。
LDA降维最多降到k-1的维数（k为类别数），而PCA没有这个限制。
LDA除了用于降维还可以用于分类，PCA只能用于降维。

七、奇异值分解（SVD）

奇异值分解(Singular Value Decomposition，以下简称SVD)是在机器学习领域广泛应用的算法，它不光可以用于降维算法中的特征分解，还可以用于推荐系统，以及自然语言处理等领域。是很多机器学习算法的基石。

7.1 SVD用于PCA

在主成分分析（PCA）原理总结中，我们讲到要用PCA降维，需要找到样本协方差矩阵的最大的d个特征向量，然后用这最大的d个特征向量张成的矩阵来做低维投影降维。可以看出，在这个过程中需要先求出协方差矩阵，当样本数多样本特征数也多的时候，这个计算量是很大的。
SVD也可以得到协方差矩阵最大的d个特征向量张成的矩阵，但是SVD有个好处，有一些SVD的实现算法可以不先求出协方差矩阵，也能求出我们的右奇异矩阵。也就是说，我们的PCA算法可以不用做特征分解，而是做SVD来完成。这个方法在样本量很大的时候很有效。实际上，scikit-learn的PCA算法的背后真正的实现就是用的SVD，而不是我们我们认为的暴力特征分解。
另一方面，注意到PCA仅仅使用了我们SVD的右奇异矩阵，没有使用左奇异矩阵。

7.2 SVD小结

SVD也是对矩阵进行分解，但是和特征分解不同，SVD并不要求要分解的矩阵为方阵。
SVD作为一个很基本的算法，在很多机器学习算法中都有它的身影，特别是在现在的大数据时代，由于SVD可以实现并行化，因此更是大展身手。SVD的原理不难，只要有基本的线性代数知识就可以理解，实现也很简单因此值得仔细的研究。当然，SVD的缺点是分解出的矩阵解释性往往不强，有点黑盒子的味道，不过这不影响它的使用。

7.3 SVD的应用

利用SVD降维实际上是用来简化数据，使用了奇异值分解以后仅需保留着三个比较小的矩阵，就能表示原矩阵，不仅节省存储量，在计算的时候更是减少了计算量。SVD在信息检索（隐性语义索引）、图像压缩、推荐系统等等领域中都有应用。
numpy中调用方式和求特征值特征向量类似(实际上特征分解是一种特殊的奇异值分解,<特征分解只能分解方阵，奇异值分解可以分解任意矩阵，pca中的特征分解通常会使用svd)

import numpy as np
U,Sigma,VT = np.linalg.svd(matrix)

八、应用

在语音识别中应用例子
想从一段音频中提取出人的语音信号，这时可以使用PCA先进行降维，过滤掉一些固定频率（方差较小）的背景噪声。
想要从这段音频中区分出声音属于哪个人，那么应该使用LDA对数据进行降维，使每个人的语音信号具有区分性。

在人脸识别领域应用例子
PCA的人脸识别方法（也称特征脸方法）将人脸图像按行展开成一个高纬向量，对多个人脸特征的协方差矩阵做特征值分解，其中最大特征值对应的特征向量具有与人脸相似的形状。PCA降维一般情况下保留的是最佳描述特征（主成分），而分类特征。想要达到更好的人脸识别效果，应该使用LDA方法对数据集进行降维，使得不同人脸在投影后的特征具有一定区分性。

小婷儿的Python https://blog.csdn.net/u010986753

有趣的事，Python永远不会缺席

欢迎关注小婷儿的博客

文章内容来源于小婷儿的学习笔记，部分整理自网络，若有侵权或不当之处还请谅解

如需转发，请注明出处：小婷儿的博客python https://www.cnblogs.com/xxtalhr/

博客园 https://www.cnblogs.com/xxtalhr/

CSDN https://blog.csdn.net/u010986753

有问题请在博客下留言或加作者：
     微信：tinghai87605025 联系我加微信群
     QQ ：87605025
     python QQ交流群：py_data 483766429

培训说明

OCP培训说明连接 https://mp.weixin.qq.com/s/2cymJ4xiBPtTaHu16HkiuA

OCM培训说明连接 https://mp.weixin.qq.com/s/7-R6Cz8RcJKduVv6YlAxJA

小婷儿的python正在成长中，其中还有很多不足之处，随着学习和工作的深入，会对以往的博客内容逐步改进和完善哒。重要的事多说几遍。。。。。。

算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
tcpdump交叉编译 weixin_45673259 tcpdump 测试工具网络
1.下载路径官网：https://www.tcpdump.org/2.编译解压：tar-xflibpcap-1.10.4.tar.xztar-xftcpdump-4.99.4.tar.xz编译libpcap./configure--host=mips-v720s229-linux--target=mips-v720s229-linuxCC=/opt/A1/mips-gcc720-uclibc229
C++STL-queue s15335 C++STL c++开发语言
一.基本概念和数据结构里面的队列一样，只支持先进先出，队尾插，队头删。二.基本用法1.queue对象创建1.默认构造函数queueq1;2.拷贝构造函数queueq2(q1);2.queue赋值操作queueq1;queueq2;q2=q1;3.queue入队queueq;q.push(5);//5q.push(4);//54q.push(3);//543q.push(2);//5432q.pus
数据结构：导论梁辰兴数据结构学习笔记数据结构导论算法时间复杂度空间复杂度
目录一，数据结构的研究内容二，基本概念与术语（一）数据、数据元素、数据项与数据对象（二）数据结构（三）数据类型与抽象数据类型️三，抽象数据类型的表示与实现⚙️四，算法与算法分析⚖️（一）算法的定义及特性（二）评价算法优劣的基本标准⏱️（三）算法的时间复杂度（四）算法的空间复杂度章结一，数据结构的研究内容数据结构是计算机科学的核心基础，其研究内容可概括为三大维度：数据组织形式：探索如何将现实世界中的
深入解析 “void(0)；” 的用法与作用_void(0)；
关键要点void(0);是JavaScript中的一个表达式，研究表明它通常用于超链接中，防止页面跳转。它通过void运算符计算表达式并返回undefined，常用于创建“死链接”。证据显示，这种用法简单易用，但现代开发更推荐使用事件监听器。基本概念void(0);的作用void(0);是JavaScript的void运算符的一个实例，void运算符会计算一个表达式但不返回任何值，而是始终返回un
上位机知识篇---Linux中的文件挂载 Atticus-Orion 上位机操作篇 linux 运维网络文件挂载
文章目录前言1.挂载的基本概念文件系统挂载点设备文件2.挂载的命令挂载文件系统示例卸载文件系统示例3.挂载的常用选项示例4.自动挂载（/etc/fstab文件）示例使用UUID挂载5.挂载网络文件系统（NFS）挂载NFS示例6.挂载ISO文件挂载ISO文件示例7.查看已挂载的文件系统8.挂载的注意事项9.挂载的常见问题挂载失败卸载失败10.总结前言在Linux系统中，文件挂载是指将一个文件系统（如
Python装饰器（decorator）
Python装饰器（decorator）是一种高阶函数，用于在不修改原函数代码的情况下，动态地为函数添加额外的功能。它本质上是一个接受函数作为输入并返回新函数的函数，常用于日志记录、性能测试、权限验证等场景。以下是关于Python装饰器的详细讲解：1.基本概念装饰器是一个函数，它接受一个函数作为参数，并返回一个新的函数。新函数通常会在调用原函数前后执行一些额外的逻辑。装饰器的语法糖是@decora
udev 规则文件命名规范奇妙之二进制 #嵌入式/Linux linux 网络运维
文章目录udev规则文件名的含义、规范及数字开头的原因一、udev规则文件的基本概念二、udev规则文件名的规范与含义1.文件名格式规范2.名称各部分的含义3.文件扫描路径三、为何规则文件名通常以数字开头？1.执行顺序的精确控制2.便于分类和管理3.兼容性与标准化四、示例与实践建议1.常见规则文件示例2.自定义规则命名建议五、总结udev规则文件名的含义、规范及数字开头的原因一、udev规则文件的
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
【C#】依赖注入知识点汇总 Mike_Wuzy c#
在C#中实现依赖注入（DependencyInjection,DI）可以帮助你创建更解耦、可维护和易于测试的软件系统。以下是一些关于依赖注入的关键知识点及其示例代码。1.基本概念容器(Container)容器负责管理对象实例以及它们之间的依赖关系。IoC容器（InversionofControlContainer）是实现依赖注入的核心工具，常见的DI框架包括Unity、Autofac、Castle
使用ceph-ansible部署分布式存储Ceph-octopus版本降世神童云计算技术专栏分布式 ceph ansible
使用ceph-ansible部署分布式存储Ceph-octopus版本1.Ceph基础概念及部署方式1.1.Ceph基本概念1.2.Ceph部署方式2.系统初始化配置3.Ceph集群部署3.1.Ansible安装与配置3.2.ceph-ansible安装与配置3.2.1.下载ceph-ansible3.2.2.安装ceph-ansible依赖3.2.3.修改ceph配置文件3.3.开始部署ceph
JVM初学者指南：Java虚拟机基础知识笔记 lenyan~ 笔记技术 JVM jvm java 笔记
JVM初学者指南：Java虚拟机基础知识全解析摘要：本文记录了Java虚拟机(JVM)的基本概念、架构、内存模型及工作原理的相关笔记-lenyan。一、JVM简介1.1什么是JVM？JVM(JavaVirtualMachine，Java虚拟机)是运行Java字节码的虚拟机。JVM是Java"一次编写，到处运行"这一特性的关键所在。无论什么平台，只要安装了对应的JVM，就能运行Java程序。JVM有
SQL 索引与日志知识点详解及练习题
索引和日志在数据库的高效运行和数据安全中扮演着重要角色。下面我们详细梳理索引和日志的相关知识，并通过练习题加深理解。一、知识点梳理（一）索引基本概念：索引是为了加速查询的数据结构，其数据结构为B+树。B代表Balance（平衡），数据保存在叶子结点中。分类主键索引：唯一标识一行，不允许为空，一张表只能有一个主键。唯一索引：标识一行，允许为空，一张表可以有多个唯一索引。普通索引：允许重复和空值。联合
Linux流量分析：tcpdump & wireshark
前言最近因为工作需要，研究了下如何使用tcpdump和wireshark分析业务流量。如果要使用tcpdump分析具体的HTTP请求耗时，需捕获网络数据包并分析时间戳信息，重点关注TCP连接的建立、HTTP请求发送到响应接收的全过程。以下是具体步骤和技巧：1.基础抓包命令捕获HTTP流量sudotcpdump-ieth0port80-s0-whttp.pcap-ieth0：指定网卡（如any捕获所
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
【软件测试】- 软件测试面试题2 阿寻寻大厂软件测试面试题软件测试测试工具
软件测试面试题**1.自我介绍(切记不要把简历上的内容复述一遍，尽可能把自己的优势展现出来)****2.做过哪些项目，介绍一下简历上的项目流程****3.在项目测试中有没有遇到比较严重的bug****4.黑盒测试，白盒测试的基本概念和区别****5.数据库了解吗?说说左连接，右链接，内连接****6.Mysql基本场景的简单语句****7.给你一个登录界面从哪方面入手设计测试用例?****8.熟悉
C语言中的宏是什么玩意er?
在C语言中，宏（Macro）是由预处理器处理的文本替换机制，本质上是将一个标识符（宏名）定义为特定的字符串或代码片段。它在编译前展开，不涉及运行时计算。以下是核心要点：⚙️1.基本概念与分类无参宏：定义常量或表达式格式：#define宏名字符串例如：#definePI3.14159，后续所有PI会被替换为3.14159。注意：若字符串是表达式（如#defineSUMa+b），直接替换可能导致运算优
Go从入门到精通（19）-协程（goroutine）与通道（channel）
Go从入门到精通（19）协程（goroutine）与通道（channel）文章目录Go从入门到精通（19）前言并发、并行和协程什么是协程使用GOMAXPROCS基本概念如何设置GOMAXPROCS适用场景性能调优建议示例：对比不同GOMAXPROCS的性能小结协程间的信道概念通信操作符synchronous,unbuffered(阻塞）value>0->asynchronous,buffered（
Java 与 MySQL 性能优化：MySQL连接池参数优化与性能提升程序员岳彬 Java 与 MySQL 性能优化 mysql 数据库性能优化服务器后端 java
文章目录引言一、连接池的基本概念与作用二、关键连接参数详解2.1max_connections2.2wait_timeout2.3interactive_timeout2.4connect_timeout2.5thread_cache_size三、连接池参数不合理导致的性能问题3.1连接耗尽3.2响应变慢3.3连接失效3.4资源浪费四、连接池参数优化方法与策略4.1max_connections的
Python 入门手札：从 0 到会--第三天Python的基本数据类型之容器类型 dict ，set，frozenset 趁早折枝 Python 入门手札：从 0 到会 python 哈希算法数据结构
目录一、集合类型-set&&frozenset1.基本概念2.集合的创建3.集合常用操作4.集合之间的操作5.集合的比较6.集合更新操作（只能用于set，frozenset不支持）7.不可变集合：frozenset8.集合运算符与方法的非运算符版本9.集合和字典的关系二、字典（dict）1.映射类型2.字典的键（key）3.字典的创建4.字典的常见操作5.字典视图对象6.常见字典方法7.字典的排序
【TCP/IP】14. 远程登录协议
14.远程登录协议14.远程登录协议14.1基本概念14.2Telnet命令14.3Telnet选项及协商14.4Telnet子选项协商14.5Telnet操作模式本章要点14.远程登录协议14.1基本概念Telnet协议是TCP/IP协议族的重要成员，核心功能是实现本地计算机对远程主机的终端仿真，使本地用户能像直接操作远程主机一样访问其资源。远程登录的定义本地用户通过TCP/IP协议进入远程主机
来聊聊一个轻量级的有限状态机Cola-StateMachine shark-chili Java核心技术精讲 java
文章目录写在文章开头状态机基本概念扫盲基于Cola-StateMachine落地下单业务业务流程说明状态机落地最终效果演示小结参考写在文章开头简单研究了一下研究了一下市面上的几个状态机框架，包括但不限制于SpringStatemachine以及Cola-StateMachine，考虑到前者上下文会记录当前状态机的相关属性(当前状态信息、上一次状态)，对此我们就必须要通过工厂模式等方式规避这些问题，
【零基础学AI】第31讲：目标检测 - YOLO算法 1989 0基础学AI 人工智能目标检测 YOLO rnn lstm tensorflow
本节课你将学到YOLO算法的核心思想和工作原理如何使用YOLO进行物体检测构建一个简单的物体检测系统开始之前环境要求Python3.8+需要安装的包：opencv-python,numpy,matplotlib硬件要求：推荐使用GPU（非必须）前置知识基本Python编程能力了解卷积神经网络（CNN）的基本概念（第24讲内容）核心概念什么是目标检测？目标检测就像教计算机"看"图片中的物体。它不仅要
数据结构——1.数据结构和算法爱看烟花的码农数据结构数据结构
第一部分：笔试核心概念（理论知识）一、数据结构绪论什么是数据结构？数据结构不仅仅是数据，而是研究如何组织数据（结构化信息）的方法，目的是为了能够高效地处理这些数据。一个经典的公式是：算法+数据结构=程序。这表明，好的程序离不开高效的数据组织方式和处理算法。基本概念与术语数据(Data)：是计算机可以识别、存储和处理的符号总称，是程序处理的“原料”。例如，一张图片、一段文字、股票行情、心电图数据等。
使用Python进行机器学习入门指南软考和人工智能学堂 Python开发经验 python 机器学习开发语言
使用Python进行机器学习入门指南机器学习（MachineLearning）是人工智能（ArtificialIntelligence,AI）的一个重要分支，旨在通过算法和统计模型，使计算机系统能够自动从数据中学习和改进。Python作为机器学习领域的主流编程语言，提供了丰富的库和工具来实现各种机器学习任务。本文将介绍如何使用Python进行机器学习，包括基本概念、常用库以及一个实战项目示例。目录
前沿交叉：Fluent与深度学习驱动的流体力学计算体系 m0_75133639 流体力学深度学习人工智能航空航天 fluent 流体力学材料科学 CFD
基础模块流体力学方程求解1、不可压缩N-S方程数值解法（有限差分/有限元/伪谱法）·Fluent工业级应用：稳态/瞬态流、两相流仿真（圆柱绕流、入水问题）·Tecplot流场可视化与数据导出2、CFD数据的AI预处理·基于PCA/SVD的流场数据降维·特征值分解与时空特征提取深度学习核心3.物理机理嵌入的神经网络架构·物理信息神经网络（PINN）：将N-S方程嵌入损失函数（JAX框架实现）·神经常
关于递归算法的详细讲解（从属于GESP五级）
当程序学会向自己提问，它也学会了给出最精确的解答递归算法1.导语•“让函数自己调用自己”并不神秘•生活中的递归隐喻：俄套娃、镜中镜•为什么GESP反复考？——代码量短、思路分治、易埋坑2.递归基本概念一句话先行函数在自己的定义里调用自己，并且每次调用都把原问题缩小一点，直到命中可以直接回答的最小情形——这就是递归。2.1定义：让「自指」变得可控1.形式化描述若存在函数f，在计算f(n)时又需要求解
C语言基本概念（下）【C语言入门到精通】
C语言基本结构（下）Everyprogramisapartofsomeotherprogramandrarelyfits.1码字不易，对你有帮助点赞/转发/关注支持一下作者思维导图写在前面如果只是写个人学习总结的博客很容易，简单写一些感悟然后贴上代码走人就可以了，甚至不用校审。但是我命名本系列为【C语言必知必会】帮助你从入门到精通C语言，那势必要“事无巨细”一些：既要考虑到没有基础的初学者，又不能
新手向:Python网络编程,搭建简易HTTP服务器
本文将从零开始，通过一个简单的PythonHTTP服务器示例，带你走进网络编程的世界。一、准备工作：理解基本概念1.1什么是网络编程？网络编程简单来说就是让不同计算机上的程序能够相互通信。就像人与人之间通过语言交流一样，计算机之间也有自己的"语言"——网络协议。1.2HTTP协议简介HTTP（HyperTextTransferProtocol）是万维网的基础协议，我们每天浏览网页时都在使用它。它采
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><