阿里matlab建模师

【老生谈算法】matlab实现主成分算法源码——主成分

主成分（matlab数据处理）与MATLAB源码

1、算法详解：

主成分分析（principal component Analysis）又称主分量分析，是由皮尔逊（pearson）于1901年首先引入，后来由霍特林（hotelling）于1933年进行了发展。主成分分析是一种通过降维技术把多个变量化为少数几个主成分（即综合变量）的多元统计方法，这些主成分能够反映原始变量的大部分信息，通常表示为原始变量的线性组合，为使得这些主成分所包含的信息互不重叠，要求各主成分之间互不相关。主成分分析在很多领域有着广泛的应用，一般来说，当研究的问题涉及很多变量，并且变量间相关性明显，即包含的信息有所重叠时，可以考虑用主成分分析的方法，这样容易抓住事物的主要矛盾，使得问题得到简化。

本章主要内容包括：主成分分析的理论简介，主成分分析的MATLAB实现，主成分分析的主要具体案例。
11.1主成分分析简介
11.1.1主成分分析的几何意义

主成分分析的过程其实就是坐标系旋转的过程，新坐标系的各个坐标系的轴的方向是原始数据变差最大的方向，各主成分表达式就是新旧坐标转换关系式。

11.1.2 总体的主成分

1从总体协方差矩阵出发求解主成分

其中，均为单位向量。下面求，使得的方差达到最大。
设为的个特征值，为相应的正交单位特征向量，即，，，，
由矩阵知识可知

其中为正交矩阵，是对角元素为的对角矩阵。
考虑的方差

          （11.3）

由式（11.3）可知，当时，的方差达到最大，最大值为。称为第一主成分。如果第一主成分从数据中提取的信息还不够多，还应考虑第二主成分。下面求，在条件下使得的方差达到最大。由

可得，于是

        （11.4）

由式（11.4）可知，当时，的方差达到最大，最大值为。称为第二主成分。类似的，在约束下可得，当时的方差达到最大，最大值为。称
为第i主成分。
2主成分的性质
（1）主成分向量的协方差矩阵为对角阵
记
（11.5）
则
，
即主成分向量的协方差矩阵为对角矩阵。
（2）主成分的总方差等于原始变量的总方差：
设协方差矩阵，则，于是
由此可见，原始数据的总方差等于个互不相关的主成分的方差之和，也就是说个互不相关的主成分包含了原始数据中的全部信息，但是主成分所包含的信息更为集中。
总方差中第个主成分的方差所占的比例称为主成分的贡献率。主成分的贡献率反映了主成分综合原始变量信息的能力，也可理解为解释原始变量的能力。由贡献率定义知，个主成分的贡献率依次递减，即综合原始变量信息的能力依次递减。第一个主成分的贡献率最大，即第一个主成分综合原始变量信息的能力强。
前个主成分的贡献率之和称为前个主成分的累积贡献率，它反映了前个主成分综合原始变量信息（或解释原始变量）的能力。由于主成分分析的主要目的是降维，所以需要在信息损失不太多的情况下，用少数几个主成分来代替原始变量，以进行后续的分析，究竟用几个主成分来代替原始变量才合适呢？通常的做法是取较小的，使得恰前个主成分的累积贡献率不低于某一水平（如85%以上），这样就达到了降维的目的。
（3）原始变量与主成分之间的相关系数
由式（11.5）可知于是
（11.6）
从而

（4）前个主成分对变量的贡献率
称

为前个主成分对变量的贡献率。这个贡献率反映了前个主成分从变量中提取的信息的多少。由式（11.6）可知，固所有个主成分对变量的贡献率为

（5）原始变量对主成分的贡献
主成分的表达式为

称为第个主成分在第个原始变量上的载荷，它反映了对的重要程度。在实际问题中，通常根据载荷解释主成分的实际意义。
3，从总体相关系数矩阵出发求解主成分
当总体各变量取值的单位或数量级不同时，从总体协方差矩阵出发求解主成分就显得不合适了，此时应将每个变量标准化。记标准化变量为

则可以从标准化总体的协方差矩阵求解主成分，即从总体的相关系数矩阵出发求解主成分，因为总体协方差矩阵就是的相关系数矩阵。
设总体的相关系数矩阵为，从出发求解主成分的步骤与从出发求解主成分的步骤一样，设为的个特征值，为相应的正交单位特征向量。则个主成分为
（11.7）
记（11.8）
则有以下结论
，

此时前个主成分的累积贡献率为。
11.1.3 样本的主成分
在实际生活问题中，总体的协方差矩阵或相关系数矩阵往往是未知的，需要由样本进行估计。设为取自总体的样本，其中。记样本观测值矩阵为

的每一行对应一个样品，每一列对应一个变量。记样本协方差矩阵和样本相关系数矩阵分别为

，

其中为样本均值。将作为的估计，作为的估计，从或出发可求得样本的主成分
1.从样本协方差矩阵出发求解主成分
设为的个特征值，为相应的正交单位特征向量，则样本的个主成分为
（11.9）
将样品的观测值带入第个主成分，称得到的值为样品的观测值带入第主成分得分。
从样本相关系数矩阵出发求解主成分
设为的个特征值，为相应的正交单位特征向量，则样本的个主成分为
（11.10）
将样品标准化后的观测值带入第个主成分，即可得样品的第主成分得分

3，由主成分得分重建（恢复）原始数据
假定从样本协方差矩阵出发求解主成分，记为样本的主成分得分值矩阵，则
（11.11）
注意到为正交矩阵，则有，于是由式（11.11）可得，也就是说根据主成分得分和主成分表达式，可以重建（恢复）原始数据，这在数据压缩与解压缩中有着重要的作用。当然在实际应用中，可能不会得到全部的个主成分，假定只用前个主成分记样本的前个主成分的得分矩阵为

当前个主成分的累积贡献率达到一个比较高的水平时，由得到的矩阵可以作为原始样本观测值矩阵的一个很好的近视，此时为样本的残差，MATLAB统计工具箱中提供了重建数据和求残差的函数pcares。若和的数据量小于原始样本观测值矩阵的数据量，就能起到数据压缩的目的。
以上讨论的是从样本协方差矩阵出发求解主成分，然后由样本的主成分得分重建原始数据。若从样本的相关系数矩阵出发求解主成分，同样可以由样本的主成分得分重建原始数据，只是此时需要进行逆标准化变换，这里不再作详细讨论。
11.1.4关于主成分表达式的两点说明
这里需要说明的是，即使限定了方差矩阵或相关系数矩阵的个特征值对应的特征向量为正交单位向量，它们也是不唯一的，从而主成分的表达式也是不唯一的，假如若是总体或样本的一个主成分，则也是总体或样本的一个主成分。主成分表达式的不唯一对后续分析没有太大影响。
若第个主成分的贡献率非常非常小，可认为第个主成分的方差，即（为一个常数），这揭示了变量之间的一个共线性关系：。
11.2 主成分分析的MATLAB函数
与主成分相关的MATLAB函数主要有pcacov,princomp和pcares,下面分别介绍。
11.2．1 pcacov函数
pcacov函数用来根据协方差矩阵或相关系数矩阵进行主成分分析，其调用格式如下：
COEFF=pacov(v)
[COEFF,latent]= pcacov(v)
[COEFF,latent,explained]=pcacov(v)
以上调用的输入参数V是总体或样本的协方差矩阵或相关系数矩阵，对于维总体，V是的矩阵。输出参数COEFF是个主成分的系数矩阵，它是的矩阵，它的第i列是第i个主成分的系数向量。输出参数latent是个主成分的方差构成的列向量，即V的个特征值（从大到小）构成的向量。输出参数explained是个主成分的贡献率向量，已经转化为百分比。
11.2.2 princomp函数
princomp函数用来根据样本观测值矩阵进行主成分分析，其调用格式如下：
1）[COEFF,SCORE]=princomp(x)
根据样本观测值矩阵X进行主成分分析。输入参数X是n行p列的矩阵，每一行对应一个观测（样品），每一列对应一个变量。输出参数COEFF是个主成分的系数矩阵，它是的矩阵，它的第i列是第i个主成分的系数向量。输出参数SCORE是n个样品的个主成分的得分矩阵，它是n行p列的矩阵，每一行对应一个观测值，每一列对应一个主成分，第i行第j列元素是i个样品的第j个主成分得分。
2）[COEFF,SCORE,latent]=princomp(x)
返回样本协方差矩阵的特征向量latent，它是由p个特征值构成的列向量，其中特征值按降序排列。
3）[COEFF,SCORE,latent,tsqure]=princomp(x)
返回一个包含p个元素的列向量tsqure，它的第i个元素是第i个观测对应的霍特林（Hotelling）统计量，描述了第i个观测与数据集（样本观测矩阵）的中心之间的距离，可用来寻找远离中心的极端数据。
设为样本协方差矩阵的p个特征值，并设第i个样品的第j个主成分得分，则第i个样品对应的（Hotelling）统计量为

注意：princomp函数对样本数据进行了中心化处理，即把X中的每一个元素减去其所在列的均值，相应地，princomp函数返回的主成分就是中心化的主成分得分。
当，即观测的个数小于或等于维数时，SCORE矩阵的第n列到第p列元素均为0，latent第n到第p个元素均为0。
4）[…]=princomp(x,‘econ’)
通过设置’econ’参数，使得当时，只返回latent中的前n-1个元素（去掉不必要的0元素）及COEFF和SCORE矩阵中相应的列。
11.2.3 pcares函数
在11.1.3节曾讨论过由样本的主成分得分重建（恢复）原始数据的问题，若只用前个主成分的得分来重建原始数据，则可能会有一定的误差，前面称之为残差。MATLAB统计工具箱中提供了pcares函数，用来重建数据，并求样本观测值矩阵中每个观测的每一个分量所对应的残差，其调用格式如下：
residuals=pcares(x,ndim)
[residuals,reconstructed]=pcares(x,ndim)
上述调用中X是n行p列的样本观测值矩阵，它的每一行对应一个观测（样品），每一列对应一个变量，ndim参数用来指定所用的主成分的个数，它是一个小于或等于p的正的标量，最好取为正整数。输出参数residuals是一个与X同样大小的矩阵，其元素为X中相应元素所对应的残差。输出参数reconstructed为用前ndim个主成分的得分重建的观测数据，它是X的一个近似。
注意：pcares调用了 princomp函数，它只能接受原始样本观测数据作为他的输入，并且它不会自动对数据作标准化变换，若需要对数据作标准化变换，可以先用zscore函数将数据标准化，然后调用pcares函数重建观测数据并求残差。若从协方差矩阵或相关系数矩阵出发求解主成分，请用pcacov函数，此时无法重建观测数据和求残差。
11.3 案例32:从协方差矩阵或相关系数矩阵出发求解主成分
在制定服装标准的过程中，对128名成年男子的身材进行了测量，每日测了六项指标，身高（），座高（），胸围（），手臂长（），肋围（）和腰围（），样本相关系数矩阵如表11-1所列。试根据样本相关系数矩阵进行主成分分析。
表11-1 128名男子身材的六项指标的样本相关系数矩阵

变量
身高（）
座高（）
胸围（）
手臂长（）
肋围（）
腰围（）
身高（）
1
0.79
0.36
0.76
0.25
0.51
座高（）
0.79
1
0.31
0.55
0.17
0.35
胸围（）
0.36
0.31
1
0.35
0.64
0.58
手臂长（）
0.76
0.55
0.35
1
0.64
0.38
肋围（）
0.25
0.17
0.64
0.16
1
0.63
腰围（）
0.51
0.35
0.58
0.38
0.63
1

13.3.1 调用pcacov函数作主成分分析
对于本案例，调用pacov函数作主成分分析的命令与结果如下：

%定义相关系数矩阵PHO
PHO=[1  0.79	  0.36	 0.76	0.25	  0.51
0.79	   1	  0.31	 0.55	0.17	  0.35
0.36	   0.31	  1	     0.35	0.64	  0.58
0.76	   0.55	  0.35	 1	    0.16	  0.38
0.25       0.17	  0.64	 0.16	1	  0.63
0.51	   0.35   0.58	 0.38	0.63	  1];  
%利用pacov函数根据相关系数矩阵作主成分分析，返回主成分分析表达式的系数矩阵COEFF，%返回相关系数矩阵的特征向量latent和主成分分析贡献率向量explained
[COEFF,latent,explained]=pcacov(PHO) 

>> [COEFF,latent,explained]=pcacov(PHO)
COEFF =
   -0.4689   -0.3648    0.0922   -0.1224   -0.0797    0.7856
   -0.4037   -0.3966    0.6130    0.3264    0.0270   -0.4434
   -0.3936    0.3968   -0.2789    0.6557    0.4052    0.1253
   -0.4076   -0.3648   -0.7048   -0.1078   -0.2346   -0.3706
   -0.3375    0.5692    0.1643   -0.0193   -0.7305   -0.0335
   -0.4268    0.3084    0.1193   -0.6607    0.4899   -0.1788
latent =
    3.2872
    1.4062
    0.4591
    0.4263
    0.2948
    0.1263
explained =
   54.7867
   23.4373
    7.6516
    7.1057
    4.9133
    2.1054
%为了更直观，以元胞数组形式显示结果
result1(1,:)={'特征值','差值','贡献率','累积贡献率'};
result1(2:7,1)=num2cell(latent);
result1(2:6,2)=num2cell(-diff(latent));
result1(2:7,3:4)=num2cell([explained,cumsum(explained)])  


result1 = 
    '特征值'    '差值'      '贡献率'     '累积贡献率'
    [3.2872]    [1.8810]    [54.7867]    [   54.7867]
    [1.4062]    [0.9471]    [23.4373]    [   78.2240]
    [0.4591]    [0.0328]    [ 7.6516]    [   85.8756]
    [0.4263]    [0.1315]    [ 7.1057]    [   92.9813]
    [0.2948]    [0.1685]    [ 4.9133]    [   97.8946]
    [0.1263]          []    [ 2.1054]    [       100]
%以元胞数组形式显示前3个主成分表达式
>> s={'标准化变量';'x1:身高';'x2:座高';'x3:胸围';'x4:手臂长';'x5:肋围';'x6:腰围'};
>> result2(:,1)=s;
>> result2(1,2:4)={'prin1','prin2','prin3'};
>> result2(2:7,2:4)=num2cell(COEFF(:,1:3))

result2 = 
    '标准化变量'    'prin1'      'prin2'      'prin3'  
    'x1:身高'       [-0.4689]    [-0.3648]    [ 0.0922]
    'x2:座高'       [-0.4037]    [-0.3966]    [ 0.6130]
    'x3:胸围'       [-0.3936]    [ 0.3968]    [-0.2789]
    'x4:手臂长'     [-0.4076]    [-0.3648]    [-0.7048]
    'x5:肋围'       [-0.3375]    [ 0.5692]    [ 0.1643]
    'x6:腰围'       [-0.4268]    [ 0.3084]    [ 0.1193]

为了结果看上去更加直观，上面定义了两个元胞数组：result1和result2，用result1存放特征值，贡献率和累积贡献率，用result2存放3个主成分表达式的系数数据，即COEFF矩阵的前3列。这样做的目的仅是为了直观，读者也可以直接对pcacov函数返回的结果进行分析。
11.3.2 结果分析
从result1的结果来看，前3个主成分的累积贡献率达到了85.8756%，因此可以用前3个主成分后续的分析i；这样做虽然会有一定的信息损失，但损失不大，不影响大局。result2中列出了前3个主成分的相关结果，可知前3个主成分的表达式分别为

从第一主成分的表达式来看，它在每个标准化变量上有近似的负载荷，说明每个标准化变量对的重要性都差不多。当一个人的身材“五大三粗”，也就是说又高又胖时，，，，都比较大，此时的值就比较小，反之，当一个人又矮又瘦时，，，都比较小，此时的值就比较大，所以可以认为第一主成分是身材的综合成分（或魁梧成分）。
从第二主成分的表达式来看，它在标准化变量，，和上有近似的负载荷，在，，上有近似的正载荷，说明当，，和增大时，的值减小，当，，增大时，的值增大。当一个人的身材瘦高时，的值比较小，当一个人的身材矮胖时，的值比较大，所以可以认为第二主成分是身材的高矮和胖瘦的协调成分
从第三主成分的表达式来看，它在标准化变量上有比较大的正载荷，在上有比较大的负载荷，在其它变量上的载荷比较小，，说明（坐高）和（手臂长）对的影响比较大，也就是说反映坐高（即上半身）与手臂长之间的协调关系，这对做长袖上衣时制定衣服和袖子的长短提供了参考。所以可认为第三主成分是臂长成分
后3个主成分的贡献率比较小，分别只有7.1057%，4.9133%和2.1054%，可以不用对它们作出解释。最后一个主成分的贡献率非常小，它揭示了标准化变量之间的如下共线性关系

11.4 案例33：从样本观测值矩阵出发求解主成分

表11-2列出了2007年我国31个省，市，自治区和直辖市的农村居民家庭平均每人全年消费支出的8个主要变量数据。数据来源：中华人民共和国国家统计局网站，2008年《中国统计年鉴》。数据保存在文件 .xls中，数据格式如表11-2所列，是根据这8个主要变量的观测数据，进行主成分分析
地区
食品
衣着
居住
家庭设备
及服务
交通和
通讯
文教娱乐
用品及服务
医疗保健
其他商品
及服务
北京
2132.51
513.44
1023.21
340.15
778.52
870.12
629.56
111.75
天津
1367.75
286.33
674.81
126.74
400.11
312.07
306.19
64.30
河北
1025.72
185.68
627.98
140.45
318.19
243.30
188.06
57.40
山西
1033.68
260.88
392.78
120.86
268.75
370.97
170.85
63.81
内蒙古
1280.05
228.40
473.98
117.64
375.58
423.75
281.46
75.29
辽宁
1334.18
281.19
513.11
142.07
361.77
362.78
265.01
108.05
吉林
1240.93
227.96
399.11
120.95
337.46
339.77
311.37
87.89
黑龙江
1077.34
254.01
691.02
104.99
335.28
312.32
272.49
69.98
上海
3259.48
475.51
2097.21
451.40
883.71
857.47
571.06
249.04
江苏
1968.88
251.29
752.73
228.51
543.97
642.52
263.85
134.41
浙江
2430.60
405.32
1498.50
338.80
782.98
750.69
452.44
142.26
安徽
1192.57
166.31
479.46
144.23
258.29
283.17
177.04
52.98
福建
1870.32
235.61
660.55
184.21
465.40
356.26
174.12
107.00
江西
1492.02
147.71
474.49
121.54
277.15
252.78
167.71
61.08
山东
1369.20
224.18
682.13
195.99
422.36
424.89
230.84
71.98
河南
1017.43
189.71
615.62
136.37
269.46
212.36
173.19
62.26
湖北
1479.04
168.64
434.91
166.25
281.12
284.13
178.77
97.13
湖南
1675.16
161.79
508.33
152.60
278.78
293.89
219.95
86.88
广东
2087.58
162.33
763.01
163.85
443.24
254.94
199.31
128.06
广西
1378.78
86.90
554.14
112.24
245.97
172.45
149.01
47.98
海南
1430.31
86.26
305.90
93.26
248.08
223.98
95.55
73.23
重庆
1376.00
136.34
263.73
138.34
208.69
195.97
168.57
39.06
四川
1435.52
156.65
366.45
142.64
241.49
177.19
174.75
52.56
贵州
998.39
99.44
329.64
70.93
154.52
147.31
79.31
34.16
云南
1226.69
112.52
586.07
107.15
216.67
181.73
167.92
38.43
西藏
1079.83
245.00
418.83
133.26
156.57
65.39
50.00
68.74
陕西
941.81
161.08
512.40
106.80
254.74
304.54
222.51
55.71
甘肃
944.14
112.20
295.23
91.40
186.17
208.90
149.82
29.36
青海
1069.04
191.80
359.74
122.17
292.10
135.13
229.28
47.23
宁夏
1019.35
184.26
450.55
109.27
265.76
192.00
239.40
68.17
新疆
939.03
218.18
445.02
91.45
234.70
166.27
210.69
45.25

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
Goolge earth studio 进阶4——路径修改与平滑陟彼高冈yu Google earth studio 进阶教程旅游
如果我们希望在大约中途时获得更多的城市鸟瞰视角。可以将相机拖动到这里并创建一个新的关键帧。camera_target_clip_7EarthStudio会自动平滑我们的路径，所以当我们通过这个关键帧时，不是一个生硬的角度，而是一个平滑的曲线。camera_target_clip_8路径上有贝塞尔控制手柄，允许我们调整路径的形状。右键单击，我们可以选择“平滑路径”，这是默认的自动平滑算法，或者我们可
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
Faiss：高效相似性搜索与聚类的利器网络·魚大数据 faiss
Faiss是一个针对大规模向量集合的相似性搜索库，由FacebookAIResearch开发。它提供了一系列高效的算法和数据结构，用于加速向量之间的相似性搜索，特别是在大规模数据集上。本文将介绍Faiss的原理、核心功能以及如何在实际项目中使用它。Faiss原理：近似最近邻搜索：Faiss的核心功能之一是近似最近邻搜索，它能够高效地在大规模数据集中找到与给定查询向量最相似的向量。这种搜索是近似的，
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
insert into select 主键自增_mybatis拦截器实现主键自动生成 weixin_39521651 insert into select 主键自增 mybatis delete返回值 mybatis insert返回主键 mybatis insert返回对象 mybatis plus insert返回主键 mybatis plus 插入生成id
前言前阵子和朋友聊天，他说他们项目有个需求，要实现主键自动生成，不想每次新增的时候，都手动设置主键。于是我就问他，那你们数据库表设置主键自动递增不就得了。他的回答是他们项目目前的id都是采用雪花算法来生成，因此为了项目稳定性，不会切换id的生成方式。朋友问我有没有什么实现思路，他们公司的orm框架是mybatis，我就建议他说，不然让你老大把mybatis切换成mybatis-plus。mybat
k均值聚类算法考试例题_k均值算法(k均值聚类算法计算题) 寻找你83497 k均值聚类算法考试例题
?算法：第一步：选K个初始聚类中心，z1(1),z2(1)，…，zK(1)，其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个.k均值聚类：---------一种硬聚类算法，隶属度只有两个取值0或1，提出的基本根据是“类内误差平方和最小化”准则；模糊的c均值聚类算法：--------一种模糊聚类算法，是.K均值聚类算法是先随机选取K个对象作为初始的聚类
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
推荐算法_隐语义-梯度下降 _feivirus_ 算法机器学习和数学推荐算法机器学习隐语义
importnumpyasnp1.模型实现"""inputrate_matrix:M行N列的评分矩阵，值为P*Q.P:初始化用户特征矩阵M*K.Q:初始化物品特征矩阵K*N.latent_feature_cnt:隐特征的向量个数max_iteration:最大迭代次数alpha:步长lamda:正则化系数output分解之后的P和Q"""defLFM_grad_desc(rate_matrix,l
K近邻算法_分类鸢尾花数据集 _feivirus_ 算法机器学习和数学分类机器学习 K近邻
importnumpyasnpimportpandasaspdfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportaccuracy_score1.数据预处理iris=load_iris()df=pd.DataFrame(data=ir
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
数据结构 | 栈和队列 TT-Kun 数据结构与算法数据结构栈队列 C语言
文章目录栈和队列1.栈：后进先出（LIFO）的数据结构1.1概念与结构1.2栈的实现2.队列：先进先出（FIFO）的数据结构2.1概念与结构2.2队列的实现3.栈和队列算法题3.1有效的括号3.2用队列实现栈3.3用栈实现队列3.4设计循环队列结论栈和队列在计算机科学中，栈和队列是两种基本且重要的数据结构，它们在处理数据存储和访问顺序方面有着独特的规则和应用。本文将详细介绍栈和队列的概念、结构、实
[Python] 数据结构详解及代码 AIAdvocate 算法 python 数据结构链表
今日内容大纲介绍数据结构介绍列表链表1.数据结构和算法简介程序大白话翻译,程序=数据结构+算法数据结构指的是存储,组织数据的方式.算法指的是为了解决实际业务问题而思考思路和方法,就叫:算法.2.算法的5大特性介绍算法具有独立性算法是解决问题的思路和方式,最重要的是思维,而不是语言,其(算法)可以通过多种语言进行演绎.5大特性有输入,需要传入1或者多个参数有输出,需要返回1个或者多个结果有穷性,执行
matlab mle 优化,MLE+: Matlab Toolbox for Integrated Modeling, Control and Optimization for Buildings... Simon Zhong matlab mle 优化
摘要：FollowingunilateralopticnervesectioninadultPVGhoodedrat,theaxonguidancecueephrin-A2isup-regulatedincaudalbutnotrostralsuperiorcolliculus(SC)andtheEphA5receptorisdown-regulatedinaxotomisedretinalgan
如何用matlab灵活控制feko的求解 NingrLi matlab 开发语言
https://bbs.rfeda.cn/read.php?tid=3778Feko中的模型和求解设置等都可以通过editfeko进行设置，其文件存储为.pre文件，该文件可以用文本打开，因此，我们可以通过VB、VC、matlab等工具对.pre文件进行读写操作，以达到更灵活的使用feko。同样，对于.out文件，我们也可以进行读操作。熟练使用对.pre文件和.out文件的操作后，我们可以方便的计
Python算法L5：贪心算法小熊同学哦 Python算法算法 python 贪心算法
Python贪心算法简介目录Python贪心算法简介贪心算法的基本步骤贪心算法的适用场景经典贪心算法问题1.**零钱兑换问题**2.**区间调度问题**3.**背包问题**贪心算法的优缺点优点：缺点：结语贪心算法（GreedyAlgorithm）是一种在每一步选择中都采取当前最优或最优解的算法。它的核心思想是，在保证每一步局部最优的情况下，希望通过贪心选择达到全局最优解。虽然贪心算法并不总能得到全
matlab delsat = setdiff(1:69,unique(Eph(30,:)))；语句含义黄卷青灯77 matlab 开发语言 setdiff
这行MATLAB代码用于计算在范围1:69中不包含在Eph矩阵第30行的唯一值集合中的所有元素。具体解释如下：delsat=setdiff(1:69,unique(Eph(30,:)));解释Eph(30,:)Eph(30,:)提取矩阵Eph的第30行的所有列元素。这是一个行向量，包含了第30行的所有值。unique(Eph(30,:))unique函数返回Eph(30,:)中的唯一元素。这意味着
【RabbitMQ 项目】服务端：数据管理模块之绑定管理月夜星辉雪 rabbitmq 分布式
文章目录一.编写思路二.代码实践一.编写思路定义绑定信息类交换机名称队列名称绑定关键字：交换机的路由交换算法中会用到没有是否持久化的标志，因为绑定是否持久化取决于交换机和队列是否持久化，只有它们都持久化时绑定才需要持久化。绑定就好像一根绳子，两端连接着交换机和队列，当一方不存在，它就没有存在的必要了定义绑定持久化类构造函数：如果数据库文件不存在则创建，打开数据库，创建binding_table插入
非对称加密算法原理与应用2——RSA私钥加密文件私语茶馆云部署与开发架构及产品灵感记录 RSA2048 私钥加密
作者：私语茶馆1.相关章节（1）非对称加密算法原理与应用1——秘钥的生成-CSDN博客第一章节讲述的是创建秘钥对，并将公钥和私钥导出为文件格式存储。本章节继续讲如何利用私钥加密内容，包括从密钥库或文件中读取私钥，并用RSA算法加密文件和String。2.私钥加密的概述本文主要基于第一章节的RSA2048bit的非对称加密算法讲述如何利用私钥加密文件。这种加密后的文件，只能由该私钥对应的公钥来解密。
粒子群优化 (PSO) 在三维正弦波函数中的应用 subject625Ruben 机器学习人工智能 matlab 算法
在这篇博客中，我们将展示如何使用粒子群优化（PSO）算法求解三维正弦波函数，并通过增加正弦波扰动，使优化过程更加复杂和有趣。本文将介绍目标函数的定义、PSO参数设置以及算法执行的详细过程，并展示搜索空间中的动态过程和收敛曲线。1.目标函数定义我们使用的目标函数是一个三维正弦波函数，定义如下：objectiveFunc=@(x)sin(sqrt(x(1).^2+x(2).^2))+0.5*sin(5
非对称加密算法————RSA理论及详情 hu19930613
转自：https://www.kancloud.cn/kancloud/rsa_algorithm/48484一、一点历史1976年以前，所有的加密方法都是同一种模式：（1）甲方选择某一种加密规则，对信息进行加密；（2）乙方使用同一种规则，对信息进行解密。由于加密和解密使用同样规则（简称"密钥"），这被称为"对称加密算法"（Symmetric-keyalgorithm）。这种加密模式有一个最大弱点
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
【加密算法基础——对称加密和非对称加密】 XWWW668899 网络安全服务器笔记
对称加密与非对称加密对称加密和非对称加密是两种基本的加密方法，各自有不同的特点和用途。以下是详细比较：1.对称加密特点密钥:使用相同的密钥进行加密和解密。发送方和接收方必须共享这个密钥。速度:通常速度较快，适合处理大量数据。实现:算法相对简单，计算效率高。常见算法AES(高级加密标准)DES(数据加密标准)3DES(三重数据加密标准)RC4(流密码)应用场景文件加密磁盘加密传输大量数据时的加密2.
【算法练习】IDEA集成leetcode插件实现快速刷 2401_84102892 2024年程序员学习算法 intellij-idea leetcode
============点击右侧边leetcode->设置->配置地址、用户名、密码、存放目录、文件模板用户名要登录后在账号信息里看模板代码1.codefilename!velocityTool.camelC
Enum用法不懂事的小屁孩 enum
以前的时候知道enum，但是真心不怎么用，在实际开发中，经常会用到以下代码: protected final static String XJ = "XJ"; protected final static String YHK = "YHK"; protected final static String PQ = "PQ";
【Spark九十七】RDD API之aggregateByKey bit1129 spark
1. aggregateByKey的运行机制 /** * Aggregate the values of each key, using given combine functions and a neutral "zero value". * This function can return a different result type
hive创建表是报错： Specified key was too long; max key length is 767 bytes daizj hive
今天在hive客户端创建表时报错，具体操作如下 hive> create table test2(id string); FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:javax.jdo.JDODataSto
Map 与 JavaBean之间的转换周凡杨 java 自省转换反射
最近项目里需要一个工具类，它的功能是传入一个Map后可以返回一个JavaBean对象。很喜欢写这样的Java服务，首先我想到的是要通过Java 的反射去实现匿名类的方法调用，这样才可以把Map里的值set 到JavaBean里。其实这里用Java的自省会更方便，下面两个方法就是一个通过反射，一个通过自省来实现本功能。 1：JavaBean类 1 &nb
java连接ftp下载 g21121 java
有的时候需要用到java连接ftp服务器下载，上传一些操作，下面写了一个小例子。 /** ftp服务器地址 */ private String ftpHost; /** ftp服务器用户名 */ private String ftpName; /** ftp服务器密码 */ private String ftpPass; /** ftp根目录 */ private String f
web报表工具FineReport使用中遇到的常见报错及解决办法（二）老A不折腾 finereport web报表 java报表总结
抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、没有返回数据集：在存储过程中的操作语句之前加上set nocount on 或者在数据集exec调用存储过程的前面加上这句。当S
linux 系统cpu 内存等信息查看墙头上一根草 cpu 内存 liunx
1 查看CPU 　　1.1 查看CPU个数　　# cat /proc/cpuinfo | grep "physical id" | uniq | wc -l 　　2 　　**uniq命令：删除重复行;wc –l命令：统计行数** 　　1.2 查看CPU核数　　# cat /proc/cpuinfo | grep "cpu cores" | u
Spring中的AOP aijuans spring AOP
Spring中的AOP Written by Tony Jiang @ 2012-1-18 （转）何为AOP AOP，面向切面编程。在不改动代码的前提下，灵活的在现有代码的执行顺序前后，添加进新规机能。来一个简单的Sample: 目标类： [java] view plain copy print ? package&nb
placeholder(HTML 5) IE 兼容插件 alxw4616 JavaScript jquery jQuery插件
placeholder 这个属性被越来越频繁的使用. 但为做HTML 5 特性IE没能实现这东西. 以下的jQuery插件就是用来在IE上实现该属性的. /** * [placeholder(HTML 5) IE 实现.IE9以下通过测试.] * v 1.0 by oTwo 2014年7月31日 11:45:29 */ $.fn.placeholder = function
Object类,值域,泛型等总结(适合有基础的人看) 百合不是茶泛型的继承和通配符变量的值域 Object类转换
java的作用域在编程的时候经常会遇到,而我经常会搞不清楚这个问题,所以在家的这几天回忆一下过去不知道的每个小知识点变量的值域; package 基础; /** * 作用域的范围 * * @author Administrator * */ public class zuoyongyu { public static vo
JDK1.5 Condition接口 bijian1013 java thread Condition java多线程
Condition 将 Object 监视器方法（wait、notify和 notifyAll）分解成截然不同的对象，以便通过将这些对象与任意 Lock 实现组合使用，为每个对象提供多个等待 set （wait-set）。其中，Lock 替代了 synchronized 方法和语句的使用，Condition 替代了 Object 监视器方法的使用。条件（也称为条件队列或条件变量）为线程提供了一
开源中国OSC源创会记录 bijian1013 hadoop spark MemSQL
一.Strata+Hadoop World（SHW）大会是全世界最大的大数据大会之一。SHW大会为各种技术提供了深度交流的机会，还会看到最领先的大数据技术、最广泛的应用场景、最有趣的用例教学以及最全面的大数据行业和趋势探讨。二.Hadoop &nbs
【Java范型七】范型消除 bit1129 java
范型是Java1.5引入的语言特性，它是编译时的一个语法现象，也就是说，对于一个类，不管是范型类还是非范型类，编译得到的字节码是一样的，差别仅在于通过范型这种语法来进行编译时的类型检查，在运行时是没有范型或者类型参数这个说法的。范型跟反射刚好相反，反射是一种运行时行为，所以编译时不能访问的变量或者方法(比如private)，在运行时通过反射是可以访问的，也就是说，可见性也是一种编译时的行为，在
【Spark九十四】spark-sql工具的使用 bit1129 spark
spark-sql是Spark bin目录下的一个可执行脚本，它的目的是通过这个脚本执行Hive的命令，即原来通过 hive>输入的指令可以通过spark-sql>输入的指令来完成。 spark-sql可以使用内置的Hive metadata-store，也可以使用已经独立安装的Hive的metadata store 关于Hive build into Spark
js做的各种倒计时 ronin47 js 倒计时
第一种：精确到秒的javascript倒计时代码 HTML代码: <form name="form1"> <div align="center" align="middle"
java-37.有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接 bylijinnan java
public class MaxCatenate { /* * Q.37 有n 个长为m+1 的字符串，如果某个字符串的最后m 个字符与某个字符串的前m 个字符匹配，则两个字符串可以联接， * 问这n 个字符串最多可以连成一个多长的字符串，如果出现循环，则返回错误。 */ public static void main(String[] args){
mongoDB安装开窍的石头 mongodb安装基本操作
mongoDB的安装 1:mongoDB下载 https://www.mongodb.org/downloads 2:下载mongoDB下载后解压
[开源项目]引擎的关键意义 comsci 开源项目
一个系统，最核心的东西就是引擎。。。。。而要设计和制造出引擎，最关键的是要坚持。。。。。。现在最先进的引擎技术，也是从莱特兄弟那里出现的，但是中间一直没有断过研发的
软件度量的一些方法 cuiyadll 方法
软件度量的一些方法http://cuiyingfeng.blog.51cto.com/43841/6775/在前面我们已介绍了组成软件度量的几个方面。在这里我们将先给出关于这几个方面的一个纲要介绍。在后面我们还会作进一步具体的阐述。当我们不从高层次的概念级来看软件度量及其目标的时候，我们很容易把这些活动看成是不同而且毫不相干的。我们现在希望表明他们是怎样恰如其分地嵌入我们的框架的。也就是我们度量的
XSD中的targetNameSpace解释 darrenzhu xml namespace xsd targetnamespace
参考链接: http://blog.csdn.net/colin1014/article/details/357694 xsd文件中定义了一个targetNameSpace后，其内部定义的元素，属性，类型等都属于该targetNameSpace,其自身或外部xsd文件使用这些元素，属性等都必须从定义的targetNameSpace中找：例如：以下xsd文件，就出现了该错误，即便是在一
什么是RAID0、RAID1、RAID0+1、RAID5，等磁盘阵列模式? dcj3sjt126com raid
RAID 1又称为Mirror或Mirroring，它的宗旨是最大限度的保证用户数据的可用性和可修复性。 RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。由于对存储的数据进行百分之百的备份，在所有RAID级别中，RAID 1提供最高的数据安全保障。同样，由于数据的百分之百备份，备份数据占了总存储空间的一半，因而，Mirror的磁盘空间利用率低，存储成本高。 Mir
yii2 restful web服务快速入门 dcj3sjt126com PHP yii2
快速入门 Yii 提供了一整套用来简化实现 RESTful 风格的 Web Service 服务的 API。特别是，Yii 支持以下关于 RESTful 风格的 API：支持 Active Record 类的通用API的快速原型涉及的响应格式（在默认情况下支持 JSON 和 XML) 支持可选输出字段的定制对象序列化适当的格式的数据采集和验证错误
MongoDB查询(3)——内嵌文档查询（七） eksliang MongoDB查询内嵌文档 MongoDB查询内嵌数组
MongoDB查询内嵌文档转载请出自出处：http://eksliang.iteye.com/blog/2177301 一、概述有两种方法可以查询内嵌文档：查询整个文档；针对键值对进行查询。这两种方式是不同的，下面我通过例子进行分别说明。二、查询整个文档例如:有如下文档 db.emp.insert({ &qu
android4.4从系统图库无法加载图片的问题 gundumw100 android
典型的使用场景就是要设置一个头像，头像需要从系统图库或者拍照获得，在android4.4之前，我用的代码没问题，但是今天使用android4.4的时候突然发现不灵了。baidu了一圈，终于解决了。下面是解决方案： private String[] items = new String[] { "图库","拍照" }; /* 头像名称 */
网页特效大全 jQuery等 ini JavaScript jquery css html5 ini
HTML5和CSS3知识和特效 asp.net ajax jquery实例分享一个下雪的特效 jQuery倾斜的动画导航菜单选美大赛示例你会选谁 jQuery实现HTML5时钟功能强大的滚动播放插件JQ-Slide 万圣节快乐！！！向上弹出菜单jQuery插件 htm5视差动画 jquery将列表倒转顺序推荐一个jQuery分页插件 jquery animate
swift objc_setAssociatedObject block(version1.2 xcode6.4) 啸笑天 version
import UIKit class LSObjectWrapper: NSObject { let value: ((barButton: UIButton?) -> Void)? init(value: (barButton: UIButton?) -> Void) { self.value = value
Aegis 默认的 Xfire 绑定方式，将 XML 映射为 POJO MagicMa_007 java POJO xml Aegis xfire
Aegis 是一个默认的 Xfire 绑定方式，它将 XML 映射为 POJO, 支持代码先行的开发.你开发服务类与 POJO,它为你生成 XML schema/wsdl XML 和注解映射概览默认情况下，你的 POJO 类被是基于他们的名字与命名空间被序列化。如果
js get max value in (json) Array qiaolevip 每天进步一点点学习永无止境 max 纵观千象
// Max value in Array var arr = [1,2,3,5,3,2];Math.max.apply(null, arr); // 5 // Max value in Jaon Array var arr = [{"x":"8/11/2009","y":0.026572007},{"x"
XMLhttpRequest 请求 XML,JSON ,POJO 数据 Luob. POJO json Ajax xml XMLhttpREquest
在使用XMlhttpRequest对象发送请求和响应之前，必须首先使用javaScript对象创建一个XMLHttpRquest对象。 var xmlhttp； function getXMLHttpRequest(){ if(window.ActiveXObject){ xmlhttp:new ActiveXObject("Microsoft.XMLHTTP
jquery wuai jquery
以下防止文档在完全加载之前运行Jquery代码，否则会出现试图隐藏一个不存在的元素、获得未完全加载的图像的大小等等 $(document).ready(function(){ jquery代码; }); <script type="text/javascript" src="c:/scripts/jquery-1.4.2.min.js&quo

【老生谈算法】matlab实现主成分算法源码——主成分

主成分（matlab数据处理）与MATLAB源码

1、算法详解：

你可能感兴趣的:(matlab精选项目源码,matlab,算法,开发语言)