zhushatong

【数学建模】《实战数学建模：例题与讲解》第十三讲-相关分析（含Matlab代码）

- 基本概念
- - 典型相关分析
  - 综合评价模型
  - 对应分析
  - 因子分析
  - 聚类分析
- 习题10.4
- - 1. 题目要求
  - 2.解题过程
  - 3.程序
- 习题10.5
- - 1. 题目要求
  - 2.解题过程
  - 3.程序
- 习题10.6（1）
- - 1. 题目要求
  - 2.解题过程——对应分析
  - 3.程序
  - 4.结果
- 习题10.6（2）
- - 1. 题目要求
  - 2.解题过程——R型因子分析
  - 3.程序
  - 4.结果
- 习题10.6（3）
- - 1. 题目要求
  - 2.解题过程——聚类分析
  - 3.程序
  - 4.结果

本系列侧重于例题实战与讲解，希望能够在例题中理解相应技巧。文章开头相关基础知识只是进行简单回顾，读者可以搭配课本或其他博客了解相应章节，然后进入本文正文例题实战，效果更佳。

如果这篇文章对你有帮助，欢迎点赞与收藏~

基本概念

变量类型：在进行相关分析之前，首先要确定所研究的变量类型。这些变量可以是连续的（如身高、体重）或者离散的（如性别、婚姻状况）。
相关系数：相关分析的核心是计算相关系数，这是一个度量值，表明两个变量之间的关系有多紧密。最常用的相关系数是皮尔逊相关系数（Pearson correlation coefficient），用于度量两个连续变量之间的线性关系。
线性与非线性关系：皮尔逊相关系数主要用于评估线性关系。对于非线性关系，可能需要使用其他类型的相关系数，如斯皮尔曼等级相关系数（Spearman’s rank correlation coefficient）。
方向：相关系数的值范围通常在-1到+1之间。一个正的相关系数意味着一个变量增加时，另一个变量也增加；负的相关系数则意味着一个变量增加时，另一个变量减少。
统计显著性：仅仅计算出相关系数是不够的，还需要评估这种相关性是否具有统计显著性。通常，这通过进行假设检验（如t检验）来实现。
因果关系：值得注意的是，即使两个变量之间存在强相关性，也不能自动推断出因果关系。相关性只能揭示变量之间的关联，而不是因果。

本文中的相关知识：

典型相关分析

计算两组变量（表示为 X 组和 Y 组）的典型变量，这些典型变量是通过线性组合构成，目的是最大化两组变量间的相关性。
计算原始变量与典型变量之间的相关系数，这展示了原始变量与新构造的典型变量之间的关联强度。
分析典型变量之间的典型相关系数，这反映了两组变量间的整体关联强度。

综合评价模型

用于评估多个指标的综合影响。在这个例子中，使用了无量纲化方法来处理不同单位或量级的数据，使得比较和评估成为可能。
使用欧氏距离和绝对值距离来评估不同湖泊水质的富营养化等级。

对应分析

这是一种用于探索分类数据的多元统计技术，它可以揭示分类变量之间的关系。在这个例子中，通过对应分析可以看出不同地区和指标之间的关系。

因子分析

用于数据简化和变量归约。在这个例子中，通过因子分析将多个变量简化为少数几个因子，从而使得解释变得更加简洁。

聚类分析

包括 R 型和 Q 型聚类，分别用于变量和样本点的分类。通过聚类分析，可以将变量或样本点分为不同的组，从而发现数据的内在结构。

习题10.4

1. 题目要求

2.解题过程

解：

根据计算，我们得到了 $\mathbf{X}$ 组的典型变量为：
$u_1=0.7689x_1+0.2721x_2$

$u_2=-1.4787x_1+1.6443x_2$

我们也得到了原始变量与 $\mathbf{X}$ 组典型变量之间的相关系数（如表 1）、原始变量与 $\mathbf{Y}$ 组典型变量之间的相关系数（如表 2），以及两组典型变量之间的典型相关系数（如表 3）。

表 1：原始变量与 X 组典型变量之间的相关系数

	$x_{1}$	$x_{2}$	$y_{1}$	$y_{2}$	$y_{3}$
$u_{1}$	0.986586	0.887215	0.289705	0.675704	0.35394
$u_{2}$	-0.16324	0.461356	0.158162	-0.02058	0.05631

表 2：原始变量与 Y 组典型变量之间的相关系数

	$x_{1}$	$x_{2}$	$y_{1}$	$y_{2}$	$y_{3}$
$v_{1}$	0.67872	0.610358	0.421115	0.982203	0.514487
$v_{2}$	-0.0305	0.086212	0.846397	-0.11014	0.301341

表 3：两组典型变量之间的典型相关系数


1	0.6879
2	0.1869

从这些表中，我们可以看到，两个表示外出活动特性的变量 $x_1$ 和 $x_2$ 与 $u_1$ 的相关系数较大，说明 $u_1$ 可以被视为形容外出活动特性的指标。在第一对典型变量中， $v_1$ 与 $y_2$ （代表家庭年收入）的相关系数较大，因此我们可以认为 $v_1$ 主要代表了家庭的年收入。此外， $u_1$ 和 $v_1$ 之间的典型相关系数为 0.6879，说明这两个典型变量在一定程度上是相关的。

最后，对于原始变量的解释度， $u_1$ 和 $v_1$ 解释的本组原始变量的比率分别为 0.8803 和 0.4689。这表示 $u_1$ 和 $v_1$ 在一定程度上能够解释原始变量的变异。而且， $\mathbf{X}$ 组的原始变量被 $u_1$ 和 $u_2$ 完全（100%）解释了，而 $\mathbf{Y}$ 组的原始变量被 $v_1$ 和 $v_2$ 解释了 74.2%，说明典型变量确实能够在很大程度上表现出原始变量的特性。

3.程序

求解的MATLAB程序如下：

clc, clear;

% 加载数据
correlation_matrix = load('data104.txt');

% X组和Y组变量的数量
num_X = 2;
num_Y = 3;
num_min = min(num_X, num_Y);

% 提取X与X，Y与Y，Y与X的相关系数
correlation_XX = correlation_matrix([1:num_X], [1:num_X]);
correlation_YX = correlation_matrix([1:num_X], [num_X+1:end]);
correlation_XY = correlation_YX';
correlation_YY = correlation_matrix([num_X+1:end], [num_X+1:end]);

% 计算矩阵M1和M2
matrix_M1 = inv(correlation_XX) * correlation_YX * inv(correlation_YY) * correlation_XY;
matrix_M2 = inv(correlation_YY) * correlation_XY * inv(correlation_XX) * correlation_YX;

% 求M1的特征向量和特征值
[eigVec_M1, eigVal_M1] = eig(matrix_M1);
for i = 1:num_X
    % 特征向量归一化，满足a's1a=1，特征向量乘±1，保证所有分量和为正
    eigVec_M1(:, i) = eigVec_M1(:, i) / sqrt(eigVec_M1(:, i)' * correlation_XX * eigVec_M1(:, i));
    eigVec_M1(:, i) = eigVec_M1(:, i) / sign(sum(eigVec_M1(:, i)));
end
% 计算特征值的平方根，按照从大到小排列
eigVal_M1 = sqrt(diag(eigVal_M1));
[eigVal_M1, ind1] = sort(eigVal_M1, 'descend');

% 取出X组的系数阵和典型相关系数
coef_X = eigVec_M1(:, ind1(1:num_min));
canCorrelation_X = eigVal_M1(1:num_min);

% 求M2的特征向量和特征值
[eigVec_M2, eigVal_M2] = eig(matrix_M2);
for i = 1:num_Y
    % 特征向量归一化，满足b's2b=1，特征向量乘±1，保证所有分量和为正
    eigVec_M2(:, i) = eigVec_M2(:, i) / sqrt(eigVec_M2(:, i)' * correlation_YY * eigVec_M2(:, i));
    eigVec_M2(:, i) = eigVec_M2(:, i) / sign(sum(eigVec_M2(:, i)));
end
% 计算特征值的平方根，按照从大到小排列
eigVal_M2 = sqrt(diag(eigVal_M2));
[eigVal_M2, ind2] = sort(eigVal_M2, 'descend');

% 取出Y组的系数阵和典型相关系数
coef_Y = eigVec_M2(:, ind2(1:num_min));
canCorrelation_Y = eigVal_M2(1:num_min);

% 计算X，u；Y，v；X，v；Y，u的相关系数
correlation_XU = correlation_XX * coef_X;
correlation_YV = correlation_YY * coef_Y;
correlation_XV = correlation_YX * coef_Y;
correlation_YU = correlation_XY * coef_X;

% 计算X组、Y组原始变量被ui、vi解释的方差比例
ratio_XU = sum(correlation_XU.^2) / num_X;
ratio_XV = sum(correlation_XV.^2) / num_X;
ratio_YU = sum(correlation_YU.^2) / num_Y;
ratio_YV = sum(correlation_YV.^2) / num_Y;

% 输出结果
fprintf('X组的原始变量被u1~u%d解释的比例为%f\n', num_min, sum(ratio_XU));
fprintf('Y组的原始变量被v1~v%d解释的比例为%f\n', num_min, sum(ratio_YV));

习题10.5

1. 题目要求

2.解题过程

解：

在进行综合评价之前，首先要对评价的指标进行分析。通常的评价指标分为效益型、成本型和固定型指标。效益型指标是指那些数值越大影响力越大的统计指标(也称为正向型指标);成本型指标是指数值越小越好的指标(亦称为逆向型指标);而固定型指标是指数值越接近某个常数越好的指标(又称为适度型指标)。如果各评价指标的属性不一致,则在进行综合评估时容易发生偏差,必须先对各评价指标统一属性。

建立无量纲化实测数据矩阵和评价标准矩阵。实测数据矩阵为 $\mathbf{A}$ 和等级标准矩阵为 $\mathbf{B}$ ，然后建立无量纲化实测数据矩阵 $\mathbf{C}$ 和无量纲化等级标准矩阵 $\mathbf{D}$ 。其中， $c_{ij}$ 和 $d_{kt}$ 的计算方法如下：

$c_{ij}$ 和 $d_{kt}$ 的计算方式：
$c_{ij} = \begin{cases} a_{ij} / \max_i a_{ij}, & \text{if } j \neq 3 \\ \min_i a_{ij} / a_{ij}, & \text{if } j = 3 \end{cases}$

$d_{kt} = \begin{cases} b_{kt} / \max_i b_{kt}, & \text{if } k \neq 3 \\ \min_i b_{kt} / b_{kt}, & \text{if } k = 3 \end{cases}$
计算 $\mathbf{D}$ 的各行向量的均值 $\mu_i$ 、标准差 $s_i$ 和变异系数 $w_i$ ，以及权向量 $\boldsymbol{w}$ 。计算公式如下：

$\mu_i$ ， $s_i$ 和 $w_i$ 的计算方式：
$\mu_i = 0.2 \sum_{j=1}^{5} d_{ij} s_i = \sqrt{\frac{\sum_{j=1}^{5} (d_{ij}-\mu_i)^2}{4}} w_i = s_i / \mu_i$

$\boldsymbol{w}$ 的计算方式：
$\boldsymbol{w} = [0.277,0.2447,0.2347,0.2442]$
建立综合评价模型，计算 $\mathbf{C}$ 中各个行向量到 $\mathbf{D}$ 中各个列向量的欧氏距离 $x_{ij}$ 和绝对值距离 $y_{ij}$ 。若 $x_{ik}=\min_{1\leq j\leq5}{x_{ij}}$ 或 $y_{ik}=\min_{1\leq j\leq5}{y_{ij}}$ 则表明第 $i$ 个湖泊属于第 $k$ 级。

然后，我们可以得到以下欧氏距离判别表和绝对值距离判别表。 $x_{ij}$ 和 $y_{ij}$ 的计算方式：
$x_{ij} = \sqrt{\sum_{k=1}^{4} (c_{ik}-d_{kj})^2}\\ y_{ij} = \sum_{k=1}^{4} |c_{ik}-d_{kj}|$

然后，我们可以得到以下欧氏距离判别表和绝对值距离判别表。

欧氏距离判别表

湖泊	$x_{i1}$	$x_{i2}$	$x_{i3}$	$x_{i4}$	$x_{i5}$	级别
杭州西湖	1.8472	1.8312	1.7374	1.3769	0.2881	5
武汉东湖	1.5959	1.5798	1.4859	1.1271	0.5034	5
青海湖	0.2185	0.2045	0.1367	0.3383	1.7917	3
巢湖	1.3201	1.3038	1.2082	0.8392	0.9591	4
滇池	1.0793	1.0650	0.9867	0.7328	1.3450	4

绝对值距离判别表

湖泊	$y_{i1}$	$y_{i2}$	$y_{i3}$	$y_{i4}$	$y_{i5}$	级别
杭州西湖	3.6631	3.6303	3.4374	2.6783	0.3231	5
武汉东湖	3.1436	3.1108	2.9178	2.1587	0.8427	5
青海湖	0.4062	0.3734	0.2110	0.5787	3.5800	3
巢湖	2.4071	2.3743	2.1814	1.4223	1.5791	4
滇池	1.6701	1.6374	1.4444	1.0660	2.3161	4

从上面的计算可知，尽管欧几里得距离与绝对值距离意义不同，但是对各湖泊水质的富营养化的评价等级是一样的，表明此处给出的方法具有稳定性。

3.程序

求解的MATLAB程序如下：

% 清除环境变量
clc; clear;

% 初始化实测数据矩阵
rawData = [130,10.3,0.35,2.76;
    105,10.7,0.4,2.0;
    20,1.4,4.5,0.22;
    30,6.26,0.25,1.67;
    20,10.13,0.5,0.23];

% 初始化等级标准矩阵
standardMatrix = [1,4,23,110,660;
    0.09,0.36,1.8,7.1,27.1;
    37,12.,2.4,0.55,0.17;
    0.02,0.06,0.31,1.2,4.6];

% 进行无量纲化处理
normalizedRawData = rawData ./ repmat(max(rawData), size(rawData, 1), 1);
normalizedRawData(:, 3) = min(rawData(:, 3)) ./ rawData(:, 3);

normalizedStandardMatrix = standardMatrix ./ repmat(max(standardMatrix, [], 2), 1, size(standardMatrix, 2));
normalizedStandardMatrix(3, :) = min(standardMatrix(3, :)) ./ standardMatrix(3, :);

% 计算均值和标准差
average = mean(standardMatrix, 2);
standardDeviation = std(standardMatrix, [], 2);

% 计算权重
weights = standardDeviation ./ average;
weights = weights / sum(weights);

% 计算欧式距离
euclideanDistances = dist(normalizedRawData, normalizedStandardMatrix);

% 计算绝对值距离
absoluteDistances = mandist(normalizedRawData, normalizedStandardMatrix);

习题10.6（1）

1. 题目要求

2.解题过程——对应分析

解：

分别用 $i=1,\dots,16$ 表示，以 $a_{ij}$ 表示第 i 个地区第 j 个指标变量 $x_j$ 的取值。

记：
$\mathbf{A}=(a_{ij})_{16\times6}$
记：
$a_{i\cdot}=\sum_{j=1}^{6}a_{ij},a_{\cdot j}=\sum_{i=1}^{16}a_{ij}$
首先把 $\mathbf{A}$ 化为规格化的“概率”矩阵 $\mathbf{P}$ ，记 $\mathbf{P}=(p_{ij})_{16\times6}$ ，其中 $p_{ij}=a_{ij}/\mathbf{T}$ ， $\mathbf{T}=\sum_{i=1}^{16}\sum_{j=1}^{6}a_{ij}$ 。再对数据进行对应变换，令 $\mathbf{B}=(b_{ij})_{16\times6}$ ，其中：
$b_{ij}=\frac{p_{ij}-p_{i\cdot}p_{\cdot j}}{\sqrt{p_{i\cdot}p_{\cdot j}}} = \frac{a_{ij}-a_{i\cdot}a_{\cdot j}/\mathbf{T}}{\sqrt{a_{i\cdot}a_{\cdot j}}}, i=1,2,\dots, 16,j=1,2,\dots,6.$
对 $\mathbf{B}$ 进行奇异值分解， $\mathbf{B}=\mathbf{U}\varLambda \mathbf{V}^{\mathbf{T}}$ ，其中 $\mathbf{U}$ 为 $16\times 16$ 正交矩阵， $\mathbf{V}$ 为 $6\times6$ 正交矩阵， $\varLambda =\begin{bmatrix} \varLambda_m &0\\ 0&0 \end{bmatrix}$ ，这里 $ \varLambda_m=diag(d_1,\dots,d_m) $ ，其中 $d_i(i=1,2,\dots,m)$ 为 $\mathbf{B}$ 的奇异值。

记 $\mathbf{U}=[\mathbf{U_1} \vdots \mathbf{U_2}],\mathbf{V}=[\mathbf{V_1} \vdots \mathbf{V_2}]$ ，其中 $\mathbf{U_1}$ 为 $16\times m$ 的列正交矩阵， $\mathbf{V_1}$ 为 $6\times m$ 的列正交矩阵，则 $\mathbf{B}$ 的奇异值分解式等价于 $\mathbf{B}=\mathbf{U_1}\varLambda\mathbf{V_1}^T$ 。

记 $\mathbf{D_r}=diag(p_{1\cdot},p_{2\cdot},\dots,p_{16\cdot}),\mathbf{D_c}=diag(p_{\cdot1},p_{\cdot2},\dots,p_{\cdot6})$ ，其中 $p_{i\cdot}=\sum_{j=1}^{6}p_{ij}$ ， $p_{\cdot j}=\sum_{i=1}^{16}p_{ij}$ 。则列轮廓的坐标为 $\mathbf{F}=\mathbf{D}_{c}^{-1/2}\mathbf{V_1}\varLambda_m$ ，行轮廓的坐标为 $\mathbf{G}=\mathbf{D}_{r}^{-1/2}\mathbf{V_1}\varLambda_m$ 。最后通过贡献率的比较确定需要截取的维数，形成对应分析图。

计算 $\mathbf{B^T}\mathbf{B}$ 的特征值，惯量，表示相应维数对各类别的解释量，最大维数 $m=\min{16-1,6-1}$ ，本例最多可以产生5个维数。从下表可看出，第一维数的解释量达 77.4% ，前两个维数的解释度已达92.1%。

维数	奇异值	惯量	贡献率	累积贡献率
1	0.189893	0.036059	0.773764	0.773764
2	0.082831	0.006861	0.147224	0.920988
3	0.047138	0.002222	0.047618	0.968669
4	0.03113	0.000969	0.020795	0.989464
5	0.022159	0.000491	0.010536	1

行坐标

	北京	天津	河北	山西	内蒙古	辽宁
第一维	-0.07905	-0.06783	-0.26354	0.457766	0.07715	-0.13567
第二维	-0.0354	0.138818	-0.10045	-0.05715	0.156316	-0.08455

	吉林	黑龙江	上海	江苏	浙江	安徽
第一维	-0.27126	-0.19757	0.386809	0.086955	0.079122	-0.14212
第二维	-0.00074	0.045985	-0.07833	-0.04222	-0.01969	-0.14225

	福建	江西	山东	河南
第一维	-0.17469	-0.18859	0.069823	-0.1462
第二维	-0.11317	-0.1527	0.100318	0.032858

列坐标

	x1	x2	x3	x4	x5	x6
第一维	-0.07905	-0.06783	-0.26354	0.457766	0.07715	-0.13567
第二维	-0.0354	0.138818	-0.10045	-0.05715	0.156316	-0.08455

在下图中，给出16个地区和6个指标在相同坐标系上绘制的散布图。

【数学建模】《实战数学建模：例题与讲解》第十三讲-相关分析（含Matlab代码）_第5张图片

从图中可以看出，地区和指标点可以分为两类，

第一类包括指标点 $x_4,x_5$ ，地区点为北京、天津、河北、上海、江苏、浙江、山东；

第二类包括指标点 $x_1,x_2,x_3,x_6$ ，地区点为其余地区。

3.程序

求解的MATLAB程序如下：

clc, clear

% 原始数据，其中包含了16个地区的6项指标
originalData = [190.33, 43.77, 9.73, 60.54, 49.01, 9.04; ...
    135.20, 36.40, 10.47, 44.16, 36.49, 3.94; ...
    95.21, 22.83, 9.30, 22.44, 22.81, 2.80; ...
    104.78, 25.11, 6.40, 9.89, 18.17, 3.25; ...
    128.41, 27.63, 8.94, 12.58, 23.99, 3.27; ...
    145.68, 32.83, 17.79, 27.29, 39.09, 3.47; ...
    159.37, 33.38, 18.37, 11.81, 25.29, 5.22; ...
    116.22, 29.57, 13.24, 13.76, 21.75, 6.04; ...
    221.11, 38.64, 12.53, 115.65, 50.82, 5.89; ...
    144.98, 29.12, 11.67, 42.60, 27.30, 5.74; ...
    169.92, 32.75, 12.72, 47.12, 34.35, 5.00; ...
    153.11, 23.09, 15.62, 23.54, 18.18, 6.39; ...
    144.92, 21.26, 16.96, 19.52, 21.75, 6.73; ...
    140.54, 21.50, 17.64, 19.19, 15.97, 4.94; ...
    115.84, 30.26, 12.20, 33.61, 33.77, 3.85; ...
    101.18, 23.26, 8.46, 20.20, 20.50, 4.30];

% 计算原始数据的总和
totalSum = sum(sum(originalData));

% 计算原始数据的比例
ratioData = originalData / totalSum;

% 计算行和列的比例
rowRatio = sum(ratioData, 2);
columnRatio = sum(ratioData);

% 计算行剖面数据
Row_prifile = originalData ./ repmat(sum(originalData, 2), 1, size(originalData, 2));

% 计算B（B为对应分析的基础矩阵）
B = (ratioData - rowRatio * columnRatio) ./ sqrt(rowRatio*columnRatio);

% 对B矩阵进行奇异值分解，得到U，S，V矩阵
[U, S, V] = svd(B, 'econ');

% 对V矩阵列求和并根据其符号调整权重
W1 = sign(repmat(sum(V), size(V, 1), 1));

% 对U矩阵列求和并根据其符号调整权重
W2 = sign(repmat(sum(V), size(U, 1), 1));

% 应用权重调整V和U矩阵
V_adjusted = V .* W1;
U_adjusted = U .* W2;

% 计算lambda（特征值的平方）
lambda = diag(S).^2;

% 计算卡方统计量
chi2Square = totalSum * (lambda);

% 计算总的卡方统计量
totalChi2Square = sum(chi2Square);

% 计算贡献率
contributionRate = lambda / sum(lambda);

% 计算累计贡献率
cumulativeRate = cumsum(contributionRate);

% 计算行轮廓坐标
beta = diag(rowRatio.^(-1 / 2)) * U_adjusted;
G = beta * S

% 计算列轮廓坐标
alpha = diag(columnRatio.^(-1 / 2)) * V_adjusted;
F = alpha * S

% 计算样本点的个数
numOfSample = size(G, 1);

% 计算坐标的取值范围
range = minmax(G(:, [1, 2])');

% 画图略

4.结果

详见上文分析过程，地区和指标点可以分为两类，

第一类包括指标点 $x_4,x_5$ ，地区点为北京、天津、河北、上海、江苏、浙江、山东；

第二类包括指标点 $x_1,x_2,x_3,x_6$ ，地区点为其余地区。

习题10.6（2）

1. 题目要求

同上。

2.解题过程——R型因子分析

解：

对数据进行标准化处理。

计算变量间的相关系数得出相关矩阵 $\mathbf{R}$ ，然后计算初等载荷矩阵 $\mathbf{\Lambda_1}$ 。

计算得到特征根与各因子的贡献如下表所示。

value	x1	x2	x3	x4	x5	x6
特征值	3.55842	1.316252	0.608239	0.373383	0.107178	0.036527
贡献率	59.30701	21.93754	10.13732	6.223052	1.786295	0.608786
累积贡献率	59.30701	81.24454	91.38187	97.60492	99.39121	100

选择 $m(m\leq6)$ 个主因子，构造因子模型：
$\begin{align*} \begin{cases} \widetilde{x}_1=\alpha_{11}\widetilde{F}_1+\alpha_{12}\widetilde{F}_2+\alpha_{13}\widetilde{F}_3 \\ \vdots\\ \widetilde{x}_7=\alpha_{71}\widetilde{F}_1+\alpha_{72}\widetilde{F}_2+\alpha_{73}\widetilde{F}_3 \end{cases}\end{align*}$
求得因子载荷等估计。

最终，通过表格，可以看出，得到了3个因子，第一个因子是穿住用因子，第二个因子是燃料因子，第3个因子是文化因子。

第(1)问中得到 $x_4,x_5$ 是一类变量，这里得到 $x_2,x_4,x_5$ 是一类变量，略有差异。

3.程序

求解的MATLAB程序如下：

clc, clear 

% 原始数据，包含了16个地区的6项指标
originalData = [190.33, 43.77, 9.73, 60.54, 49.01, 9.04; ...
    135.20, 36.40, 10.47, 44.16, 36.49, 3.94; ...
    95.21, 22.83, 9.30, 22.44, 22.81, 2.80; ...
    104.78, 25.11, 6.40, 9.89, 18.17, 3.25; ...
    128.41, 27.63, 8.94, 12.58, 23.99, 3.27; ...
    145.68, 32.83, 17.79, 27.29, 39.09, 3.47; ...
    159.37, 33.38, 18.37, 11.81, 25.29, 5.22; ...
    116.22, 29.57, 13.24, 13.76, 21.75, 6.04; ...
    221.11, 38.64, 12.53, 115.65, 50.82, 5.89; ...
    144.98, 29.12, 11.67, 42.60, 27.30, 5.74; ...
    169.92, 32.75, 12.72, 47.12, 34.35, 5.00; ...
    153.11, 23.09, 15.62, 23.54, 18.18, 6.39; ...
    144.92, 21.26, 16.96, 19.52, 21.75, 6.73; ...
    140.54, 21.50, 17.64, 19.19, 15.97, 4.94; ...
    115.84, 30.26, 12.20, 33.61, 33.77, 3.85; ...
    101.18, 23.26, 8.46, 20.20, 20.50, 4.30];

% 数据标准化
standardizedData = zscore(originalData);

% 计算相关性矩阵
correlationMatrix = corrcoef(standardizedData);

% 使用主成分分析方法对相关性矩阵进行处理，得到特征向量、特征值和贡献率
[eigenvectors, eigenvalues, contribution] = pcacov(correlationMatrix);

% 计算累积贡献率
cumulativeContribution = cumsum(contribution);

% 根据特征向量的符号进行调整
adjustedSigns = repmat(sign(sum(eigenvectors)), size(eigenvectors, 1), 1);
adjustedEigenvectors = eigenvectors .* adjustedSigns;

% 根据特征值进行缩放
scaledFactors = repmat(sqrt(eigenvalues)', size(adjustedEigenvectors, 1), 1);
scaledEigenvectors = adjustedEigenvectors .* scaledFactors;

% 计算贡献率
contribution1 = sum(scaledEigenvectors.^2);

% 选择的因子数量
factorNum = 3;

% 根据选择的因子数量得到对应的因子
selectedFactors = scaledEigenvectors(:, [1:factorNum]);

% 使用方差最大法进行因子旋转
[rotatedFactors, factorMatrix] = rotatefactors(selectedFactors, 'method', 'varimax')

% 合并旋转后的因子和其他因子
mergedFactors = [rotatedFactors, scaledEigenvectors(:, [factorNum + 1:end])];

% 计算因子载荷量
factorLoads = sum(rotatedFactors.^2, 2)

% 计算贡献率
contribution2 = sum(mergedFactors.^2)

% 计算每个因子的贡献率
contributionRate = contribution2(1:factorNum) / sum(contribution2);

% 计算因子得分系数矩阵
factorScoreCoefficients = inv(correlationMatrix) * rotatedFactors;

4.结果

求得因子载荷等估计如下表所示。

【数学建模】《实战数学建模：例题与讲解》第十三讲-相关分析（含Matlab代码）_第8张图片

可以看出，得到了3个因子，第一个因子是穿住用因子，第二个因子是燃料因子，第3个因子是文化因子。

第(1)问中得到 $x_4,x_5$ 是一类变量，这里得到 $x_2,x_4,x_5$ 是一类变量，略有差异。

习题10.6（3）

1. 题目要求

同上。

2.解题过程——聚类分析

解：

首先计算变量间的相关系数。用两变量 $x_j$ 与 $x_k$ 的相关系数作为它们的相似性度量,即 $x_j$ 与 $x_k$ 的相似系数为
$r_{jk} = \frac{\sum_{i=1}^{16}(a_{ij}-\mu_{j})(a_{ik}-\mu_k)} {[\sum_{i=1}^{16}(a_{ij}-\mu_{j})^2\sum_{i=1}^{16}(a_{ik}-\mu_k)^2]^{1/2}},j,k=1,\dots,6.$
然后计算6个变量两两之间的距离，构造距离矩阵。

接着使用最短距离法来测量类与类之间的距离,记类 $G_{p}$ 和 $G_{q}$ 之间的距离:
$D(G_p,G_q) = \min_{i\in G_p,k\in G_q }{d_{ik}}.$
变量聚类的结果是变量 $x_3$ 自成一类，其他变量为一类。画出的变量聚类图如下图所示。

【数学建模】《实战数学建模：例题与讲解》第十三讲-相关分析（含Matlab代码）_第9张图片

最后进行样本点聚类的 $\mathbf{Q}$ 型聚类分析。

计算16个样本点之间的两两马氏距离。

类与类间相似性度量。

画聚类图，并对样本点进行分类。

样本点的聚类结果如下图所示。通过聚类图，可以把地区分成4类，北京自成一类，吉林自成一类，上海自成一类，其他地区为一类。

【数学建模】《实战数学建模：例题与讲解》第十三讲-相关分析（含Matlab代码）_第10张图片

3.程序

求解的MATLAB程序如下：R型聚类

clc, clear 

% 原始数据，包含了16个地区的6项指标
originalData = [190.33, 43.77, 9.73, 60.54, 49.01, 9.04; ...
    135.20, 36.40, 10.47, 44.16, 36.49, 3.94; ...
    95.21, 22.83, 9.30, 22.44, 22.81, 2.80; ...
    104.78, 25.11, 6.40, 9.89, 18.17, 3.25; ...
    128.41, 27.63, 8.94, 12.58, 23.99, 3.27; ...
    145.68, 32.83, 17.79, 27.29, 39.09, 3.47; ...
    159.37, 33.38, 18.37, 11.81, 25.29, 5.22; ...
    116.22, 29.57, 13.24, 13.76, 21.75, 6.04; ...
    221.11, 38.64, 12.53, 115.65, 50.82, 5.89; ...
    144.98, 29.12, 11.67, 42.60, 27.30, 5.74; ...
    169.92, 32.75, 12.72, 47.12, 34.35, 5.00; ...
    153.11, 23.09, 15.62, 23.54, 18.18, 6.39; ...
    144.92, 21.26, 16.96, 19.52, 21.75, 6.73; ...
    140.54, 21.50, 17.64, 19.19, 15.97, 4.94; ...
    115.84, 30.26, 12.20, 33.61, 33.77, 3.85; ...
    101.18, 23.26, 8.46, 20.20, 20.50, 4.30];

% 计算相关性矩阵
correlationMatrix = corrcoef(originalData);

% 计算距离矩阵
distanceMatrix = 1 - abs(correlationMatrix);
distanceMatrix = tril(distanceMatrix);

% 将距离矩阵转为一维向量
distanceVector = nonzeros(distanceMatrix);
distanceVector = distanceVector';

% 使用层次聚类算法进行聚类
linkageCluster = linkage(distanceVector);

% 选择最大聚类数量为2，得到每个样本的类别
clusterLabels = cluster(linkageCluster, 'maxclust', 2);

% 找到属于第一类的样本
index1 = find(clusterLabels == 1); 
index1 = index1'

% 找到属于第二类的样本
index2 = find(clusterLabels == 2); 
index2 = index2'

% 生成树状图
h = dendrogram(linkageCluster);

% 设置树状图的颜色和线条宽度
set(h, 'Color', 'k', 'LineWidth', 1.3)

求解的MATLAB程序如下：Q型聚类

clc, clear 

% 原始数据，包含了16个地区的6项指标
originalData = [190.33, 43.77, 9.73, 60.54, 49.01, 9.04; ...
    135.20, 36.40, 10.47, 44.16, 36.49, 3.94; ...
    95.21, 22.83, 9.30, 22.44, 22.81, 2.80; ...
    104.78, 25.11, 6.40, 9.89, 18.17, 3.25; ...
    128.41, 27.63, 8.94, 12.58, 23.99, 3.27; ...
    145.68, 32.83, 17.79, 27.29, 39.09, 3.47; ...
    159.37, 33.38, 18.37, 11.81, 25.29, 5.22; ...
    116.22, 29.57, 13.24, 13.76, 21.75, 6.04; ...
    221.11, 38.64, 12.53, 115.65, 50.82, 5.89; ...
    144.98, 29.12, 11.67, 42.60, 27.30, 5.74; ...
    169.92, 32.75, 12.72, 47.12, 34.35, 5.00; ...
    153.11, 23.09, 15.62, 23.54, 18.18, 6.39; ...
    144.92, 21.26, 16.96, 19.52, 21.75, 6.73; ...
    140.54, 21.50, 17.64, 19.19, 15.97, 4.94; ...
    115.84, 30.26, 12.20, 33.61, 33.77, 3.85; ...
    101.18, 23.26, 8.46, 20.20, 20.50, 4.30];

% 计算原始数据的协方差
covarianceMatrix = cov(originalData);

% 初始化距离矩阵
distanceMatrix = zeros(size(originalData, 1));

% 计算Q型距离
for j = 1:15
    for i = j+1:16
        distanceMatrix(i,j) = sqrt((originalData(i,:) - originalData(j,:)) * inv(covarianceMatrix) * (originalData(i,:) - originalData(j,:))');
    end
end

% 将距离矩阵转为一维向量
distanceVector = nonzeros(distanceMatrix);
distanceVector = distanceVector';

% 使用层次聚类算法进行聚类
linkageCluster = linkage(distanceVector);

% 生成树状图
dendro = dendrogram(linkageCluster);

% 设置树状图的颜色和线条宽度
set(dendro,'Color','k','LineWidth',1.3)

4.结果

变量 $x_3$ 自成一类，其他变量为一类。

北京自成一类，吉林自成一类，上海自成一类，其他地区为一类。

如果这篇文章对你有帮助，欢迎点赞与收藏~

你可能感兴趣的:(数学建模,数学建模,matlab,综合评价,对应分析,因子分析,聚类分析)

使用 Redis 实现手机号验证码登陆功能，实际开发中使用 Token 实现登录校验又是如何做的？程序猿ZhangSir Java Spring全家桶微服务 java bootstrap 开发语言
目录一.使用Redis实现短信登陆功能1.1前言1.2简要分析短信登陆的业务流程1.3代码书写1.4页面展示效果1.5代码优化1.6优化之后的代码二.登录Token2.1JWT简介2.2JWT的使用方式2.3返回token2.4JWT的校验方式一.使用Redis实现短信登陆功能1.1前言对于我们用户来讲，我们在登陆一个APP的时候，有很多种登陆方式，比如"微信扫码"、"手机号登陆"、"支付宝扫码"
This robot has a joint named “gripper_finger_joint“ which is not in the gazebo model. 无码不欢的我 ROS
在B站上看古月居的课《ROS机械臂开发：从入门到实战》，在运行第9节的代码时，出现如下报错：Thisrobothasajointnamed"gripper_finger_joint"whichisnotinthegazebomodel.本人所运行环境为：ubuntu版本：20.04ROS版本：noetic错误分析：xacro的宏调用格式错误，正确格式为或者为：...修改方法：1.找到probot_
chatgpt赋能python：Python处理雷达基数据：从入门到实践 lvsetongdao123 ChatGpt python chatgpt 开发语言计算机
Python处理雷达基数据：从入门到实践随着气象技术的不断发展，雷达探测技术已成为当今天气预报和气象研究的主要手段之一。雷达基数据是气象雷达接收到的未经加工的原始数据，因其包含大量天气信息，不仅在天气预报、天气预警等方面得到了广泛应用，还被广泛地用于气象科研和大气环境研究。本文将介绍如何使用Python处理雷达基数据，解析其中的信息，获取有效的天气数据，以及分析和可视化这些数据。雷达基数据格式与处
Kafka 数据写入问题喝醉酒的小白 DBA kafka 分布式
目录标题分析思路1.**生产者配置问题**：Kafka生产者的配置参数生产者和消费者的处理确定并优化2.**网络问题**：3.**Kafka集群配置问题**：unclean.leader.election.enable4.**Zookeeper配置问题**：5.**JVM参数调优**：6.**副本因子和同步复制**：分析思路针对您提到的Kafka数据写入问题，以下是一些具体的原因和排查命令：1.生
小白学java日记day22--单例实例兰翎翡竹
定义一个类只允许有一个对象,建立一个全局的访问点,提供出去供大家使用.分析:1.我们肯定要建立一个单例类来描述2.只允许有一个对象3.全局的访问点:说的就是当前的s----通过static实现的4.提供出去5.给大家使用总括:1.传值.作为全局的访问点.解决一个全局使用的类，频繁创建和销毁。拥有对象的唯一性，并保证内存中对象的唯一。可以节省内存，因为单例共用一个实例，有利于Java的垃圾回收机制。
分布式事务3PC解决了2PC哪些问题？ java干货仓库八股文汇总分布式事务分布式 java 面试
三阶段提交（3PC，Three-PhaseCommit）是对二阶段提交（2PC，Two-PhaseCommit）的改进，旨在解决2PC的一些固有缺陷，特别是在分布式系统中的容错性和性能问题。以下是3PC比2PC更好的原因及其优势的详细分析：1.二阶段提交（2PC）的问题2PC是一种经典的分布式事务协议，分为两个阶段：准备阶段（PreparePhase）：协调者向所有参与者发送准备请求。参与者执行事
机器学习流程—数据预处理清洗不二人生机器学习机器学习人工智能数据预处理
文章目录机器学习流程—数据预处理清洗定义问题数据预处理数据加载与展示重复数据处理数据类型空值处理无关特征删除数据分布删除异常值生成标签和特征数据分割机器学习流程—数据预处理清洗数据处理是将数据从给定形式转换为更可用和更理想的形式的任务，即使其更有意义、信息更丰富。使用机器学习算法、数学建模和统计知识，整个过程可以自动化。这个完整过程的输出可以是任何所需的形式，如图形、视频、图表、表格、图像等等，具
如何有效判断与排查Java GC问题 java算法
目录一、GC的重要性与对性能的影响（一）GC对性能的影响简要分析1.GC暂停与应用停顿2.GC吞吐量与资源利用率3.GC对内存管理的作用：资源回收4.GC策略与优化的选择（二）GC的双刃剑二、GC性能评价标准（一）GC性能评价标准：延迟（Latency）与吞吐量（Throughput）延迟STW（Latency）吞吐量（Throughput）（二）SLA与实际业务需求的结合1.如何结合SLA和GC
C# Windows Forms点击事件详解 Ro小陌 Windows C#开发语言 c#windows 开发语言
在C#WindowsForms开发中，点击事件是最基础且高频使用的交互机制。以下从底层原理、事件绑定、常见问题及高级用法四个维度进行深度解析：一、点击事件的底层机制消息循环与事件驱动WindowsForms基于Win32消息循环，所有用户操作（如点击）会被转换为WM_LBUTTONDOWN、WM_LBUTTONUP等消息。.NET通过Application.Run()启动消息循环，将消息路由到对应
游戏成瘾与学习动力激发策略研究——了解“情感解离”“创伤理论” *TQK* 知也思维认知心理学研究
一、情感解离（EmotionalDissociation）定义：情感解离是一种心理防御机制，指个体在经历无法承受的情绪压力或创伤时，通过切断情感体验与认知、记忆或现实感知的联系来保护自我。它不是简单的“麻木”，而是大脑为应对极端刺激而启动的“紧急逃生通道”。核心特征1、意识分裂现实解离：感到身体或环境“不真实”（如玩游戏时出现“灵魂出窍”般的视角抽离）情感隔离：能描述事件但无法体验对应情绪（如你通
做数据分析，如何给业务提可行性建议——看板软件数据可视化
在为业务提供数据分析可行性建议时，看板软件的选择是一个重要环节。以下是一些建议，可以帮助您为业务选择适合的数据分析看板软件：一、明确业务需求首先，需要明确业务的具体需求，包括数据分析的目的、所需的数据类型、分析的深度与广度等。这将有助于确定所需看板软件的功能和特性。二、了解看板软件类型看板软件可以分为多种类型，如数据可视化工具、商业智能（BI）工具、项目管理工具等。了解这些类型及其特点，有助于更好
04.原型模式设计思想 java
04.原型模式设计思想目录介绍01.原型模式介绍1.1原型模式由来1.2原型模式定义1.3原型模式场景1.4原型模式思考02.原型模式原理与实现2.1罗列一个场景2.2用例子理解原型2.3案例演变分析2.4原型模式基本实现03.原型模式分析3.1原型模式VS工厂模式3.2原型模式VS深拷贝04.原型模式应用解析4.1使用clone方法4.2实现接口Cloneable4.3深克隆和浅克隆05.原型模
03.建造者模式设计思想 java
03.建造者模式设计思想目录介绍01.建造者模式介绍1.1建造者模式由来1.2建造者模式定义1.3建造者模式场景1.4建造者模式思考02.建造者模式实现2.1罗列一个场景2.2创造对象弊端场景2.3案例演变分析2.4用例子理解建造者03.建造者模式分析3.1建造者模式结构图3.2建造者模式时序图3.3基本代码实现04.建造者案例实践4.1盖房子案例开发4.2普通盖房子开发4.3构造者优化盖房子05
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
每日实战：python爬虫之网页跳转-以某博为例代码CC python爬虫 python 爬虫 pandas 开发语言
一、项目背景与核心需求通过逆向分析微博热榜接口，实现实时热搜数据抓取，重点解决：话题跳转链接参数缺失问题页面数据清洗规范化处理多维度数据采集存储二、网页跳转爬虫实现原理2.1跳转链接生成逻辑原始热搜词→"雷军刚知道柯洁定了SU7Ultra"处理流程：1.添加话题标识→#雷军刚知道柯洁定了SU7Ultra#2.URL编码→%23雷军刚知道柯洁定了SU7Ultra%233.添加搜索参数→&t=31生成
Java 大视界 -- Java 大数据在智能体育赛事直播数据分析与观众互动优化中的应用（142）青云交大数据新视界 Java 大视界 java 大数据体育赛事直播数据分析观众互动数据采集个性化推荐
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
数据分析 SQL 面试全攻略，看这篇就够了！程功学数据分析 sql 面试
数据分析SQL面试八股文（含答案）已经打包好，看文末领取在数据分析领域，SQL技能堪称基石，也是众多企业在招聘数据分析岗位时重点考察的内容。今天，就为大家深度剖析数据分析SQL面试的要点，助力大家顺利通关。一、常见面试题型大揭秘（一）简单查询这类题目通常要求考生从单表中检索数据。例如，给定一个“员工信息表”，包含员工编号、姓名、年龄、部门等字段，题目可能是“查询年龄大于30岁的员工姓名和部门”。解
2025年PHP框架推荐及对比行思理 LNMP 运维 php 开发语言
以下是针对2025年PHP框架的推荐及全方位对比分析，结合性能、功能生态、适用场景等核心维度，帮助开发者做出合理选择：一、主流PHP框架推荐1.Laravel核心特性：以优雅的语法和强大的功能著称，支持EloquentORM、Blade模板引擎、队列系统等，适合复杂业务开发。社区生态丰富，提供大量扩展包（如Passport、Horizon）。性能：RPS约200-500，适合中大型项目，但对高并发
微信小程序：修改提示信息placeholder颜色 25号底片~ 微信小程序微信小程序小程序
方法一：使用placeholder-style直接在input或textarea组件中使用placeholder-style属性来设置placeholder的样式。或者：方法二：使用placeholder-class你也可以通过placeholder-class属性来指定一个类名，然后在对应的.wxss文件中定义这个类的样式。wxss.custom-placeholder{color:#999;f
Apache storm 赵世炎 storm hadoop
Apachestorm是一个分布式的实时大数据处理系统。用于在容错和水平可拓展方法中处理大量数据。它是一个流数据框架，具有很高的摄取率，无状态。通过zk管理分布式环境和集群状态，并行地对实时数据执行各种操作。storm易于设置和操作，并且它保证每个消息将通过拓扑至少处理一次。基本上Hadoop和Storm框架用于分析大数据。两者互补，在某些方面有所不同。ApacheStorm执行除持久性之外的所有
基于PyTorch和ResNet18的花卉识别实战（附完整代码）意.远 pytorch 人工智能 python 深度学习
一、项目背景与效果花卉分类是计算机视觉的经典任务。本文使用PyTorch框架，基于ResNet18模型实现了102种花卉的分类任务。完整代码可直接复制运行，最终验证集准确率达8.2%，文中同步分析性能瓶颈与优化方案。二、环境配置与数据准备1.环境要求#主要依赖库importtorchfromtorchimportnn,optimfromtorchvisionimporttransforms,dat
探索电商大数据的艺术：TBBKAnalysis深度解读与应用推荐洪显彦Lawyer
探索电商大数据的艺术：TBBKAnalysis深度解读与应用推荐TBBKAnalysis关于淘宝“爆款”数据爬取与分析。具体分析见—项目地址:https://gitcode.com/gh_mirrors/tb/TBBKAnalysis在数字化时代的数据洪流中，每一个细微的数据点都蕴含着洞察未来的机遇。今天，我们要探讨的是一个独特且极具启发性的开源项目——TBBKAnalysis。该项目源自知乎上一
使用 DingoDB 创建自查询检索器的实战演示 fgayif python
DingoDB深入解析与实战演示DingoDB是一种分布式多模向量数据库，它结合了数据湖和向量数据库的特点，能够存储任何类型和大小的数据（如Key-Value、PDF、音频、视频等）。它具有实时低延迟处理能力，可以快速获取洞察并响应，还能高效进行即时分析和处理多模数据。在本教程中，我们将演示如何使用DingoDB向量存储来创建一个自查询检索器。技术背景介绍DingoDB的设计结合了数据湖的灵活性和
2023计算机组成原理考研知识点：哈佛结构计算机考研考研资料计算机网络哈佛结构数据结构
2023年计算机考研初试科目一般分四门，基本都考政治、英语一、数学一和计算机基础(计算机综合)，报考院校不同专业课考试内容一般不同，建议考生下正式备考2023年研考时先确认报考院校计算机研招科目内容，避免无效备考。计算机组成原理：哈佛结构将指令和数据放在两个独立的存储器，允许在一个机器周期内同时获得指令和操作数，提高了执行速度。2023年计算机组成原理复习题示例(来源于网络，如有侵权，请联系删除)
Apache Storm：实时数据处理的闪电战 Aaron_945 Java apache storm 大数据
文章目录ApacheStorm原理拓扑结构数据流处理容错机制官网链接基础使用安装与配置编写拓扑提交与运行高级使用状态管理窗口操作多语言支持优点高吞吐量低延迟可扩展性容错性总结ApacheStorm是一个开源的分布式实时计算系统，它允许你以极高的吞吐量处理无界数据流。Storm被广泛用于实时分析、在线机器学习、连续计算等多种场景。本文将深入探讨ApacheStorm的原理、基础使用、高级特性及其优点
计算机毕业设计之基于Hadoop的热点新闻分析系统的设计与实现微信bishe69 课程设计 python django mysql
近些年来，随着科技的飞速发展，互联网的普及逐渐延伸到各行各业中，给人们生活带来了十分的便利，热点新闻分析系统利用计算机网络实现信息化管理，使整个热点新闻分析的发展和服务水平有显著提升。本文拟采用PyCharm开发工具，django框架、Python语言、Hadoop大数据处理技术进行开发，后台使用MySQL数据库进行信息管理，设计开发的热点新闻分析系统。通过调研和分析，系统拥有管理员和用户两个模块
Python常用的库讲解（易懂版）不辉放弃 python 开发语言
NumPy：用于科学计算的基础库，提供多维数组对象、各种派生对象和对数组执行操作的工具。importnumpyasnp#创建一个numpy数组arr=np.array([1,2,3,4,5])print(arr)Pandas：数据处理库，提供数据结构和数据分析工具，特别适合处理结构化数据。importpandasaspd#创建一个Pandas数据帧df=pd.DataFrame({'A':[1,2
Spring常见面试题风清扬，夏邑 Spring spring java 后端
1.Spring框架中的单例bean是线程安全的吗?不是线程安全的，当多用户同时请求一个服务时，容器会给每一个请求分配一个线程，这时多个线程会并发执行该请求对应的业务逻辑(成员方法)，如果该处理逻辑中有对该单列状态的修改(体现为该单例的成员属性)，则必须考虑线程同步问题。Spring框架并没有对单例bean进行任何多线程的封装处理。关于单例bean的线程安全和并发问题需要开发者自行去搞定。比如:我
pycharm删除invalid interpreter（无效解释器） JulyJust pycharm ide python
打开C:\Users\Just\AppData\Roaming\JetBrains\PyCharm2022.1\options\jdk.table.xml文件，删除对应配置，重启pycharm即可
Spring Boot 整合 Elasticsearch 实践：从入门到上手遇见伯灵说 mysql Spring elasticsearch jenkins springboot
引言Elasticsearch是一个开源的分布式搜索引擎，广泛用于日志分析、搜索引擎、数据分析等场景。本文将带你通过一步步的教程，在SpringBoot项目中整合Elasticsearch，轻松实现数据存储与查询。1.创建SpringBoot项目首先，你需要创建一个SpringBoot项目。如果你还没有创建，可以使用SpringInitializr快速生成一个项目。在生成项目时，确保选择了以下依赖
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。