thermodynamicB

聚类分析与判别分析十题_数学建模系列

聚类分析与判别分析习题_数学建模系列

1.

【问题描述】：

5位代理商对某种产品的四种指标评分如下：

	x1	x2	x3	x4
1	2	4	6	32
2	5	2	5	38
3	3	3	7	30
4	1	2	3	16
5	4	3	2	30

其中， x1 ， x2 ， x3 为态度测度，共有17个分值， x4 为兴趣测度，取值为1140.求出其绝对值距离矩阵，平方和距离矩阵。

【解析】：
编写如下的Matlab程序：（为latex版本，后文省略排版代码）

\begin{verbatim}
X = [2 4 6 32;
     5 2 5 38;
     3 3 7 30;
     1 2 3 16;
     4 3 2 30];
D1 = pdist(X, 'cityblock')
D2 = pdist(X, 'euclidean')
\end{verbatim}

于是得到如下的计算结果：

（1）绝对值距离矩阵：

$D 1 = ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ 012522912013281351302162228210199136190 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟$

（2）平方和距离矩阵：

$D 2 = ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ 0 7.0711 2.6458 16.4317 5.0000 7.0711 0 8.5440 22.4499 8.6603 2.6458 8.5440 0 14.7309 5.0990 16.4317 22.4499 14.7309 0 14.3875 5.0000 8.6603 5.0990 14.3875 0 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟$

2.

【问题描述】：

检测某类产品的重量，抽了六个样品，每个样品只测了一个指标，分别为1，2，3，6，9，11.试用最短距离法，重心法进行聚类分析。

【解析】：
（1）按照最短距离法进行聚类分析。编写如下的R语言程序：

X <- data.frame(
  x1 = c(1, 2, 3, 6, 9, 11),
  row.names = c("1", "2", "3", "4", "5", "6")
)
d <- dist(scale(X), method = 'euclidean')
heatmap(as.matrix(d),labRow = rownames(d), labCol = colnames(d))

kinds <- 3
model1 <- hclust(d, method = 'single')
result <- cutree(model1, k = kinds)
plot(model1, -1)
rect.hclust(model1, k = kinds, border = "red")

↑首先得到的是样本之间的相关关系，颜色越深表示这两个样本之间的关系越近，亦可能属于同一类。

(下面为latex绘图代码片，后文略)

\begin{figure}[h]
\centering
\includegraphics[width=*0.75*\textwidth]{*5.png*}
\end{figure}

↑考虑将其划分为两类，得到谱系聚类图。

所以将样本划分为： {1,2,3,4} 、 {5,6} 。

（2）按照重心法进行聚类分析。编写如下的R语言程序：

kinds <- 2
model1 <- hclust(d, method = 'centroid')
result <- cutree(model1, k = kinds)
plot(model1, -1)
rect.hclust(model1, k = kinds, border = "red")

↑得到谱系聚类图。

所以将样本划分为： {1,2,3} 、 {4,5,6} 。

3.

【问题描述】：

某店五个售货员的销售量 x1 与教育水平 x2 之间的评分表如下，试用最短距离法做聚类分析

	x1	x2
1	1	1
2	1	2
3	6	3
4	8	2
5	8	0

【解析】：
编写如下的R语言程序：

X <- data.frame(
  x1 = c(1, 1, 6, 8, 8),
  x2 = c(1, 2, 3, 2, 0),
  row.names = c("1", "2", "3", "4", "5")
)
d <- dist(scale(X), method = 'euclidean')
heatmap(as.matrix(d),labRow = rownames(d), labCol = colnames(d))

kinds <- 3
model1 <- hclust(d, method = 'single')
result <- cutree(model1, k = kinds)
plclust(model1, -1)
rect.hclust(model1, k = kinds, border = "red")

mds <- cmdscale(d, k = 2, eig = T)
x <- mds$points[,1]
y <- mds$points[,2]
library(ggplot2)
p <- ggplot(data.frame(x,y),aes(x,y))
p + geom_point(size = kinds, alpha = 0.8, aes(colour = factor(result),shape = factor(result)))

↑首先得到的是样本之间的相关关系，颜色越深表示这两个样本之间的关系越近，亦可能属于同一类。

↑考虑将样本划分为3类，于是得到谱系聚类图。

↑为了更直观的表示出3类之间的关系，利用经典MDS对样本数据进行变换，在二维平面上绘制出散点图。

可见，按照3类进行划分是合理的。所以将样本划分为： {1,2} 、 {3,4} 、 {5} 。

4.

【问题描述】：

下面给出七个样品两两之间的欧氏距离矩阵

$D = ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ 12345671047121819212038141517305111214406179501360270 ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟$

试分别用最小距离法、最大距离法、重心举例法进行聚类，并画出系谱图。

【解析】：
编写如下的Matlab程序：

d = [4, 7, 12, 18, 19, 21, 3, 8, 14, 15, 17, 5, 11, 12, 14, 6, 7, 9, 1, 3, 2];
z1 = linkage(d);
z2 = linkage(d, 'complete');
z3 = linkage(d, 'average');
k = 3;
figure(1);
H1 = dendrogram(z1);
T1 = cluster(z1, k)
figure(2);
H2 = dendrogram(z2);
T2 = cluster(z2, k)
figure(3);
H3 = dendrogram(z3);
T3 = cluster(z3, k)

（1）最小距离法得到的聚类结果为： {1,2,3} 、 {4} 、 {5,6,7} 。绘制的谱系聚类图，如下：

（2）最大距离法得到的聚类结果为： {1,2,3} 、 {4} 、 {5,6,7} 。绘制的谱系聚类图，如下：

（3）重心距离法得到的聚类结果为： {1,2,3} 、 {4} 、 {5,6,7} 。绘制的谱系聚类图，如下：

5.

【问题描述】：

华北五站（北京、天津、营口、太远、石家庄）1968年（及1969年）7、8月份降水量（ Y ）作预报。

（1）根据专业的统计分析 Y 主要取决于下列因子：: X_1：上海4月份平均气温，; X_2：北京三月份降水总量，; X_3：5月份地磁 Ci 指数，; X_4：4月份500 mbW 环流型日数

（2）1961-1967年的历史数据如下：

时间	Y/mm	x1	x2	x3	x4
1961	410	14.8	20.1	0.69	13
1962	255	12.5	2.3	0.36	4
1963	527	14.5	12.4	0.69	12
1964	510	16.4	10.6	0.58	26
1965	226	12.2	0.3	0.35	4
1966	456	13.8	12.3	0.42	23
1967	389	13.6	7.7	0.82	25
1968		13.7	0.6	0.68	12.5
1969		14.2	16.5	0.65	15

【解析】：

首先，编写如下的R语言程序，检测二变量间关系。

X1 <- c(14.8, 12.5, 14.5, 16.4, 12.2, 13.8, 13.6)
X2 <- c(20.1, 2.3, 12.4, 10.6, 0.3, 12.3, 7.7)
X3 <- c(0.69, 0.36, 0.69, 0.58, 0.35, 0.42, 0.82)
X4 <- c(13, 4, 12, 26, 4, 23, 25)
Y <- c(410, 255, 527, 510, 226, 456, 389)

testData <- data.frame(X1, X2, X3, X4, Y)
cor(testData)

library(car)
scatterplotMatrix(testData, spread = FALSE, lty.smooth = 2, main = "Scatter Plot Matrix")

得到相关系数矩阵如下：

	X1	X2	X3	X4	Y
X1	1.0000000	0.6950138	0.5142621	0.6627185	0.8497245
X2	0.6950138	1.0000000	0.5762508	0.4386373	0.7227803
X3	0.5142621	0.5762508	1.0000000	0.5283724	0.5735971
X4	0.6627185	0.4386373	0.5283724	1.0000000	0.6979025

得到的散点图矩阵如下所示：

接着，利用R语言程序进行多元线性拟合。

fit <- lm(Y ~ X1 + X2 + X3 + X4, data = testData)
summary(fit)
vif(fit)

得到回归分析表：

lm(formula = Y ~ X1 + X2 + X3 + X4, data = testData)

Residuals:
     1      2      3      4      5      6      7
-63.59 -11.54 101.28 -22.20 -19.41  37.15 -21.69

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept) -278.856    541.448  -0.515    0.658
X1            40.935     44.060   0.929    0.451
X2             4.251      8.506   0.500    0.667
X3            34.616    269.756   0.128    0.910
X4             2.869      5.642   0.508    0.662

Residual standard error: 92.62 on 2 degrees of freedom
Multiple R-squared:  0.7928,    Adjusted R-squared:  0.3783
F-statistic: 1.913 on 4 and 2 DF,  p-value: 0.3715

以及方差膨胀因c：

      X1       X2       X3       X4
2.791265 2.272406 1.743121 2.001629

说明该模型存在多重共线性。

于是，将 X3 剔除，再进行多元拟合：

fit <- lm(Y ~ X1 + X2 + X4, data = testData)
summary(fit)
vif(fit)

得到回归分析表：

lm(formula = Y ~ X1 + X2 + X4, data = testData)

Residuals:
     1      2      3      4      5      6      7
-62.90 -12.92 105.41 -24.26 -20.33  29.29 -14.28

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept) -265.627    435.785  -0.610    0.585
X1            40.830     36.116   1.131    0.340
X2             4.669      6.439   0.725    0.521
X4             3.106      4.369   0.711    0.528

Residual standard error: 75.93 on 3 degrees of freedom
Multiple R-squared:  0.791, Adjusted R-squared:  0.5821
F-statistic: 3.786 on 3 and 3 DF,  p-value: 0.1516

以及方差膨胀因子：

      X1       X2       X4
2.790316 1.937625 1.786125

说明该模型存在多重共线性。

于是，将 X4 剔除，再进行多元拟合：

fit <- lm(Y ~ X1 + X2, data = testData)
summary(fit)
vif(fit)

得到回归分析表：

lm(formula = Y ~ X1 + X2, data = testData)

Residuals:
     1      2      3      4      5      6      7
-79.79 -28.38  88.25 -25.28 -31.89  56.23  20.86

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept) -415.076    357.354  -1.162    0.310
X1            55.051     28.151   1.956    0.122
X2             4.483      6.023   0.744    0.498

Residual standard error: 71.08 on 4 degrees of freedom
Multiple R-squared:  0.7558,    Adjusted R-squared:  0.6338
F-statistic: 6.191 on 2 and 4 DF,  p-value: 0.05961

以及方差膨胀因子：

      X1       X2
1.934401 1.934401

说明该模型不存在多重共线性。

若将 X2 剔除，再进行多元拟合：

fit <- lm(Y ~ X1, data = testData)
summary(fit)

得到回归分析表：

Call:
lm(formula = Y ~ X1, data = testData)

Residuals:
     1      2      3      4      5      6      7
-43.82 -38.71  94.06 -55.20 -46.83  71.79  18.71

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept)  -576.45     271.09  -2.126   0.0868 .
X1             69.61      19.32   3.604   0.0155 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 67.84 on 5 degrees of freedom
Multiple R-squared:  0.722, Adjusted R-squared:  0.6664
F-statistic: 12.99 on 1 and 5 DF,  p-value: 0.01548

此时，可以建立回归模型： Y=0.0868+0.0155X1 。散点图和拟合直线如下所示：

于是，在置信水平为 95% 下，1968年华北五站7、8月份降水量预测值为377.2479，置信区间为 [309.9719,444.5238] ；1969年华北五站7、8月份降水量预测值为412.0544，置信区间为 [345.1723，478.9366] 。

6.

下表是15个上市公司2001年的一些主要财务指标，使用系统聚类法和K-均值法分别对这些公司进行聚类，并对结果进行比较分析。其中， x1 ：公司编号， x2 ：净资产收益率， x3 ：每股净利润， x4 ：总资产周转率， x5 ：资产负债率， x6 ：流动负债比率， x7 ：每股净资产， x8 ：净利润增长率， x9 ：总资产增长率

x1	x2	x3	x4	x5	x6	x7	x8	x9
1	11.09	0.21	0.05	96.98	70.53	1.86	-44.04	81.99
2	11.96	0.59	0.74	51.78	90.73	4.95	7.02	16.11
3	0	0.03	0.03	181.99	100	-2.98	103.33	21.18
4	11.58	0.13	0.17	46.07	92.18	1.14	6.55	-56.32
5	-6.19	-0.09	0.03	43.3	82.24	1.52	-1713.5	-3.36
6	10	0.47	0.48	68.4	86	4.7	-11.56	0.85
7	10.49	0.11	0.35	82.98	99.87	1.02	100.23	30.32
8	11.12	-1.69	0.12	132.14	100	-0.66	-4454.39	-62.75
9	3.41	0.04	0.2	67.86	98.51	1.25	-11.25	-11.43
10	1.16	0.01	0.54	43.7	100	1.03	-87.18	-7.41
11	30.22	0.16	0.4	87.36	94.88	0.53	729.41	-9.97
12	8.19	0.22	0.38	30.31	100	2.73	-12.31	-2.77
13	95.79	-5.2	0.5	252.34	99.34	-5.42	-9816.52	-46.82
14	16.55	0.35	0.93	72.31	84.05	2.14	115.95	123.41
15	-24.18	-1.16	0.79	56.26	97.8	4.81	-533.89	-27.74

【解析】：

（1）层次聚类法：编写如下的R语言程序：

X <- data.frame(
  x2 = c(11.09, 11.96, 0, 11.58, -6.19, 10, 10.49, 11.12, 3.41, 1.16, 30.22, 8.19, 95.79, 16.55, -24.18),
  x3 = c(0.21, 0.59, 0.03, 0.13, -0.09, 0.47, 0.11, -1.69, 0.04, 0.01,0.16, 0.22, -5.2, 0.35, -1.16),
  x4 = c(0.05, 0.74, 0.03, 0.17, 0.03, 0.48, 0.35, 0.12, 0.2, 0.54, 0.4,0.38, 0.5, 0.93, 0.79),
  x5 = c(96.98, 51.78, 181.99, 46.07, 43.3, 68.4, 82.98, 132.14, 67.86,43.7, 87.36, 30.31, 252.34, 72.31, 56.26),
  x6 = c(70.53, 90.73, 100, 92.18, 82.24, 86, 99.87, 100, 98.51, 100,94.88, 100, 99.34, 84.05, 97.8),
  x7 = c(1.86, 4.95, -2.98, 1.14, 1.52, 4.7, 1.02, -0.66, 1.25, 1.03,0.53, 2.73, -5.42, 2.14, 4.81),
  x8 = c(-44.04, 7.02, 103.33, 6.55, -1713.5, -11.56, 100.23, -4454.39,-11.25, -87.18, 729.41, -12.31, -9816.52, 115.95, -533.89),
  x9 = c(81.99, 16.11, 21.18, -56.32, -3.36, 0.85, 30.32, -62.75,-11.43, -7.41, -9.97, -2.77, -46.82, 123.41, -27.74),
  row.names = c("1", "2", "3", "4", "5", "6", "7", "8", "9", "10","11", "12", "13", "14", "15")
)
d <- dist(scale(X), method = 'euclidean')
heatmap(as.matrix(d),labRow = rownames(d), labCol = colnames(d))

kinds <- 3
model1 <- hclust(d, method = 'average')
result <- cutree(model1, k = kinds)
plclust(model1, -1)
rect.hclust(model1, k = kinds, border = "red")

mds <- cmdscale(d, k = 2, eig = T)
x <- mds$points[,1]
y <- mds$points[,2]
library(ggplot2)
p <- ggplot(data.frame(x,y),aes(x,y))
p + geom_point(size = kinds, alpha = 0.8, aes(colour = factor(result),shape = factor(result)))

↑首先得到的是热力图，

考虑将样本划分为3类，

↑得到谱系聚类图。

接着，为了使得可视化效果更好，使用经典MDS对数据进行变换，画出散点图↓

所以，将1和14划为一组，13自成一组，其余的划为一组。

（2）K-means算法：依然把样本分为3类，编写如下R语言程序：

model <- kmeans(scale(X), centers = 3, nstart = 10)
model$cluster

得到聚类分析结果：

1	2	3	4	5	6	7	8	9	10	11	12	13	14	15
2	2	1	1	1	2	1	1	1	1	1	1	3	2	1

所以，将1、2、6、14划为一组，13自成一组，其余的划为一组。

（3）系统聚类：(↓R)

library(fpc)
model <- dbscan(X, eps = 2.5, MinPts = 5, scale = T, showplot = 1, method = "hybrid")
model$cluster

得到分析结果：

0 1 0 1 1 1 1 0 1 1 1 1 0 0 0

这里结果表明将其划分为2类。

7.

【问题描述】：

下表是某年我国16个地区农民支出情况的抽样调查数据，每个地区调查了反映每人平均生活消费支出情况的六个经济指标。是通过统计分析软件用不同的方法进行聚类分析，并比较何种方法与人们观察到的实际情况较接近。

地区	食品	衣着	燃料	住房	交通和通讯	娱乐教育文化
北京	190.33	43.77	9.73	60.54	49.01	9.04
天津	135.2	36.4	10.47	44.16	36.49	3.94
河北	95.21	22.83	9.3	22.44	22.81	2.8
山西	104.78	25.11	6.4	9.89	18.17	3.25
内蒙	128.41	27.63	8.94	12.58	23.99	2.27
辽宁	145.68	32.83	17.79	27.29	39.09	3.47
吉林	159.37	33.38	19.27	11.81	25.29	5.22
黑龙江	116.22	29.57	13.24	11.81	25.29	5.22
上海	221.11	38.64	12.53	115.65	50.82	5.89
江苏	144.98	29.12	11.67	42.6	27.3	5.74
浙江	169.92	32.75	12.72	47.12	34.35	5
安徽	135.11	23.09	15.62	23.54	18.18	6.39
福建	144.92	21.26	16.96	19.52	21.75	6.73
山西	140.54	21.5	17.64	19.19	15.97	4.94
山东	115.84	30.26	12.2	33.6	33.77	3.85
河南	101.18	23.26	8.46	20.2	20.5	4.3

【解析】：
（1）层次聚类法：编写如下的R语言程序，数据从csv文件中读取。

consumptionData <- read.csv("*C:\\Users\\lenovo\\Desktop\\Book1.csv*", header = TRUE, sep = ",")
X <- consumptionData[,-1]

d <- dist(scale(X), method = 'euclidean')
heatmap(as.matrix(d),labRow = consumptionData$city, labCol = consumptionData$city)

kinds <- 5
model1 <- hclust(d, method = 'average')
result <- cutree(model1, k = kinds)
plclust(model1, -1, labels = consumptionData$city)
rect.hclust(model1, k = kinds, border = "red")

mds <- cmdscale(d, k = 2, eig = T)
x <- mds$points[,1]
y <- mds$points[,2]
library(ggplot2)
p <- ggplot(data.frame(x,y),aes(x,y))
p + geom_point(size = kinds, alpha = 0.8, aes(colour = factor(result), shape = factor(result)))

↑首先得到的是热力图。

考虑将样本划分为5类，

↑得到谱系聚类图。

接着，为了使得可视化效果更好，使用经典MDS对数据进行变换，画出散点图↓

可见，北京、上海为一线城市，自成一类；江苏、浙江等为第二线省份；内蒙古等为一类省份；安徽等为一类省份。

（2）K-means算法：编写如下的R语言程序

model <- kmeans(scale(X), centers = 5, nstart = 10)
table(consumptionData$city, model$cluster)

得到如下的类别划分结果：

	1	2	3	4	5
Anhui	1	0	0	0	0
Beijing	0	0	0	0	1
Fujian	1	0	0	0	0
Hebei	0	0	1	0	0
Heilongjiang	1	0	0	0	0
Henan	0	0	1	0	0
InnerMongolia	0	0	1	0	0
Jiangsu	0	0	0	1	0
Jiangxi	1	0	0	0	0
Jilin	1	0	0	0	0
Liaoning	0	0	0	1	0
Shandong	0	0	0	1	0
Shanghai	0	1	0	0	0
Shanxi	0	0	1	0	0
Tianjin	0	0	0	1	0
Zhejiang	0	0	0	1	0

这个结果与层次聚类法的结果十分相似。

8.

【问题描述】：

某公司为掌握其新产品的动向，向12个代理商做调查，要他们对产品基于评估（对产品式样、包装及耐久性，用10分制打分，高分表示性能良好，低分制则较差）并说明是否购买，调查结果如下，是做fisher判别

		式样	包装	耐久性
购买组样品	1	9	8	7
	2	7	6	6
	3	10	7	8
	4	8	4	5
	5	9	9	7
	6	8	6	7
	7	7	5	6
非购买组样品	1	4	4	4
	2	3	6	6
	3	6	3	3
	4	2	4	5
	5	1	2	2

【解析】：

利用Matlab实现Fisher线性分类器，程序如下：

function [w, y1, y2, Jw] = FisherLinearDiscriminate(data, label)

% FLD Fisher Linear Discriminant.
% data: D*N data
% label: {+1,-1}
% Reference: M.Bishop Pattern Recognition and Machine Learning p186-p189
% Copyright: LiFeitengup@CSDN

% compute means and scatter matrix
%-------------------------------
inx1 = find(label == 1);
inx2 = find(label == -1);
n1 = length(inx1);
n2 = length(inx2);

m1 = mean(data(:,inx1),2);
m2 = mean(data(:,inx2),2);

S1 = (data(:,inx1)-m1*ones(1,n1))*(data(:,inx1)-m1*ones(1,n1))';
S2 = (data(:,inx2)-m2*ones(1,n2))*(data(:,inx2)-m2*ones(1,n2))';
Sw = S1 + S2;

% compute FLD
%-------------------------------
W = inv(Sw)*(m1-m2);

y1 = W'*m1;  %label=+1
y2 = W'*m2;  %label=-1
w = W;
Jw = (y1-y2)^2/(W'*Sw*W);

end

data = [9 7 10 8 9 8 7 4 3 6 2 1;
        8 6 7 4 9 6 5 4 6 3 4 2;
        7 6 8 5 7 7 6 4 6 3 5 2];
label = [1, 1, 1, 1, 1, 1, 1, -1, -1, -1, -1, -1];
[w, y1, y2, Jw] = FisherLinearDiscriminate(data, label);
w0 = (y1 + y2) / 2;
figure(1);
scatter3(data(1,1:7), data(2,1:7), data(3,1:7));
hold on;
scatter3(data(1,8:12), data(2,8:12), data(3,8:12));
hold on;
[x, y] = meshgrid(0:0.01:10);
z = (w0 - w(1) * x - w(2) * y) / w(3);
mesh(x, y, z);

于是可以设计出Fisher分类器：

{w T x > w 0 \Rightarrow x \in ω 1 w T x < w 0 \Rightarrow x \in ω 2

其中，

w=(0.2197,−0.0792,0.1778)T ，

w0=1.7964 。

将样本点绘制在三维空间中，可以得到

↑可见，Fisher判别平面将两类训练集一分为二，没有出现误划。

9.

【问题描述】：

人文发展指数是联合国开发计划署于1990年5月发表的第一份《人类发展报告》中公布的，该报告建议，目前对人文发展的衡量应当以人生的三大要素为重点，衡量人生三大要素的指示指标分别要用出生时的预期寿命、成人识字率和实际人均GDP，将以上三个指示指标的数值合成为一个复合指数，即为人文发展指数，资料来源：UNDP《人类发展报告》1995年，今从1995年世界各国人文发展指数的排序中，选取高发展水平、中等发展水平的国家各五个作为两组样品，另选四个国家作为待判样品作距离判别分析。

类别	序号	国家名称	出生时预期寿命	成人识字率	人均GDP
第一类（高发展水平国家）	1	美国	76	90	5374
	2	日本	79.5	99	5359
	3	瑞士	78	99	5372
	4	阿根廷	72.1	95.9	5242
	5	阿联酋	73.8	77.7	5370
第二类（中等发展水平国家）	6	保加利亚	71.2	93	4250
	7	古巴	75.3	94.9	3412
	8	巴拉圭	70	91.2	3390
	9	格鲁尼亚	72.8	99	2300
	10	南非	62.9	80.6	3799
待判样品	11	保加利亚	71.2	93	4250
	12	罗马尼亚	69.9	96.9	2840
	13	希腊	77.6	93.8	5233
	14	哥伦比亚	69.3	90.3	5158

【解析】：

编写如下的Matlab程序：

training = [76 99 5374;
            79.5 99 5359;
            78 99 5372;
            72.1 95.9 5242;
            73.8 77.7 5370;
            71.2 93 4250;
            75.3 94.9 3412;
            70 91.2 3390;
            72.8 99 2300;
            62.9 80.6 3799];
group = ['level1'; 'level1'; 'level1'; 'level1'; 'level1'; 'level2'; 'level2'; 'level2'; 'level2'; 'level2'];
sample = [68.5 79.3 1950;
          69.9 96.9 2840;
          77.6 93.8 5233;
          69.3 90.3 5158];
[class, err] = classify(sample, training, group, 'linear');
class
err

figure(1);
scatter3(training(1:5, 1), training(1:5, 2), training(1:5, 3), 'bl');
hold on;
scatter3(training(6:10, 1), training(6:10, 2), training(6:10, 3), 'r');
hold on;
scatter3(sample(1:2, 1), sample(1:2, 2), sample(1:2, 3), 'g');
hold on;
scatter3(sample(3:4, 1), sample(3:4, 2), sample(3:4, 3), 'y');
hold on;

↓判别的结果为中国和罗马尼亚属于第二类（中等发展水平国家），希腊和哥伦比亚属于第一类（高发展水平国家）。绘制出的散点图如下所示，其中绿色为中国和罗马尼亚，黄色为希腊和哥伦比亚。

10.

【问题描述】：

为了更深入地了解我国人口的文化程度状况，现利用1990年全国人口普查数据对全国30个省、直辖市、自治区进行聚类分析，原始数据如下表。分析选用了三个指标：大学以上文化程度的人口比例（DXBZ）、初中文化程度的人口比例（CZBZ）、文盲半文盲人口比例（WMBZ）来反映较高、中等、较低的文化程度人口的状况。
（1）计算样本的Euclid距离，分别用最长距离法、均值法、重心法和Ward法作聚类分析，并画出相应的谱系图。如果将所有样本分为四类，试写出各种方法的分类结果。
（2）用动态规划方法分四类，写出相应的分类结果。

地区	DXBZ	CZBZ	WMBZ	地区	DXBZ	CZBZ	WMBZ
北京	9.30	30.55	8.70	河南	0.85	26.55	16.15
天津	4.67	29.38	8.92	湖北	1.57	23.16	15.79
河北	0.96	24.69	15.21	湖南	1.14	22.57	12.10
山西	1.38	29.24	11.30	广东	1.34	23.04	10.45
内蒙古	1.48	25.47	15.39	广西	0.79	19.14	10.61
辽宁	2.60	32.32	8.81	海南	1.24	22.53	13.97
吉林	2.15	26.31	10.49	四川	0.96	21.65	16.24
黑龙江	2.14	28.46	10.87	四川	0.96	21.65	16.24
上海	6.53	31.59	11.04	云南	0.81	13.85	25.44
江苏	1.47	26.43	17.23	西藏	0.57	3.85	44.43
浙江	1.17	23.74	17.46	陕西	1.67	24.36	17.62
安徽	0.88	19.97	24.43	甘肃	1.10	16.85	27.93
福建	1.23	16.87	15.63	青海	1.49	17.76	27.70
江西	0.99	18.84	16.22	宁夏	1.61	20.27	22.06
山东	0.98	25.18	16.87	新疆	1.85	20.66	12.75

【解析】：
（1）编写如下的R语言程序，计算样本的Euclidean距离。

eduLevel <- read.csv("C:\\Users\\lenovo\\Desktop\\Book1.csv",header = TRUE, sep = ",")
X <- eduLevel[,-1]
d <- dist(scale(X), method = 'euclidean')

计算得到的结果如下所示：

           1         2         3         4         5         6
2  2.5079170
3  4.6857035 2.3019024
4  4.2959228 1.8039758 0.9399503
5  4.3944976 2.0267019 0.3100576 0.8254167
6  3.6299646 1.2195791 1.7576168 0.8952417 1.5493019
7  3.9315549 1.4674278 0.9317467 0.6482392 0.7504160 1.0491364
8  3.8923692 1.3982869 1.0586160 0.4339814 0.8509429 0.7377850
9  1.5366735 1.1047217 3.2642179 2.8084129 2.9651112 2.1456970
10 4.4267279 2.1006361 0.4787978 0.9077872 0.2891008 1.5953600
11 4.6764200 2.3876265 0.3531529 1.2235189 0.4289354 1.9765734
12 5.2920620 3.2801539 1.4408375 2.3237337 1.5302906 3.0415855
13 4.9962087 2.9202433 1.3060070 2.1298048 1.4327314 2.8124863
14 4.9879677 2.8142055 0.9791512 1.8532057 1.1359749 2.5876656
15 4.7038653 2.3542003 0.2325878 1.0165142 0.3359695 1.8121611
16 4.7133609 2.3182390 0.3374037 0.8278320 0.3971652 1.6537074
17 4.4486265 2.1627689 0.4226744 1.1719777 0.3896500 1.8584956
18 4.6223959 2.2544768 0.5471008 1.1184841 0.6715998 1.8497048
19 4.4810853 2.0926126 0.7117096 1.0343031 0.7665879 1.6961709
20 4.9759926 2.7059410 1.1041512 1.7071680 1.2780311 2.4056610
21 4.6032501 2.2714186 0.4214002 1.1688495 0.5376976 1.9058726
22 4.8413151 2.5647399 0.5218575 1.4335069 0.7017735 2.2053846
23 5.6821710 3.7986133 2.0475042 2.9749037 2.1719924 3.6959492
24 5.7883753 3.9583294 2.2442609 3.1693233 2.3621934 3.8818716
25 7.9859267 6.6710568 5.1638710 6.0652753 5.2529014 6.7307005
26 4.4043230 2.1491260 0.4998567 1.1687817 0.3604245 1.8245068
27 5.5790971 3.7744757 2.1160352 2.9997768 2.1883371 3.6771920
28 5.3377510 3.5672580 2.0210296 2.8725387 2.0590996 3.5104481
29 4.8186167 2.8250665 1.2112484 2.0538539 1.2301677 2.7012342
30 4.3767932 2.1591311 0.8840645 1.4576084 0.8921172 2.0418100
           7         8         9        10        11        12
2
3
4
5
6
7
8  0.3600082
9  2.5231009 2.4268835
10 0.9572380 0.9693732 2.9760847
11 1.1388353 1.2781240 3.2834039 0.4755084
12 2.2173503 2.3677507 4.0129802 1.4629511 1.1182973
13 1.7751660 2.0795075 3.8093320 1.6042588 1.1645993 1.2772731
14 1.5783324 1.8499334 3.7257041 1.2917584 0.8342850 1.0943322
15 1.0649649 1.1433110 3.2705295 0.3394169 0.2711551 1.3160227
16 1.0223564 1.0319408 3.2489007 0.3640672 0.5258015 1.5393033
17 0.9240584 1.1328132 3.0847800 0.5766857 0.3222702 1.3046557
18 0.8524209 1.1275936 3.2753820 0.9454631 0.7292930 1.6791419
19 0.6966700 0.9986770 3.1417674 1.0541664 0.9310212 1.9186413
20 1.3975247 1.7090549 3.7246088 1.5328149 1.1961048 1.8180130
21 0.9179096 1.1697352 3.2503633 0.7850780 0.5011037 1.4488522
22 1.2563742 1.4754466 3.4969424 0.8490626 0.3981838 1.1102947
23 2.7477729 2.9783102 4.5321877 2.1923434 1.7645284 0.8840365
24 2.9385431 3.1677404 4.6646561 2.3742691 1.9549944 1.0240915
25 5.8654520 6.0610060 7.1193300 5.1937573 4.8465005 3.7483477
26 1.0226485 1.1445478 3.0115315 0.3634436 0.2896743 1.2285151
27 2.8304711 3.0042608 4.4132326 2.1287997 1.7864622 0.7016984
28 2.6887646 2.8532727 4.1759308 1.9878753 1.6780856 0.6531804
29 1.8411181 2.0196721 3.5594982 1.2042119 0.8667955 0.5044283
30 0.9958719 1.3259214 3.1179869 1.1413015 0.8815281 1.6226743
          13        14        15        16        17        18
2
3
4
5
6
7
8
9
10
11
12
13
14 0.3598412
15 1.3940355 1.0547307
16 1.6195897 1.2807005 0.2558243
17 1.0592217 0.7838317 0.4834798 0.6851052
18 1.0535236 0.8251935 0.7654856 0.8614349 0.5455278
19 1.2294583 1.0455410 0.9340074 0.9835525 0.7114148 0.2540625
20 0.7946200 0.7451584 1.2989826 1.4277362 1.0407148 0.6303693
21 0.9634393 0.6925593 0.5978235 0.7552413 0.3156283 0.2511668
22 0.8098546 0.4662293 0.5912265 0.8147478 0.4179470 0.5722001
23 1.2157545 1.2687608 2.0004555 2.2424544 1.8465004 2.0758068
24 1.3988772 1.4682225 2.1910441 2.4328922 2.0378131 2.2764274
25 4.3645250 4.4623215 5.0614000 5.2859615 4.9645580 5.2632010
26 1.2911220 1.0031510 0.4086485 0.6042337 0.3163675 0.8330112
27 1.6143654 1.5716495 2.0038010 2.2340859 1.9217564 2.2822358
28 1.5957303 1.5397850 1.8990088 2.1301350 1.8006958 2.2036566
29 1.0348036 0.8687461 1.1143224 1.3613674 0.9518609 1.3840183
30 0.8060034 0.7167807 1.0364833 1.2017547 0.5946436 0.5045466
          19        20        21        22        23        24
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20 0.7119306
21 0.4723393 0.7544083
22 0.8195330 0.8524282 0.3643507
23 2.3045003 1.9397409 1.8955337 1.5701437
24 2.5034838 2.1332893 2.0946242 1.7704832 0.2034588
25 5.4909486 5.1095948 5.0672944 4.7348903 3.1949646 2.9944379
26 0.9816173 1.3490393 0.6124201 0.6177919 1.8930502 2.0746495
27 2.5147225 2.3086834 2.0599749 1.7288197 0.6271003 0.6152875
28 2.4267821 2.2840717 1.9710517 1.6601331 0.7843551 0.8018722
29 1.5968088 1.5764910 1.1426498 0.8706076 1.0739024 1.2313761
30 0.5679284 0.6855035 0.4798381 0.6836312 1.8996725 2.0878951
          25        26        27        28        29
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26 4.9271870
27 3.0674899 1.8636170
28 3.2216611 1.7187512 0.2608285
29 4.0413404 0.8943896 0.9949259 0.8510835
30 5.0500586 0.8908598 2.1272359 2.0277721 1.2293341

利用如下语句绘制热力图：（↓R）

heatmap(as.matrix(d),labRow = eduLevel$region, labCol = eduLevel$region)

下面进行各种方法的聚类分析：

①最长距离法：

kinds <- 4
model1 <- hclust(d, method = 'complete')
result <- cutree(model1, k = kinds)
plot(model1, -1, labels = eduLevel$region)
rect.hclust(model1, k = kinds, border = "red")

mds <- cmdscale(d, k = 2, eig = T)
x <- mds$points[,1]
y <- mds$points[,2]
library(ggplot2)
p <- ggplot(data.frame(x,y),aes(x,y))
p + geom_point(size = kinds, alpha = 0.8, aes(colour = factor(result), shape = factor(result)))

↓得到谱系图

利用经典MDS变换，↓散点图

②均值法：

kinds <- 4
model1 <- hclust(d, method = 'average')
result <- cutree(model1, k = kinds)
plot(model1, -1, labels = eduLevel$region)
rect.hclust(model1, k = kinds, border = "red")

mds <- cmdscale(d, k = 2, eig = T)
x <- mds$points[,1]
y <- mds$points[,2]
library(ggplot2)
p <- ggplot(data.frame(x,y),aes(x,y))
p + geom_point(size = kinds, alpha = 0.8, aes(colour = factor(result), shape = factor(result)))

↓得到谱系图

利用经典MDS变换，↓散点图

③重心法：

kinds <- 4
model1 <- hclust(d, method = 'centroid')
result <- cutree(model1, k = kinds)
plot(model1, -1, labels = eduLevel$region)
rect.hclust(model1, k = kinds, border = "red")

mds <- cmdscale(d, k = 2, eig = T)
x <- mds$points[,1]
y <- mds$points[,2]
library(ggplot2)
p <- ggplot(data.frame(x,y),aes(x,y))
p + geom_point(size = kinds, alpha = 0.8, aes(colour = factor(result), shape = factor(result)))

↓得到谱系图

利用经典MDS变换，↓散点图

④离差平方和法：

kinds <- 4
model1 <- hclust(d, method = 'ward')
result <- cutree(model1, k = kinds)
plclust(model1, -1, labels = eduLevel$region)
rect.hclust(model1, k = kinds, border = "red")

mds <- cmdscale(d, k = 2, eig = T)
x <- mds$points[,1]
y <- mds$points[,2]
library(ggplot2)
p <- ggplot(data.frame(x,y),aes(x,y))
p + geom_point(size = kinds, alpha = 0.8, aes(colour = factor(result), shape = factor(result)))

↓得到谱系图

利用经典MDS变换，↓散点图

（2）利用K-means算法，编写如下R语言程序：

model <- kmeans(scale(X), centers = 4, nstart = 10)
table(eduLevel$region, model$cluster)

得到如下的分类结果：

                  1 2 3 4
  Anhui           0 1 0 0
  Beijing         0 0 0 1
  Fujian          0 1 0 0
  Gansu           0 1 0 0
  Guangdong       1 0 0 0
  Guangxi         1 0 0 0
  Guizhou         0 1 0 0
  Hainan          1 0 0 0
  Hebei           1 0 0 0
  Heilongjiang    1 0 0 0
  Henan           1 0 0 0
  Hubei           1 0 0 0
  Hunan           1 0 0 0
  InnerMongolia   1 0 0 0
  Jiangsu         1 0 0 0
  Jiangxi         0 1 0 0
  Jilin           1 0 0 0
  Liaoning        1 0 0 0
  Ningxia         0 1 0 0
  Qinghai         0 1 0 0
  Shandong        1 0 0 0
  Shanghai        0 0 0 1
  Shanxi(Taiyuan) 1 0 0 0
  Shanxi(Xi'an)   1 0 0 0
  Sichuan         1 0 0 0
  Tianjin         0 0 0 1
  Tibet           0 0 1 0
  Xinjiang        1 0 0 0
  Yunnan          0 1 0 0
  Zhejiang        1 0 0 0

附：
用ggfortify软件包做更好看的二维可视化

本文由厦门大学荔枝带飞队编写

你可能感兴趣的:(数学建模)

2024年华为杯数学建模研赛C题思路代码+论文助攻 DS数模 2024华为杯数学建模华为 2024华为杯 2024研究生数学建模 2024研赛
2024年华为杯研究生数学建模竞赛（以下简研赛）将于9月21日上午8时正式开始。下文包含：2024研赛思路解析、研赛参赛时间及规则信息说明、好用的数模技巧及如何备战数学建模竞赛C君将会第一时间发布选题建议、所有题目的思路解析、相关代码、参考文献、参考论文等多项资料，帮助大家取得好成绩。2024年研赛将于9月21日上午8时正式开始这里有些资料，大家可以看看：【2024最全国赛研赛数模资料包】C君珍贵
数学建模、运筹学之非线性规划 AgentSmart 算法学习算法动态规划线性代数线性规划
数学建模、运筹学之非线性规划一、最优化问题理论体系二、梯度下降法——无约束非线性规划三、牛顿法——无约束非线性规划四、只包含等值约束的拉格朗日乘子法五、不等值约束非线性规划与KKT条件一、最优化问题理论体系最优化问题旨在寻找全局最优值（或为最大值，或为最小值）。最优化问题一般可以分为两个部分：目标函数与约束条件。该问题的进一步细分也是根据这两部分的差异。最优化问题根据变量的取值范围不同可以划分为一
VLSI电路单元的自动布局：全局布局基础介绍 Jaaiko 数学建模算法开源图论 matlab
2024年华数杯全国大学生数学建模竞赛B题为：VLSI电路单元的自动布局。本题主要关注的是全局布局问题。学术界针对全局布局的评估模型和优化方法的研究历史悠久。本文借题顺势介绍全局布局的一些重点基础内容和相关工具/资料，以期为对EDA算法设计领域感兴趣、对数学建模感兴趣的人降低研究门槛。VLSI是超大规模集成电路的简称。完成一个VLSI设计的流程十分复杂，包含多种数据格式的转化，其中将逻辑网表转变为
python数学建模--非线性规划 diudiu_aaa 数学建模 python 算法
1.从线性规划到非线性规划本系列的开篇我们介绍了线性规划（LinearProgramming）并延伸到整数规划、0-1规划，以及相对复杂的固定费用问题、选址问题。这些问题的共同特点是，目标函数与约束条件都是线性函数。如果目标函数或约束条件中包含非线性函数，则是非线性规划。通常，非线性问题都比线性问题复杂得多，困难得多，非线性规划也是这样。非线性规划没有统一的通用方法、算法来解决，各种方法都有特定的
数学建模笔记——动态规划 liangbm3 数学建模笔记数学建模笔记动态规划 python 背包问题算法优化问题
数学建模笔记——动态规划动态规划1.模型原理2.典型例题2.1例1凑硬币2.2例2背包问题3.python代码实现3.1例13.2例2动态规划1.模型原理动态规划是运筹学的一个分支，通常用来解决多阶段决策过程最优化问题。动态规划的基本想法就是将原问题转换为一系列相互联系的子问题，然后通过逐层地推来求得最后的解。目前，动态规划常常出现在各类计算机算法竞赛或者程序员笔试面试中，在数学建模中出现的相对较
数学建模笔记—— 非线性规划 liangbm3 数学建模笔记数学建模笔记 python matlab 非线性规划算法学习优化问题
数学建模笔记——非线性规划非线性规划1.模型原理1.1非线性规划的标准型1.2非线性规划求解的Matlab函数2.典型例题3.matlab代码求解3.1例1一个简单示例3.2例2选址问题1.第一问线性规划2.第二问非线性规划非线性规划非线性规划是一种求解目标函数或约束条件中有一个或几个非线性函数的最优化问题的方法。运筹学的一个重要分支。20世纪50年代初,库哈(H.W.Kuhn)和托克(A.W.T
保研比赛利器：用AI比赛助手降维打击数学建模好家伙VCC 杂谈杂谈数学建模人工智能
数学建模作为一个热门但又具有挑战性的赛道，在保研、学分加分、简历增色等方面具有独特优势。近年来，随着AI技术的发展，特别是像GPT-4模型的应用，数学建模的比赛变得不再那么“艰深”。通过利用AI比赛助手，不仅可以大大提升团队效率，还能有效提高比赛获奖几率。本文将详细介绍如何通过AI比赛助手完成数学建模比赛，并结合实例展示其强大功能。一、AI比赛助手的引入1.什么是AI比赛助手？AI比赛助手是一种集
数学建模——Box-Cox变换 Desire.984 Python 数学建模数学建模 python
用途：当某个随机变量XXX不服从正态分布的时候，可以尝试通过这种变换将其变成正态分布。两个常用的变换对数变换：已知随机变量XXX，如果有ln⁡X∼N(μ,σ2)\lnX\simN(\mu,\sigma^2)lnX∼N(μ,σ2)，那么对XXX使用对数变换。适合随着自变量的增加，因变量的方差也增大的模型。平方根变换：已知随机变量XXX，如果有X∼N(μ,σ2)\sqrtX\simN(\mu,\sig
Python 数学建模——方差分析 Desire.984 Python 数学建模数学建模 python 概率论
文章目录前言单因素方差分析原理核心代码双因素方差分析数学模型分析依据典型代码前言方差分析也是概率论中非常重要的内容，有时数学建模需要用到。方差分析是干什么的？如果说假设检验用于分析两个总体之间的均值μ1,μ2\mu_1,\mu_2μ1,μ2是否存在显著的差别，那么方差分析就是分析两个以上总体之间的均值是否存在显著的差别。单因素方差分析用途：已知一个量AAA可能会影响XXX，AAA的不同取值可能
【全网最全】2024年第五届“华数杯”全国大学生数学建模竞赛完整思路解析+代码+论文 Tina表姐数学建模
我是Tina表姐，毕业于中国人民大学，对数学建模的热爱让我在这一领域深耕多年。我的建模思路已经帮助了百余位学习者和参赛者在数学建模的道路上取得了显著的进步和成就。现在，我将这份宝贵的经验和知识凝练成一份全面的解题思路与代码论文集合，专为本次赛题设计，旨在帮助您深入理解数学建模的每一个环节。2024年第五届“华数杯”全国大学生数学建模竞赛完整内容可以在文章末尾领取！下文包含：2024年第五届“华数杯
2024 年高教社杯全国大学生数学建模竞赛B题第一问详细解题思路（终版）柒墨轩数学建模 python
示例代码：fromscipy.statsimportnorm#定义参数p0=0.10#标称次品率alpha=0.05#95%信度下的显著性水平beta=0.10#90%信度下的显著性水平E=0.01#允许的误差范围#计算95%信度下的样本量Z_alpha_2=norm.ppf(1-alpha/2)n_95=((Z_alpha_2*(p0*(1-p0))**0.5)/E)**2#计算90%信度下的样
备战2024数学建模国赛（模型三十）：遗传算法优秀案例（三）变循环发动机部件法建模及优化 2024年数学建模国赛备战2024数学建模国赛 2024数学建模（不代写论文请勿盲目订阅）数学建模 2024年数学建模国赛备战数学建模国赛算法遗传算法 2024
专栏内容(赛前预售价99，比赛期间299):2024数学建模国赛期间会发布思路、代码和优秀论文。（本专栏达不到国一的水平，适用于有一点点基础冲击省奖的同学，近两年有二十几个国二，但是达不到国一，普遍获得省奖，请勿盲目订阅）python全套教程（一百篇博客）：从新手到掌握使用python，可以对数学建模问题进行建模分析。35套模型算法（优秀论文示例）：马尔科夫模型、遗传算法、逻辑回归、逐步回归、蚁群
2024高教社杯数学建模国赛论文 C题农作物的种植策略详细思路、代码和优秀论文 2024年数学建模国赛备战2024数学建模国赛 2024数学建模（不代写论文请勿盲目订阅）数学建模数学建模国赛 2024数学建模国赛 2024年高教社杯 D题
专栏内容(赛前预售价99，比赛期间299):2024数学建模国赛期间会发布思路、代码和优秀论文。（本专栏达不到国一的水平，适用于有一点点基础冲击省奖的同学，近两年有二十几个国二，但是达不到国一，普遍获得省奖，请勿盲目订阅）比赛思路会程序更新到专栏内：https://blog.csdn.net/m0_52343631/category_12482955.html?spm=1001.2014.3001
Python 数学建模——假设检验 Desire.984 Python 数学建模 python 数学建模概率论
文章目录前言参数假设检验单个总体均值的假设检验σ\sigmaσ已知σ\sigmaσ未知两个总体均值的假设检验参考代码非参数假设检验分布拟合检验——卡方检验KS检验（Kolmogorov-Smirnov检验）Wilcoxon检验Wilcoxon符号秩检验Wilcoxon秩和检验前言假设检验是概率论中相当重要的内容。一般是先提出一个原假设H0H_0H0和一个对立的备择假设H1H_1H1，通过数学方
python的数学建模库_数学建模库 weixin_39737240 python的数学建模库
NumPy(NumericalPython)是Python语言的一个扩展程序库，支持大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库。引用：importnumpyasnpNumpy简单创建数组：importnumpyasnp#创建简单的列表a=[1,2,3,4]#将列表转换为数组b=np.array(a)Numpy查看数组属性:数组元素个数:b.size数组形状:b.shape数组
Python科学计算实战：数学建模与数值分析应用数据小爬虫 api 电商api 数学建模 python 开发语言 pygame 前端 facebook 数据库
Python在科学计算和数学建模方面有着广泛的应用。以下是一个简单的例子，使用Python进行数学建模和数值分析。这个例子将演示如何使用Python来求解一元二次方程。1.一元二次方程一元二次方程是一个形如(ax^2+bx+c=0)的方程，其中(a\neq0)。2.求解方法求解一元二次方程，我们通常使用公式：[x=\frac{-b\pm\sqrt{b^2-4ac}}{2a}]3.Python实现i
第十四周_数学建模 WinterCruel 数学建模
第十四周_数学建模1、银行的贷款部门需要判别每个客户的信用好坏（是否未履行还贷责任），以决定是否给予贷款。可以根据贷款申请人的年龄（X1）、受教育程度（X2）、现在所从事工作的年数（X3）、未变更住址的年数（X4）、收入（X5）、负债收入比例（X6）、信用卡债务（X7）、其它债务（X8）等来判断其信用情况。下表是从某银行的客户资料中抽取的部分数据，和某客户的如上情况资料为（53，1，9，18，50
第12周数学建模作业 WinterCruel 数学建模
第12周数学建模作业1、考察温度x对产量y的影响，测得下列10组数据：温度（℃）20253035404550556065产量（kg）13.215.116.417.117.918.719.621.222.524.3求y关于x的线性回归方程，检验回归效果是否显著，并预测x=42℃时产量的估值.Matlab代码：x=[20,25,30,35,40,45,50,55,60,65];y=[13.2,15.1
非理工科院校怎么打好数学建模比赛 | 南川笔记南川笔记
Proposition1非理工科院校最好不要打数学建模比赛。虽说“一次建模，终身受益”，但毕竟数学建模既要数学理论的支撑（不仅仅是大学里的微积分、线性代数和概率论与统计，更多的是基于微积分的常偏微分方程、基于线性代数的运筹学和基于概率论与统计的统计分析内容），还要编程的支撑（不是常规的C语言或者Java程序，也不是这几年很火的Python编程，而是基于数值运算的Matlab和基于统计的R），这在一
2024 年华数杯全国大学生数学建模竞赛题目A题：确保机械臂末端能够准确到达目标位置，最大限度降低能耗和外部干扰力对运动精度的影响。赛题思路代码解析（附结果展示和python代码） DISCrete_28 数学建模 python 开发语言
A题机器臂关节角路径的优化设计机器臂是一种由多个连杆和关节组成的自动化装置，广泛应用于工业生产、精密操作、危险环境作业和物流等领域。其主要作用包括提高生产效率、执行精密操作、适应恶劣环境以及优化物流流程。当前有关机器臂的研究重点包括运动学与动力学建模、关节角路径的优化设计以及路径规划等。这些研究旨在提升机器臂的性能和应用范围，确保其在各种复杂任务中的高效性和精确性。其中，关节角路径的优化设计尤为重
2024高教杯数学建模A题思路一起学习计算机算法人工智能机器学习数学建模
问题1：舞龙队沿螺距为55cm的等距螺线顺时针盘入分析：龙头速度：龙头前把手的行进速度始终保持1m/s。螺线参数：螺距为55cm，即0.55m。初始条件：龙头位于螺线第16圈A点处。思路：确定螺线方程：根据螺线的性质，建立极坐标方程，表示螺线各点的位置。计算时间步长：每秒计算龙头及龙身各点沿螺线的位置。速度计算：由于速度恒定，可直接根据位置变化计算速度方向。实现步骤：使用MATLAB或Python
2024数学建模国赛B题生产过程中的决策问题详细思路：基于抽样检测和多阶段决策模型 nancheng_single 数学建模机器学习算法 python
2024高教社杯数学建模竞赛A题B题C题D题E题完整成品文章和全部问题的解题代码完整版本更新如下：https://www.yuque.com/u42168770/qv6z0d/rytbc1nelty1mu4o问题分析这道题目涉及了一个电子产品生产企业的决策问题，主要包括零配件采购、生产过程管理和质量控制等方面。题目分为四个子问题，逐步深入探讨了企业在生产过程中面临的各种决策情况。问题1针对零配件采
【全网首发】2024数学建模国赛C题39页word版成品论文【附带py+matlab双版本解题代码+可视化图表】 2024数学建模国赛比赛资料分享 2024全国大学生数学建模国赛 2024数学建模国赛 2024数学建模国赛C题数学建模 matlab 开发语言 2024数学建模国赛 2024数学建模国赛C题
基于优化模型的农作物的种植策略完整版成品+py（matlab）代码解题在下面获取：点击链接加入群聊【2024数学建模国赛资料汇总】：http://qm.qq.com/cgi-bin/qm/qr?_wv=1027&k=lZncBILk30DuPRI1Bd8X-3Djv7ZVZyAv&authKey=kKqNSSEbbZN%2FVKn%2BICOqJGahEHfhJEe7BSxK5IMua%2BYQq
2024年电工杯数学建模A题完整分析参考论文（共38页）（含模型和代码）小文数模数学建模 python matlab
2024年电工杯数学建模A题完整分析参考论文A题：园区微电网风光储协调优化配置摘要2一、问题重述3二、问题分析4三、模型假设5四、模型建立与求解64.1问题164.1.1问题1思路分析64.1.2问题1模型建立74.1.3问题1样例代码（仅供参考）114.1.4问题1样例代码运行结果（仅供参考）164.2问题2194.2.1问题2思路分析194.2.2问题2模型建立204.2.3问题2样例代码（仅
2024年第九届数维杯数学建模B题完整分析参考论文（共42页）（含模型和代码）小文数模数学建模 python matlab
2024年第九届数维杯数学建模分析参考论文B题生物质和煤共热解问题的研究目录摘要4一、问题重述5问题1：分析正己烷不溶物(INS)对热解产率的影响5问题2：探讨INS和混合比例的交互效应5问题3：基于共热解产物的特性优化混合比例5问题4：分析共热解组合产物收率的实验值与理论计算值差异5问题5：建立热解产物产率预测模型5二、问题分析6问题1的分析6问题2的分析6问题3的分析6问题4的分析6问题5的分
2024年全国大学生数学建模-C 题农作物的种植策略-解题思路参考 studyer_domi 数学建模数学建模
根据乡村的实际情况，充分利用有限的耕地资源，因地制宜，发展有机种植产业，对乡村经济的可持续发展具有重要的现实意义。选择适宜的农作物，优化种植策略，有利于方便田间管理，提高生产效益，减少各种不确定因素可能造成的种植风险。某乡村地处华北山区，常年温度偏低，大多数耕地每年只能种植一季农作物。该乡村现有露天耕地1201亩，分散为34个大小不同的地块，包括平旱地、梯田、山坡地和水浇地4种类型。平旱地、梯田和
2024年认证杯数学建模C题思路＋模型+代码灿灿数模分号数学建模
C题云中的海盐巴黎气候协定提出的目标是：在2100年前，把全球平均气温相对于工业革命以前的气温升幅控制在不超过2摄氏度的水平，并为1.5摄氏度而努力。但事实上，许多之前的研究已经指出，全球的碳排放以及气温升温的前景都无法达到这一预期标准。而且传统的减排措施的实施效果较为有限。为了应对全球变暖，一些科学家提出了叫做“地球工程”的改造手段。包括使用人工手段从空气中分离并储存二氧化碳，或者给大气中注入气
2024国赛数学建模保姆级选题建议，思路教程灿灿数模分号数学建模
2024年高教社杯全国大学生数学建模竞赛题目分析，思路模型代码论文持续更新，更新见文末名片A题：“板凳龙”闹元宵难度:中等偏上适合专业:工程力学、机械工程、物理、计算机科学、数学等专业的学生适合解答这一题。特别是有扎实几何建模、力学和动态模拟基础的学生。主要算法和模型:1.几何建模:需要建立空间几何模型，可以用螺旋线方程、空间曲线运动方程来描述舞龙队的位置和速度。2.动力学模拟:可以使用微分方程或
2024 年高教社杯全国大学生数学建模竞赛 C 题农作物的种植策略参考论文无水印布凯彻-劳斯基数学建模 c语言开发语言论文笔记学习
持续更新中，2024年数学建模比赛思路代码论文都会发布到专栏内，只需订阅一次！完整论文+代码+数据结果链接在文末！订阅后可查看参考论文文件第一问1.1问题重述这个问题围绕的是华北山区的某乡村，在有限的耕地条件下，如何制定最优的农作物种植策略。乡村有34块露天耕地和20个大棚，种植条件包括粮食作物、蔬菜、水稻和食用菌。除了要考虑地块的面积、种植季节等，还要确保三年内每块地至少种植一次豆类作物。根据附
2024 年高教社杯全国大学生数学建模竞赛 C 题农作物的种植策略（完整代码）布凯彻-劳斯基数学建模开发语言 python 学习论文阅读
持续更新中，2024年数学建模比赛思路代码论文都会发布到专栏内，只需订阅一次！完整论文+代码+数据结果链接在文末！第一问代码：（1）importpandasaspdimportnumpyasnpfromscipy.optimizeimportlinprogimportrandom#读取四个表格的数据file_1='2023年的种植数据与销售量.xlsx'file_2='各作物聚合后销售量与价格.x
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文