Window_Bird

2022数学建模国赛C题官网展示论文C155论文复现

2022数学建模国赛C题C155论文复现

1.内容比对
2.第一问第二小问复现代码
- 2.1 页表合并
- 2.2 数据的正态性检验
- - 2.2.1数据的正态性检验效果图
- 2.3不满足正态性，进行中心化对数比变换
- - 2.3.1 核心步骤-inf用0值替换
  - 2.3.2中心化对数比变换效果图
- 2.4描述性统计
- 2.5 箱线图绘制

github查看完整论文复现过程

1.内容比对

箱线图比对
国赛C155

复现内容：

2.第一问第二小问复现代码

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
plt.rcParams['font.sans-serif'] = ['SimHei']

# Load all sheets of the Excel file
xl_file = pd.ExcelFile("E:\\数学建模国赛\\2022数学建模赛题\\C题\\附件.xlsx")

# Load individual sheets with correct names
sheet1 = xl_file.parse('表单1')  # 玻璃文物的基本信息
sheet2 = xl_file.parse('表单2')  # 已分类玻璃文物的化学成分比例
sheet3 = xl_file.parse('表单3')  # 未分类玻璃文物的化学成分比例

# Show the first few rows of each sheet
sheet1.head(), sheet2.head(), sheet3.head()

(   文物编号 纹饰  类型  颜色 表面风化
 0     1  C  高钾  蓝绿  无风化
 1     2  A  铅钡  浅蓝   风化
 2     3  A  高钾  蓝绿  无风化
 3     4  A  高钾  蓝绿  无风化
 4     5  A  高钾  蓝绿  无风化,
    文物采样点  二氧化硅(SiO2)  氧化钠(Na2O)  氧化钾(K2O)  氧化钙(CaO)  氧化镁(MgO)  氧化铝(Al2O3)  \
 0     01       69.33        NaN      9.99      6.32      0.87        3.93   
 1     02       36.28        NaN      1.05      2.34      1.18        5.73   
 2  03部位1       87.05        NaN      5.19      2.01       NaN        4.06   
 3  03部位2       61.71        NaN     12.37      5.87      1.11        5.50   
 4     04       65.88        NaN      9.67      7.12      1.56        6.44   
 
    氧化铁(Fe2O3)  氧化铜(CuO)  氧化铅(PbO)  氧化钡(BaO)  五氧化二磷(P2O5)  氧化锶(SrO)  氧化锡(SnO2)  \
 0        1.74      3.87       NaN       NaN         1.17       NaN        NaN   
 1        1.86      0.26     47.43       NaN         3.57      0.19        NaN   
 2         NaN      0.78      0.25       NaN         0.66       NaN        NaN   
 3        2.16      5.09      1.41      2.86         0.70      0.10        NaN   
 4        2.06      2.18       NaN       NaN         0.79       NaN        NaN   
 
    二氧化硫(SO2)  
 0       0.39  
 1        NaN  
 2        NaN  
 3        NaN  
 4       0.36  ,
   文物编号 表面风化  二氧化硅(SiO2)  氧化钠(Na2O)  氧化钾(K2O)  氧化钙(CaO)  氧化镁(MgO)  氧化铝(Al2O3)  \
 0   A1  无风化       78.45        NaN       NaN      6.08      1.86        7.23   
 1   A2   风化       37.75        NaN       NaN      7.63       NaN        2.33   
 2   A3  无风化       31.95        NaN      1.36      7.19      0.81        2.93   
 3   A4  无风化       35.47        NaN      0.79      2.89      1.05        7.07   
 4   A5   风化       64.29        1.2      0.37      1.64      2.34       12.75   
 
    氧化铁(Fe2O3)  氧化铜(CuO)  氧化铅(PbO)  氧化钡(BaO)  五氧化二磷(P2O5)  氧化锶(SrO)  氧化锡(SnO2)  \
 0        2.15      2.11       NaN       NaN         1.06      0.03        NaN   
 1         NaN       NaN     34.30       NaN        14.27       NaN        NaN   
 2        7.06      0.21     39.58      4.69         2.68      0.52        NaN   
 3        6.45      0.96     24.28      8.31         8.45      0.28        NaN   
 4        0.81      0.94     12.23      2.16         0.19      0.21       0.49   
 
    二氧化硫(SO2)  
 0       0.51  
 1        NaN  
 2        NaN  
 3        NaN  
 4        NaN  )

sheet2

	文物采样点	二氧化硅(SiO2)	氧化钠(Na2O)	氧化钾(K2O)	氧化钙(CaO)	氧化镁(MgO)	氧化铝(Al2O3)	氧化铁(Fe2O3)	氧化铜(CuO)	氧化铅(PbO)	氧化钡(BaO)	五氧化二磷(P2O5)	氧化锶(SrO)	氧化锡(SnO2)	二氧化硫(SO2)
0	01	69.33	NaN	9.99	6.32	0.87	3.93	1.74	3.87	NaN	NaN	1.17	NaN	NaN	0.39
1	02	36.28	NaN	1.05	2.34	1.18	5.73	1.86	0.26	47.43	NaN	3.57	0.19	NaN	NaN
2	03部位1	87.05	NaN	5.19	2.01	NaN	4.06	NaN	0.78	0.25	NaN	0.66	NaN	NaN	NaN
3	03部位2	61.71	NaN	12.37	5.87	1.11	5.50	2.16	5.09	1.41	2.86	0.70	0.10	NaN	NaN
4	04	65.88	NaN	9.67	7.12	1.56	6.44	2.06	2.18	NaN	NaN	0.79	NaN	NaN	0.36
...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...
64	54严重风化点	17.11	NaN	NaN	NaN	1.11	3.65	NaN	1.34	58.46	NaN	14.13	1.12	NaN	NaN
65	55	49.01	2.71	NaN	1.13	NaN	1.45	NaN	0.86	32.92	7.95	0.35	NaN	NaN	NaN
66	56	29.15	NaN	NaN	1.21	NaN	1.85	NaN	0.79	41.25	15.45	2.54	NaN	NaN	NaN
67	57	25.42	NaN	NaN	1.31	NaN	2.18	NaN	1.16	45.10	17.30	NaN	NaN	NaN	NaN
68	58	30.39	NaN	0.34	3.49	0.79	3.52	0.86	3.13	39.35	7.66	8.99	0.24	NaN	NaN

69 rows × 15 columns

component_cols = ['二氧化硅(SiO2)', '氧化钠(Na2O)', '氧化钾(K2O)', '氧化钙(CaO)', '氧化镁(MgO)', 
                  '氧化铝(Al2O3)', '氧化铁(Fe2O3)', '氧化铜(CuO)', '氧化铅(PbO)', '氧化钡(BaO)', 
                  '五氧化二磷(P2O5)', '氧化锶(SrO)', '氧化锡(SnO2)', '二氧化硫(SO2)']

sheet2 ['成分总和'] = sheet2 [component_cols].sum(axis=1)
sheet2 ['成分总和']

sheet2 = sheet2[(sheet2['成分总和'] >= 85) & (sheet2['成分总和'] <= 105)]
sheet2
sheet2 = sheet2.fillna(0)

# Normalize the chemical components to sum up to 100%
sheet2[component_cols] = sheet2[component_cols].div(sheet2[component_cols].sum(axis=1), axis=0) * 100

sheet2 ['成分总和'] = sheet2 [component_cols].sum(axis=1)
sheet2

	文物采样点	二氧化硅(SiO2)	氧化钠(Na2O)	氧化钾(K2O)	氧化钙(CaO)	氧化镁(MgO)	氧化铝(Al2O3)	氧化铁(Fe2O3)	氧化铜(CuO)	氧化铅(PbO)	氧化钡(BaO)	五氧化二磷(P2O5)	氧化锶(SrO)	氧化锡(SnO2)	二氧化硫(SO2)	成分总和
0	01	71.027559	0.000000	10.234607	6.474746	0.891302	4.026227	1.782604	3.964758	0.000000	0.000000	1.198648	0.000000	0.0	0.399549	100.0
1	02	36.319952	0.000000	1.051156	2.342577	1.181299	5.736310	1.862048	0.260286	47.482230	0.000000	3.573931	0.190209	0.0	0.000000	100.0
2	03部位1	87.050000	0.000000	5.190000	2.010000	0.000000	4.060000	0.000000	0.780000	0.250000	0.000000	0.660000	0.000000	0.0	0.000000	100.0
3	03部位2	62.408981	0.000000	12.510113	5.936489	1.122573	5.562298	2.184466	5.147654	1.425971	2.892395	0.707929	0.101133	0.0	0.000000	100.0
4	04	68.582136	0.000000	10.066625	7.412034	1.623985	6.704143	2.144493	2.269415	0.000000	0.000000	0.822403	0.000000	0.0	0.374766	100.0
...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...
64	54严重风化点	17.653735	0.000000	0.000000	0.000000	1.145274	3.765993	0.000000	1.382584	60.317788	0.000000	14.579034	1.155592	0.0	0.000000	100.0
65	55	50.850799	2.811787	0.000000	1.172442	0.000000	1.504462	0.000000	0.892301	34.156464	8.248599	0.363146	0.000000	0.0	0.000000	100.0
66	56	31.602342	0.000000	0.000000	1.311795	0.000000	2.005637	0.000000	0.856461	44.720295	16.749783	2.753686	0.000000	0.0	0.000000	100.0
67	57	27.489997	0.000000	0.000000	1.416676	0.000000	2.357521	0.000000	1.254461	48.772575	18.708770	0.000000	0.000000	0.0	0.000000	100.0
68	58	30.771567	0.000000	0.344269	3.533819	0.799919	3.564196	0.870798	3.169299	39.844066	7.756177	9.102876	0.243013	0.0	0.000000	100.0

67 rows × 16 columns

sheet2_copy = sheet2.copy()
sheet2=sheet2_copy


# Define the new column names
new_component_cols = ['SiO2', 'Na2O', 'K2O', 'CaO', 'MgO', 
                      'Al2O3', 'Fe2O3', 'CuO', 'PbO', 'BaO', 
                      'P2O5', 'SrO', 'SnO2', 'SO2']

# Create a mapping from old column names to new column names
rename_dict = dict(zip(component_cols, new_component_cols))

# Rename the columns
sheet2.rename(columns=rename_dict, inplace=True)

# Check the updated column names
sheet2.columns

Index(['文物采样点', 'SiO2', 'Na2O', 'K2O', 'CaO', 'MgO', 'Al2O3', 'Fe2O3', 'CuO',
       'PbO', 'BaO', 'P2O5', 'SrO', 'SnO2', 'SO2', '成分总和'],
      dtype='object')

2.1 页表合并

# Merge sheet1 and sheet2 on 文物编号 (artifact number)
# First, we need to extract the 文物编号 from the 文物采样点 in sheet2
# We assume that the 文物编号 is the numeric part before any non-numeric character in the 文物采样点

# Import regular expression library
import re

# Define a function to extract 文物编号 from 文物采样点
def extract_number(s):
    match = re.match(r"(\d+)", s)
    return int(match.group()) if match else None

# Apply the function to the 文物采样点 column
sheet2['文物编号'] = sheet2['文物采样点'].apply(extract_number)

# Merge sheet1 and sheet2
data = pd.merge(sheet1, sheet2, on='文物编号')
# nan for zero

data

	文物编号	纹饰	类型	颜色	表面风化	文物采样点	SiO2	Na2O	K2O	CaO	...	Al2O3	Fe2O3	CuO	PbO	BaO	P2O5	SrO	SnO2	SO2	成分总和
0	1	C	高钾	蓝绿	无风化	01	71.027559	0.000000	10.234607	6.474746	...	4.026227	1.782604	3.964758	0.000000	0.000000	1.198648	0.000000	0.0	0.399549	100.0
1	2	A	铅钡	浅蓝	风化	02	36.319952	0.000000	1.051156	2.342577	...	5.736310	1.862048	0.260286	47.482230	0.000000	3.573931	0.190209	0.0	0.000000	100.0
2	3	A	高钾	蓝绿	无风化	03部位1	87.050000	0.000000	5.190000	2.010000	...	4.060000	0.000000	0.780000	0.250000	0.000000	0.660000	0.000000	0.0	0.000000	100.0
3	3	A	高钾	蓝绿	无风化	03部位2	62.408981	0.000000	12.510113	5.936489	...	5.562298	2.184466	5.147654	1.425971	2.892395	0.707929	0.101133	0.0	0.000000	100.0
4	4	A	高钾	蓝绿	无风化	04	68.582136	0.000000	10.066625	7.412034	...	6.704143	2.144493	2.269415	0.000000	0.000000	0.822403	0.000000	0.0	0.374766	100.0
...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...
62	54	C	铅钡	浅蓝	风化	54严重风化点	17.653735	0.000000	0.000000	0.000000	...	3.765993	0.000000	1.382584	60.317788	0.000000	14.579034	1.155592	0.0	0.000000	100.0
63	55	C	铅钡	绿	无风化	55	50.850799	2.811787	0.000000	1.172442	...	1.504462	0.000000	0.892301	34.156464	8.248599	0.363146	0.000000	0.0	0.000000	100.0
64	56	C	铅钡	蓝绿	风化	56	31.602342	0.000000	0.000000	1.311795	...	2.005637	0.000000	0.856461	44.720295	16.749783	2.753686	0.000000	0.0	0.000000	100.0
65	57	C	铅钡	蓝绿	风化	57	27.489997	0.000000	0.000000	1.416676	...	2.357521	0.000000	1.254461	48.772575	18.708770	0.000000	0.000000	0.0	0.000000	100.0
66	58	C	铅钡	NaN	风化	58	30.771567	0.000000	0.344269	3.533819	...	3.564196	0.870798	3.169299	39.844066	7.756177	9.102876	0.243013	0.0	0.000000	100.0

67 rows × 21 columns

data.drop(['颜色','纹饰','文物编号','成分总和'],axis=1,inplace=True)
data

	类型	表面风化	文物采样点	SiO2	Na2O	K2O	CaO	MgO	Al2O3	Fe2O3	CuO	PbO	BaO	P2O5	SrO	SnO2	SO2
0	高钾	无风化	01	71.027559	0.000000	10.234607	6.474746	0.891302	4.026227	1.782604	3.964758	0.000000	0.000000	1.198648	0.000000	0.0	0.399549
1	铅钡	风化	02	36.319952	0.000000	1.051156	2.342577	1.181299	5.736310	1.862048	0.260286	47.482230	0.000000	3.573931	0.190209	0.0	0.000000
2	高钾	无风化	03部位1	87.050000	0.000000	5.190000	2.010000	0.000000	4.060000	0.000000	0.780000	0.250000	0.000000	0.660000	0.000000	0.0	0.000000
3	高钾	无风化	03部位2	62.408981	0.000000	12.510113	5.936489	1.122573	5.562298	2.184466	5.147654	1.425971	2.892395	0.707929	0.101133	0.0	0.000000
4	高钾	无风化	04	68.582136	0.000000	10.066625	7.412034	1.623985	6.704143	2.144493	2.269415	0.000000	0.000000	0.822403	0.000000	0.0	0.374766
...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...
62	铅钡	风化	54严重风化点	17.653735	0.000000	0.000000	0.000000	1.145274	3.765993	0.000000	1.382584	60.317788	0.000000	14.579034	1.155592	0.0	0.000000
63	铅钡	无风化	55	50.850799	2.811787	0.000000	1.172442	0.000000	1.504462	0.000000	0.892301	34.156464	8.248599	0.363146	0.000000	0.0	0.000000
64	铅钡	风化	56	31.602342	0.000000	0.000000	1.311795	0.000000	2.005637	0.000000	0.856461	44.720295	16.749783	2.753686	0.000000	0.0	0.000000
65	铅钡	风化	57	27.489997	0.000000	0.000000	1.416676	0.000000	2.357521	0.000000	1.254461	48.772575	18.708770	0.000000	0.000000	0.0	0.000000
66	铅钡	风化	58	30.771567	0.000000	0.344269	3.533819	0.799919	3.564196	0.870798	3.169299	39.844066	7.756177	9.102876	0.243013	0.0	0.000000

67 rows × 17 columns

data.shape

(67, 17)

#data.to_excel('E:\\数学建模国赛\\2022数学建模赛题\\C题\\一二表单合并数据.xlsx', index=True)

data

	类型	表面风化	文物采样点	SiO2	Na2O	K2O	CaO	MgO	Al2O3	Fe2O3	CuO	PbO	BaO	P2O5	SrO	SnO2	SO2
0	高钾	无风化	01	71.027559	0.000000	10.234607	6.474746	0.891302	4.026227	1.782604	3.964758	0.000000	0.000000	1.198648	0.000000	0.0	0.399549
1	铅钡	风化	02	36.319952	0.000000	1.051156	2.342577	1.181299	5.736310	1.862048	0.260286	47.482230	0.000000	3.573931	0.190209	0.0	0.000000
2	高钾	无风化	03部位1	87.050000	0.000000	5.190000	2.010000	0.000000	4.060000	0.000000	0.780000	0.250000	0.000000	0.660000	0.000000	0.0	0.000000
3	高钾	无风化	03部位2	62.408981	0.000000	12.510113	5.936489	1.122573	5.562298	2.184466	5.147654	1.425971	2.892395	0.707929	0.101133	0.0	0.000000
4	高钾	无风化	04	68.582136	0.000000	10.066625	7.412034	1.623985	6.704143	2.144493	2.269415	0.000000	0.000000	0.822403	0.000000	0.0	0.374766
...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...
62	铅钡	风化	54严重风化点	17.653735	0.000000	0.000000	0.000000	1.145274	3.765993	0.000000	1.382584	60.317788	0.000000	14.579034	1.155592	0.0	0.000000
63	铅钡	无风化	55	50.850799	2.811787	0.000000	1.172442	0.000000	1.504462	0.000000	0.892301	34.156464	8.248599	0.363146	0.000000	0.0	0.000000
64	铅钡	风化	56	31.602342	0.000000	0.000000	1.311795	0.000000	2.005637	0.000000	0.856461	44.720295	16.749783	2.753686	0.000000	0.0	0.000000
65	铅钡	风化	57	27.489997	0.000000	0.000000	1.416676	0.000000	2.357521	0.000000	1.254461	48.772575	18.708770	0.000000	0.000000	0.0	0.000000
66	铅钡	风化	58	30.771567	0.000000	0.344269	3.533819	0.799919	3.564196	0.870798	3.169299	39.844066	7.756177	9.102876	0.243013	0.0	0.000000

67 rows × 17 columns

2.2 数据的正态性检验

"""
对于某些统计分析，如回归分析，数据的正态性是一种关键的假设。
然而，是否需要进行这种变换取决于数据本身的特性和分析目标。
现在，让我们查看一下数据
对于您的数据，考虑到它是化学成分数据，并且从前面的分析中我们看到数据的分布并不完全是正态的，
我建议在中心化对数比变换后进行分析。这样可以确保数据满足统计分析的假设，并能更好地处理组成数据的特性。
"""
# 正态性检验，查看一下这些化学元素的分布。
import matplotlib.pyplot as plt

# Select only the columns that are numeric and not categorical
numeric_cols = data.select_dtypes(include='number').columns

2.2.1数据的正态性检验效果图

# Plot histograms for each numeric column
fig, axs = plt.subplots(len(numeric_cols), figsize=(10, len(numeric_cols)*3))

for i, col in enumerate(numeric_cols):
    axs[i].hist(data[col].dropna(), bins=30, color='skyblue', edgecolor='black', alpha=0.7)
    axs[i].set_title(f'Histogram of {col}')

plt.tight_layout()
plt.show()

data_raw=data.copy()

data

	类型	表面风化	文物采样点	SiO2	Na2O	K2O	CaO	MgO	Al2O3	Fe2O3	CuO	PbO	BaO	P2O5	SrO	SnO2	SO2
0	高钾	无风化	01	71.027559	0.000000	10.234607	6.474746	0.891302	4.026227	1.782604	3.964758	0.000000	0.000000	1.198648	0.000000	0.0	0.399549
1	铅钡	风化	02	36.319952	0.000000	1.051156	2.342577	1.181299	5.736310	1.862048	0.260286	47.482230	0.000000	3.573931	0.190209	0.0	0.000000
2	高钾	无风化	03部位1	87.050000	0.000000	5.190000	2.010000	0.000000	4.060000	0.000000	0.780000	0.250000	0.000000	0.660000	0.000000	0.0	0.000000
3	高钾	无风化	03部位2	62.408981	0.000000	12.510113	5.936489	1.122573	5.562298	2.184466	5.147654	1.425971	2.892395	0.707929	0.101133	0.0	0.000000
4	高钾	无风化	04	68.582136	0.000000	10.066625	7.412034	1.623985	6.704143	2.144493	2.269415	0.000000	0.000000	0.822403	0.000000	0.0	0.374766
...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...
62	铅钡	风化	54严重风化点	17.653735	0.000000	0.000000	0.000000	1.145274	3.765993	0.000000	1.382584	60.317788	0.000000	14.579034	1.155592	0.0	0.000000
63	铅钡	无风化	55	50.850799	2.811787	0.000000	1.172442	0.000000	1.504462	0.000000	0.892301	34.156464	8.248599	0.363146	0.000000	0.0	0.000000
64	铅钡	风化	56	31.602342	0.000000	0.000000	1.311795	0.000000	2.005637	0.000000	0.856461	44.720295	16.749783	2.753686	0.000000	0.0	0.000000
65	铅钡	风化	57	27.489997	0.000000	0.000000	1.416676	0.000000	2.357521	0.000000	1.254461	48.772575	18.708770	0.000000	0.000000	0.0	0.000000
66	铅钡	风化	58	30.771567	0.000000	0.344269	3.533819	0.799919	3.564196	0.870798	3.169299	39.844066	7.756177	9.102876	0.243013	0.0	0.000000

67 rows × 17 columns

"""
正态性检验，们将使用 Shapiro-Wilk 测试来检查每个化学成分的正态性。
这是一种常用的正态性检验方法，它的零假设是数据来自正态分布。
如果 p 值小于 0.05，我们将拒绝零假设，即认为数据不符合正态分布。
"""
from scipy.stats import shapiro, levene

# Initialize an empty dataframe to store the test results
test_results = pd.DataFrame()

# Loop over each numeric column
for col in numeric_cols[0:]:
    # Initialize an empty dict to store the results for this variable
    col_results = {'Variable': col}
    
    # Normality test
    # Drop NA values before performing the test
    _, p_normal = shapiro(data[col].dropna())
    col_results['Normality p-value'] = p_normal
    col_results['Normal'] = p_normal > 0.05
    
    # Variance equality test (only if the data is normal)
    if col_results['Normal']:
        _, p_equal_var = levene(data.loc[data['表面风化'] == '无风化', col].dropna(), 
                                data.loc[data['表面风化'] == '风化', col].dropna())
        col_results['Equal var p-value'] = p_equal_var
        col_results['Equal var'] = p_equal_var > 0.05
    
    # Append the results to the dataframe
    test_results = test_results.append(col_results, ignore_index=True)

# Now, the test_results dataframe contains the p-values for normality and equal variances
# for each numeric variable, without any transformation applied to the data.

C:\Users\chen'bu'rong\AppData\Local\Temp\ipykernel_15024\777781528.py:30: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.
  test_results = test_results.append(col_results, ignore_index=True)
C:\Users\chen'bu'rong\AppData\Local\Temp\ipykernel_15024\777781528.py:30: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.
  test_results = test_results.append(col_results, ignore_index=True)
C:\Users\chen'bu'rong\AppData\Local\Temp\ipykernel_15024\777781528.py:30: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.
  test_results = test_results.append(col_results, ignore_index=True)
C:\Users\chen'bu'rong\AppData\Local\Temp\ipykernel_15024\777781528.py:30: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.
  test_results = test_results.append(col_results, ignore_index=True)
C:\Users\chen'bu'rong\AppData\Local\Temp\ipykernel_15024\777781528.py:30: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.
  test_results = test_results.append(col_results, ignore_index=True)
C:\Users\chen'bu'rong\AppData\Local\Temp\ipykernel_15024\777781528.py:30: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.
  test_results = test_results.append(col_results, ignore_index=True)
C:\Users\chen'bu'rong\AppData\Local\Temp\ipykernel_15024\777781528.py:30: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.
  test_results = test_results.append(col_results, ignore_index=True)
C:\Users\chen'bu'rong\AppData\Local\Temp\ipykernel_15024\777781528.py:30: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.
  test_results = test_results.append(col_results, ignore_index=True)
C:\Users\chen'bu'rong\AppData\Local\Temp\ipykernel_15024\777781528.py:30: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.
  test_results = test_results.append(col_results, ignore_index=True)
C:\Users\chen'bu'rong\AppData\Local\Temp\ipykernel_15024\777781528.py:30: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.
  test_results = test_results.append(col_results, ignore_index=True)
C:\Users\chen'bu'rong\AppData\Local\Temp\ipykernel_15024\777781528.py:30: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.
  test_results = test_results.append(col_results, ignore_index=True)
C:\Users\chen'bu'rong\AppData\Local\Temp\ipykernel_15024\777781528.py:30: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.
  test_results = test_results.append(col_results, ignore_index=True)
C:\Users\chen'bu'rong\AppData\Local\Temp\ipykernel_15024\777781528.py:30: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.
  test_results = test_results.append(col_results, ignore_index=True)
C:\Users\chen'bu'rong\AppData\Local\Temp\ipykernel_15024\777781528.py:30: FutureWarning: The frame.append method is deprecated and will be removed from pandas in a future version. Use pandas.concat instead.
  test_results = test_results.append(col_results, ignore_index=True)

test_results

	Variable	Normality p-value	Normal	Equal var p-value	Equal var
0	SiO2	5.434923e-02	True	0.009129	False
1	Na2O	5.631047e-13	False	NaN	NaN
2	K2O	2.218287e-13	False	NaN	NaN
3	CaO	8.905178e-06	False	NaN	NaN
4	MgO	1.066307e-05	False	NaN	NaN
5	Al2O3	1.085733e-06	False	NaN	NaN
6	Fe2O3	1.809425e-09	False	NaN	NaN
7	CuO	3.633815e-09	False	NaN	NaN
8	PbO	7.531955e-04	False	NaN	NaN
9	BaO	7.773099e-08	False	NaN	NaN
10	P2O5	4.346846e-09	False	NaN	NaN
11	SrO	6.648307e-06	False	NaN	NaN
12	SnO2	8.658932e-17	False	NaN	NaN
13	SO2	5.878219e-17	False	NaN	NaN

data

	类型	表面风化	文物采样点	SiO2	Na2O	K2O	CaO	MgO	Al2O3	Fe2O3	CuO	PbO	BaO	P2O5	SrO	SnO2	SO2
0	高钾	无风化	01	71.027559	0.000000	10.234607	6.474746	0.891302	4.026227	1.782604	3.964758	0.000000	0.000000	1.198648	0.000000	0.0	0.399549
1	铅钡	风化	02	36.319952	0.000000	1.051156	2.342577	1.181299	5.736310	1.862048	0.260286	47.482230	0.000000	3.573931	0.190209	0.0	0.000000
2	高钾	无风化	03部位1	87.050000	0.000000	5.190000	2.010000	0.000000	4.060000	0.000000	0.780000	0.250000	0.000000	0.660000	0.000000	0.0	0.000000
3	高钾	无风化	03部位2	62.408981	0.000000	12.510113	5.936489	1.122573	5.562298	2.184466	5.147654	1.425971	2.892395	0.707929	0.101133	0.0	0.000000
4	高钾	无风化	04	68.582136	0.000000	10.066625	7.412034	1.623985	6.704143	2.144493	2.269415	0.000000	0.000000	0.822403	0.000000	0.0	0.374766
...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...
62	铅钡	风化	54严重风化点	17.653735	0.000000	0.000000	0.000000	1.145274	3.765993	0.000000	1.382584	60.317788	0.000000	14.579034	1.155592	0.0	0.000000
63	铅钡	无风化	55	50.850799	2.811787	0.000000	1.172442	0.000000	1.504462	0.000000	0.892301	34.156464	8.248599	0.363146	0.000000	0.0	0.000000
64	铅钡	风化	56	31.602342	0.000000	0.000000	1.311795	0.000000	2.005637	0.000000	0.856461	44.720295	16.749783	2.753686	0.000000	0.0	0.000000
65	铅钡	风化	57	27.489997	0.000000	0.000000	1.416676	0.000000	2.357521	0.000000	1.254461	48.772575	18.708770	0.000000	0.000000	0.0	0.000000
66	铅钡	风化	58	30.771567	0.000000	0.344269	3.533819	0.799919	3.564196	0.870798	3.169299	39.844066	7.756177	9.102876	0.243013	0.0	0.000000

67 rows × 17 columns

2.3不满足正态性，进行中心化对数比变换

from scipy.stats.mstats import gmean

data_centralized = data.copy()

# 选择数值列
numeric_data = data_centralized.select_dtypes(include='number')

# 计算每一行的非零元素的几何均值
geo_means = []
for index, row in numeric_data.iterrows():
    non_zero_values = row[row > 0]
    geo_mean = gmean(non_zero_values) if len(non_zero_values) > 0 else 1e-6
    geo_means.append(geo_mean)

# 将每个值除以其所在行的非零元素的几何均值，并取对数
for col in numeric_data.columns:
    data_centralized[col] = np.log(numeric_data[col] / geo_means)

data_centralized.head()

D:\py1.1\envs\pytorch\lib\site-packages\pandas\core\arraylike.py:402: RuntimeWarning: divide by zero encountered in log
  result = getattr(ufunc, method)(*inputs, **kwargs)

	类型	表面风化	文物采样点	SiO2	Na2O	K2O	CaO	MgO	Al2O3	Fe2O3	CuO	PbO	BaO	P2O5	SrO	SnO2	SO2
0	高钾	无风化	01	3.045978	-inf	1.108685	0.650820	-1.332161	0.175740	-0.639014	0.160355	-inf	-inf	-1.035896	-inf	-inf	-2.134508
1	铅钡	风化	02	2.676664	-inf	-0.865813	-0.064452	-0.749089	0.831113	-0.294026	-2.261677	2.944652	-inf	0.357963	-2.575334	-inf	-inf
2	高钾	无风化	03部位1	3.586159	-inf	0.766410	-0.182189	-inf	0.520860	-inf	-1.128785	-2.266618	-inf	-1.295839	-inf	-inf	-inf
3	高钾	无风化	03部位2	3.090699	-inf	1.483527	0.738107	-0.927387	0.673001	-0.261639	0.595531	-0.688158	0.019074	-1.388422	-3.334332	-inf	-inf
4	高钾	无风化	04	2.968764	-inf	1.049957	0.743836	-0.774386	0.643457	-0.496365	-0.439747	-inf	-inf	-1.454794	-inf	-inf	-2.240723

2.3.1 核心步骤-inf用0值替换

# Replace -inf values with NaN for visualization purposes
#plt.rcParams['font.family'] = 'DejaVu Sans'
selected_cols=new_component_cols
data_centralized.replace(-np.inf, 0, inplace=True)
data_centralized

	类型	表面风化	文物采样点	SiO2	Na2O	K2O	CaO	MgO	Al2O3	Fe2O3	CuO	PbO	BaO	P2O5	SrO	SnO2	SO2
0	高钾	无风化	01	3.045978	0.000000	1.108685	0.650820	-1.332161	0.175740	-0.639014	0.160355	0.000000	0.000000	-1.035896	0.000000	0.0	-2.134508
1	铅钡	风化	02	2.676664	0.000000	-0.865813	-0.064452	-0.749089	0.831113	-0.294026	-2.261677	2.944652	0.000000	0.357963	-2.575334	0.0	0.000000
2	高钾	无风化	03部位1	3.586159	0.000000	0.766410	-0.182189	0.000000	0.520860	0.000000	-1.128785	-2.266618	0.000000	-1.295839	0.000000	0.0	0.000000
3	高钾	无风化	03部位2	3.090699	0.000000	1.483527	0.738107	-0.927387	0.673001	-0.261639	0.595531	-0.688158	0.019074	-1.388422	-3.334332	0.0	0.000000
4	高钾	无风化	04	2.968764	0.000000	1.049957	0.743836	-0.774386	0.643457	-0.496365	-0.439747	0.000000	0.000000	-1.454794	0.000000	0.0	-2.240723
...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...
62	铅钡	风化	54严重风化点	1.216607	0.000000	0.000000	0.000000	-1.518696	-0.328329	0.000000	-1.330386	2.445287	0.000000	1.025244	-1.509727	0.0	0.000000
63	铅钡	无风化	55	2.673354	-0.221722	0.000000	-1.096453	0.000000	-0.847107	0.000000	-1.369493	2.275410	0.854502	-2.268492	0.000000	0.0	0.000000
64	铅钡	风化	56	1.753603	0.000000	0.000000	-1.428231	0.000000	-1.003666	0.000000	-1.854574	2.100799	1.118757	-0.686688	0.000000	0.0	0.000000
65	铅钡	风化	57	1.386720	0.000000	0.000000	-1.578789	0.000000	-1.069491	0.000000	-1.700396	1.960066	1.001890	0.000000	0.000000	0.0	0.000000
66	铅钡	风化	58	2.316326	0.000000	-2.176597	0.152115	-1.333510	0.160674	-1.248610	0.043246	2.574709	0.938225	1.098326	-2.524904	0.0	0.000000

67 rows × 17 columns

data

	类型	表面风化	文物采样点	SiO2	Na2O	K2O	CaO	MgO	Al2O3	Fe2O3	CuO	PbO	BaO	P2O5	SrO	SnO2	SO2
0	高钾	无风化	01	71.027559	0.000000	10.234607	6.474746	0.891302	4.026227	1.782604	3.964758	0.000000	0.000000	1.198648	0.000000	0.0	0.399549
1	铅钡	风化	02	36.319952	0.000000	1.051156	2.342577	1.181299	5.736310	1.862048	0.260286	47.482230	0.000000	3.573931	0.190209	0.0	0.000000
2	高钾	无风化	03部位1	87.050000	0.000000	5.190000	2.010000	0.000000	4.060000	0.000000	0.780000	0.250000	0.000000	0.660000	0.000000	0.0	0.000000
3	高钾	无风化	03部位2	62.408981	0.000000	12.510113	5.936489	1.122573	5.562298	2.184466	5.147654	1.425971	2.892395	0.707929	0.101133	0.0	0.000000
4	高钾	无风化	04	68.582136	0.000000	10.066625	7.412034	1.623985	6.704143	2.144493	2.269415	0.000000	0.000000	0.822403	0.000000	0.0	0.374766
...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...
62	铅钡	风化	54严重风化点	17.653735	0.000000	0.000000	0.000000	1.145274	3.765993	0.000000	1.382584	60.317788	0.000000	14.579034	1.155592	0.0	0.000000
63	铅钡	无风化	55	50.850799	2.811787	0.000000	1.172442	0.000000	1.504462	0.000000	0.892301	34.156464	8.248599	0.363146	0.000000	0.0	0.000000
64	铅钡	风化	56	31.602342	0.000000	0.000000	1.311795	0.000000	2.005637	0.000000	0.856461	44.720295	16.749783	2.753686	0.000000	0.0	0.000000
65	铅钡	风化	57	27.489997	0.000000	0.000000	1.416676	0.000000	2.357521	0.000000	1.254461	48.772575	18.708770	0.000000	0.000000	0.0	0.000000
66	铅钡	风化	58	30.771567	0.000000	0.344269	3.533819	0.799919	3.564196	0.870798	3.169299	39.844066	7.756177	9.102876	0.243013	0.0	0.000000

67 rows × 17 columns

2.3.2中心化对数比变换效果图

# Visual comparison between raw data and centralized log ratio transformed data for selected columns
plt.rcParams['font.family'] = 'DejaVu Sans'
fig, axs = plt.subplots(len(selected_cols), 2, figsize=(15, len(selected_cols)*3))

for i, col in enumerate(selected_cols):
    # Plot raw data
    axs[i, 0].hist(data_raw[col].dropna(), bins=30, color='skyblue', edgecolor='black', alpha=0.7)
    axs[i, 0].set_title(f'Raw data: {col}')
    
    # Plot centralized log ratio transformed data
    axs[i, 1].hist(data_centralized[col].dropna(), bins=30, color='salmon', edgecolor='black', alpha=0.7)
    axs[i, 1].set_title(f'Centralized Log Ratio: {col}')

plt.tight_layout()
plt.show()

#data_centralized.to_excel('E:\\数学建模国赛\\2022数学建模赛题\\C题\\一二表单合并对数中心化转换数据.xlsx', index=True)

data=data_centralized
# Count the unique values in the '类型' and '表面风化' columns
glass_types = data['类型'].unique()
weathering_states = data['表面风化'].unique()

glass_types, weathering_states

(array(['高钾', '铅钡'], dtype=object), array(['无风化', '风化'], dtype=object))

# Initialize an empty DataFrame to store the results
grouped_stats = pd.DataFrame()


component_cols = ['SiO2', 'Na2O', 'K2O', 'CaO', 'MgO', 
                      'Al2O3', 'Fe2O3', 'CuO', 'PbO', 'BaO', 
                      'P2O5', 'SrO', 'SnO2', 'SO2']
# Calculate descriptive statistics for each chemical component
for component in component_cols:
    component_data = data.groupby(['类型', '表面风化'])[component]
    stats = component_data.agg(['mean', 'max', 'min', 'std', 'var', 'skew'])
    stats['kurt'] = component_data.apply(pd.DataFrame.kurt)
    stats['cv'] = stats['std'] / stats['mean']  # calculate coefficient of variation
    # Add a level to column names
    stats.columns = pd.MultiIndex.from_product([[component], stats.columns])
    grouped_stats = pd.concat([grouped_stats, stats], axis=1)

grouped_stats

		SiO2								Na2O		...	SnO2		SO2
		mean	max	min	std	var	skew	kurt	cv	mean	max	...	kurt	cv	mean	max	min	std	var	skew	kurt	cv
类型	表面风化
铅钡	无风化	3.013743	3.871521	1.859524	0.646195	0.417567	-0.301305	-0.956815	0.214416	0.071131	0.876318	...	3.253187	-2.441987	0.020569	0.267396	0.000000	0.074162	0.005500	3.605551	13.000000	3.605551
铅钡	风化	2.242329	3.937307	-0.131353	0.923780	0.853370	-0.584811	0.650707	0.411973	0.013371	1.043858	...	13.632917	-3.664983	0.028021	1.369229	-0.796562	0.336451	0.113199	2.108909	9.857280	12.007019
高钾	无风化	3.165687	3.712288	2.266609	0.363205	0.131918	-1.093726	3.036563	0.114732	-0.013585	0.320182	...	12.000000	-3.464102	-0.507620	0.000000	-2.240723	0.925901	0.857292	-1.388056	-0.011455	-1.824002
高钾	风化	4.187045	4.372977	3.830498	0.187388	0.035114	-1.731995	3.641136	0.044754	0.000000	0.000000	...	0.000000	NaN	0.000000	0.000000	0.000000	0.000000	0.000000	0.000000	0.000000	NaN

4 rows × 112 columns

# Adjusting the code to avoid renaming columns, instead we will capture the group information in the DataFrame index
tables_dict = {}

for glass_type in glass_types:
    for weathering_state in weathering_states:
        subset = grouped_stats.loc[glass_type, weathering_state].unstack().T
        table_name = f"{glass_type}_{weathering_state}"
        tables_dict[table_name] = pd.DataFrame(subset)  # 显式地转换为pd.DataFrame
        
# Looping through the tables_dict and outputting each DataFrame

tables_dict

{'高钾_无风化':          Al2O3       BaO       CaO       CuO     Fe2O3       K2O       MgO  \
 cv    0.664393 -1.972230  0.893838 -2.321136 -1.626433  0.473990 -0.700958   
 kurt -1.409964  3.016385 -0.156702  1.577446  0.472540  1.635379 -1.292382   
 max   1.508084  0.019074  1.647769  0.595531  0.747950  2.210662  0.000000   
 mean  0.776104 -0.179823  0.599071 -0.262942 -0.390464  1.145963 -0.674968   
 min   0.006978 -1.080913 -0.182189 -1.652716 -1.590841  0.000000 -1.332161   
 skew -0.031480 -1.906416  0.378894 -1.180633 -0.394538 -0.184857  0.061519   
 std   0.515638  0.354653  0.535473  0.610324  0.635064  0.543175  0.473124   
 var   0.265882  0.125778  0.286731  0.372495  0.403306  0.295039  0.223846   
 
            Na2O      P2O5       PbO       SO2      SiO2       SnO2       SrO  
 cv   -19.285768 -0.979906 -1.116780 -1.824002  0.114732  -3.464102 -1.050200  
 kurt   7.015733  0.317255 -1.629147 -0.011455  3.036563  12.000000 -2.376521  
 max    0.320182  0.526955  0.000000  0.000000  3.712288   0.000000  0.000000  
 mean  -0.013585 -0.938500 -0.987338 -0.507620  3.165687  -0.007795 -1.723790  
 min   -0.760277 -2.730275 -2.672140 -2.240723  2.266609  -0.093536 -3.774602  
 skew  -2.150622  0.057567 -0.552251 -1.388056 -1.093726  -3.464102 -0.037176  
 std    0.262001  0.919641  1.102639  0.925901  0.363205   0.027002  1.810324  
 var    0.068645  0.845740  1.215812  0.857292  0.131918   0.000729  3.277274  ,
 '高钾_风化':          Al2O3  BaO       CaO       CuO     Fe2O3       K2O       MgO  Na2O  \
 cv    2.498627  NaN -0.962261 -8.191497 -0.250545 -0.997049 -1.572791   NaN   
 kurt  0.025390  0.0  2.287842  0.619598  1.095297 -0.867476 -1.112631   0.0   
 max   0.961580  0.0  0.215634  0.477459 -1.341006  0.000000  0.000000   0.0   
 mean  0.194529  0.0 -0.664817 -0.060020 -1.714985 -0.328478 -0.286859   0.0   
 min  -0.410081  0.0 -1.760008 -0.889020 -2.470072 -0.824068 -0.983686   0.0   
 skew  0.669913  0.0 -0.709483 -1.043688 -1.369695 -0.588570 -1.095736   0.0   
 std   0.486056  0.0  0.639727  0.491651  0.429681  0.327508  0.451170   0.0   
 var   0.236251  0.0  0.409251  0.241720  0.184626  0.107262  0.203554   0.0   
 
           P2O5  PbO  SO2      SiO2  SnO2  SrO  
 cv   -0.562597  NaN  NaN  0.044754   NaN  NaN  
 kurt  2.101884  0.0  0.0  3.641136   0.0  0.0  
 max   0.000000  0.0  0.0  4.372977   0.0  0.0  
 mean -1.326415  0.0  0.0  4.187045   0.0  0.0  
 min  -2.178840  0.0  0.0  3.830498   0.0  0.0  
 skew  1.134407  0.0  0.0 -1.731995   0.0  0.0  
 std   0.746238  0.0  0.0  0.187388   0.0  0.0  
 var   0.556871  0.0  0.0  0.035114   0.0  0.0  ,
 '铅钡_无风化':          Al2O3       BaO       CaO       CuO     Fe2O3       K2O       MgO  \
 cv    3.716292  0.352188 -0.987216 -1.103642 -2.376125 -0.899079 -1.163923   
 kurt  0.214284  1.405046 -0.671685 -0.661301  4.165086 -1.951127 -0.717171   
 max   0.901223  2.031090  0.340114  0.899535  0.554504  0.000000  0.000000   
 mean  0.138882  1.245669 -0.714861 -0.925721 -0.306467 -1.288085 -0.541147   
 min  -0.847107  0.260264 -1.990837 -2.580097 -2.264904 -2.915489 -1.822866   
 skew -0.716711 -0.562582  0.062455  0.086620 -1.989760  0.104047 -0.750761   
 std   0.516125  0.438710  0.705723  1.021664  0.728205  1.158091  0.629853   
 var   0.266385  0.192466  0.498044  1.043798  0.530282  1.341175  0.396715   
 
           Na2O      P2O5       PbO        SO2      SiO2      SnO2       SrO  
 cv    3.684555 -0.818040  0.266446   3.605551  0.214416 -2.441987 -0.893422  
 kurt  8.623783 -1.684970  6.556376  13.000000 -0.956815  3.253187 -2.023534  
 max   0.876318  0.000000  2.610837   0.267396  3.871521  0.000000  0.000000  
 mean  0.071131 -1.449052  2.160856   0.020569  3.013743 -0.311426 -1.114090  
 min  -0.221722 -3.201927  0.468937   0.000000  1.859524 -2.078030 -2.211561  
 skew  2.741762 -0.069394 -2.363412   3.605551 -0.301305 -2.182647  0.129023  
 std   0.262087  1.185383  0.575751   0.074162  0.646195  0.760497  0.995352  
 var   0.068690  1.405133  0.331490   0.005500  0.417567  0.578356  0.990726  ,
 '铅钡_风化':           Al2O3       BaO       CaO       CuO     Fe2O3       K2O       MgO  \
 cv   -11.231984  0.609170 -1.725044 -1.063677 -1.111626 -1.185000 -0.978333   
 kurt  -0.288489 -0.601793 -0.712685 -0.599524 -0.418132 -1.660810 -1.486424   
 max    2.042802  2.167893  0.497358  0.888513  0.000000  0.000000  0.000000   
 mean  -0.087576  1.035546 -0.375654 -0.824426 -0.723172 -0.967980 -0.693444   
 min   -1.826182 -0.181275 -1.877738 -2.764779 -2.575747 -2.970023 -1.841063   
 skew   0.155720 -0.126683 -0.661062  0.043889 -0.837263 -0.456970 -0.340389   
 std    0.983655  0.630823  0.648019  0.876923  0.803897  1.147056  0.678420   
 var    0.967578  0.397938  0.419929  0.768995  0.646251  1.315737  0.460253   
 
            Na2O       P2O5       PbO        SO2      SiO2       SnO2       SrO  
 cv    27.248350 -11.063796  0.221513  12.007019  0.411973  -3.664983 -0.415568  
 kurt   3.996993   1.120939 -0.753508   9.857280  0.650707  13.632917  1.634188  
 max    1.043858   1.188784  3.510396   1.369229  3.937307   0.000000  0.000000  
 mean   0.013371  -0.102296  2.402080   0.028021  2.242329  -0.119384 -1.827413  
 min   -1.093837  -3.229330  1.389649  -0.796562 -0.131353  -1.944122 -2.930869  
 skew  -0.038016  -1.253158  0.239303   2.108909 -0.584811  -3.788951  1.424906  
 std    0.364329   1.131785  0.532092   0.336451  0.923780   0.437542  0.759414  
 var    0.132736   1.280938  0.283122   0.113199  0.853370   0.191443  0.576710  }

'''
with pd.ExcelWriter('E:\\数学建模国赛\\2022数学建模赛题\\C题\\一二表单合并数据统计性分析.xlsx') as writer:
    for sheet_name, df in tables_dict.items():
        df.to_excel(writer, sheet_name=sheet_name,index=True)
'''

"\nwith pd.ExcelWriter('E:\\数学建模国赛\\2022数学建模赛题\\C题\\一二表单合并数据统计性分析.xlsx') as writer:\n    for sheet_name, df in tables_dict.items():\n        df.to_excel(writer, sheet_name=sheet_name,index=True)\n"

2.4描述性统计

tables_dict['高钾_无风化']

	Al2O3	BaO	CaO	CuO	Fe2O3	K2O	MgO	Na2O	P2O5	PbO	SO2	SiO2	SnO2	SrO
cv	0.664393	-1.972230	0.893838	-2.321136	-1.626433	0.473990	-0.700958	-19.285768	-0.979906	-1.116780	-1.824002	0.114732	-3.464102	-1.050200
kurt	-1.409964	3.016385	-0.156702	1.577446	0.472540	1.635379	-1.292382	7.015733	0.317255	-1.629147	-0.011455	3.036563	12.000000	-2.376521
max	1.508084	0.019074	1.647769	0.595531	0.747950	2.210662	0.000000	0.320182	0.526955	0.000000	0.000000	3.712288	0.000000	0.000000
mean	0.776104	-0.179823	0.599071	-0.262942	-0.390464	1.145963	-0.674968	-0.013585	-0.938500	-0.987338	-0.507620	3.165687	-0.007795	-1.723790
min	0.006978	-1.080913	-0.182189	-1.652716	-1.590841	0.000000	-1.332161	-0.760277	-2.730275	-2.672140	-2.240723	2.266609	-0.093536	-3.774602
skew	-0.031480	-1.906416	0.378894	-1.180633	-0.394538	-0.184857	0.061519	-2.150622	0.057567	-0.552251	-1.388056	-1.093726	-3.464102	-0.037176
std	0.515638	0.354653	0.535473	0.610324	0.635064	0.543175	0.473124	0.262001	0.919641	1.102639	0.925901	0.363205	0.027002	1.810324
var	0.265882	0.125778	0.286731	0.372495	0.403306	0.295039	0.223846	0.068645	0.845740	1.215812	0.857292	0.131918	0.000729	3.277274

tables_dict['高钾_风化']

	Al2O3	BaO	CaO	CuO	Fe2O3	K2O	MgO	Na2O	P2O5	PbO	SO2	SiO2	SnO2	SrO
cv	2.498627	NaN	-0.962261	-8.191497	-0.250545	-0.997049	-1.572791	NaN	-0.562597	NaN	NaN	0.044754	NaN	NaN
kurt	0.025390	0.0	2.287842	0.619598	1.095297	-0.867476	-1.112631	0.0	2.101884	0.0	0.0	3.641136	0.0	0.0
max	0.961580	0.0	0.215634	0.477459	-1.341006	0.000000	0.000000	0.0	0.000000	0.0	0.0	4.372977	0.0	0.0
mean	0.194529	0.0	-0.664817	-0.060020	-1.714985	-0.328478	-0.286859	0.0	-1.326415	0.0	0.0	4.187045	0.0	0.0
min	-0.410081	0.0	-1.760008	-0.889020	-2.470072	-0.824068	-0.983686	0.0	-2.178840	0.0	0.0	3.830498	0.0	0.0
skew	0.669913	0.0	-0.709483	-1.043688	-1.369695	-0.588570	-1.095736	0.0	1.134407	0.0	0.0	-1.731995	0.0	0.0
std	0.486056	0.0	0.639727	0.491651	0.429681	0.327508	0.451170	0.0	0.746238	0.0	0.0	0.187388	0.0	0.0
var	0.236251	0.0	0.409251	0.241720	0.184626	0.107262	0.203554	0.0	0.556871	0.0	0.0	0.035114	0.0	0.0

tables_dict['铅钡_无风化']

	Al2O3	BaO	CaO	CuO	Fe2O3	K2O	MgO	Na2O	P2O5	PbO	SO2	SiO2	SnO2	SrO
cv	3.716292	0.352188	-0.987216	-1.103642	-2.376125	-0.899079	-1.163923	3.684555	-0.818040	0.266446	3.605551	0.214416	-2.441987	-0.893422
kurt	0.214284	1.405046	-0.671685	-0.661301	4.165086	-1.951127	-0.717171	8.623783	-1.684970	6.556376	13.000000	-0.956815	3.253187	-2.023534
max	0.901223	2.031090	0.340114	0.899535	0.554504	0.000000	0.000000	0.876318	0.000000	2.610837	0.267396	3.871521	0.000000	0.000000
mean	0.138882	1.245669	-0.714861	-0.925721	-0.306467	-1.288085	-0.541147	0.071131	-1.449052	2.160856	0.020569	3.013743	-0.311426	-1.114090
min	-0.847107	0.260264	-1.990837	-2.580097	-2.264904	-2.915489	-1.822866	-0.221722	-3.201927	0.468937	0.000000	1.859524	-2.078030	-2.211561
skew	-0.716711	-0.562582	0.062455	0.086620	-1.989760	0.104047	-0.750761	2.741762	-0.069394	-2.363412	3.605551	-0.301305	-2.182647	0.129023
std	0.516125	0.438710	0.705723	1.021664	0.728205	1.158091	0.629853	0.262087	1.185383	0.575751	0.074162	0.646195	0.760497	0.995352
var	0.266385	0.192466	0.498044	1.043798	0.530282	1.341175	0.396715	0.068690	1.405133	0.331490	0.005500	0.417567	0.578356	0.990726

tables_dict['铅钡_风化']

	Al2O3	BaO	CaO	CuO	Fe2O3	K2O	MgO	Na2O	P2O5	PbO	SO2	SiO2	SnO2	SrO
cv	-11.231984	0.609170	-1.725044	-1.063677	-1.111626	-1.185000	-0.978333	27.248350	-11.063796	0.221513	12.007019	0.411973	-3.664983	-0.415568
kurt	-0.288489	-0.601793	-0.712685	-0.599524	-0.418132	-1.660810	-1.486424	3.996993	1.120939	-0.753508	9.857280	0.650707	13.632917	1.634188
max	2.042802	2.167893	0.497358	0.888513	0.000000	0.000000	0.000000	1.043858	1.188784	3.510396	1.369229	3.937307	0.000000	0.000000
mean	-0.087576	1.035546	-0.375654	-0.824426	-0.723172	-0.967980	-0.693444	0.013371	-0.102296	2.402080	0.028021	2.242329	-0.119384	-1.827413
min	-1.826182	-0.181275	-1.877738	-2.764779	-2.575747	-2.970023	-1.841063	-1.093837	-3.229330	1.389649	-0.796562	-0.131353	-1.944122	-2.930869
skew	0.155720	-0.126683	-0.661062	0.043889	-0.837263	-0.456970	-0.340389	-0.038016	-1.253158	0.239303	2.108909	-0.584811	-3.788951	1.424906
std	0.983655	0.630823	0.648019	0.876923	0.803897	1.147056	0.678420	0.364329	1.131785	0.532092	0.336451	0.923780	0.437542	0.759414
var	0.967578	0.397938	0.419929	0.768995	0.646251	1.315737	0.460253	0.132736	1.280938	0.283122	0.113199	0.853370	0.191443	0.576710

'''
均值（Mean）:
SiO2（二氧化硅）: 在未风化的玻璃中，高钾玻璃的SiO2含量均值显著高于铅钡玻璃。
然而，风化过程中，两者的差异缩小，可能表明风化过程影响了SiO2的含量。
Al2O3（氧化铝）: 未风化的玻璃中，高钾玻璃的氧化铝含量均值大于铅钡玻璃。
风化后，铅钡玻璃的氧化铝含量均值超过高钾玻璃，这可能反映了风化对氧化铝的显著影响。
标准差（Std）和变异系数（CV）:
Na2O（氧化钠）: 未风化玻璃中，铅钡玻璃的氧化钠含量均值较高，但风化后，高钾玻璃的氧化钠含量均值增加。
这可能表明风化过程改变了氧化钠的分布。
CaO（氧化钙）: 在所有条件下，铅钡玻璃的氧化钙含量均值均大于高钾玻璃，反映了铅钡玻璃的特有组成。
偏度（Skew）和峰度（Kurt）:
PbO（氧化铅）和BaO（氧化钡）: 在高钾和铅钡玻璃之间，这些成分的分布偏度和峰度存在显著差异。
这可能反映了不同类型玻璃的结构差异和风化过程的不同影响。
特定元素观察：
二氧化硅 (SiO2): 未风化的高钾玻璃的二氧化硅含量约为铅钡玻璃的两倍，但风化后，两者的差异减小。
这可能反映了风化对二氧化硅含量的影响。
氧化铝 (Al2O3): 风化可能对氧化铝含量有显著影响，特别是在铅钡玻璃中。
'''

'\n均值（Mean）:\nSiO2（二氧化硅）: 在未风化的玻璃中，高钾玻璃的SiO2含量均值显著高于铅钡玻璃。\n然而，风化过程中，两者的差异缩小，可能表明风化过程影响了SiO2的含量。\nAl2O3（氧化铝）: 未风化的玻璃中，高钾玻璃的氧化铝含量均值大于铅钡玻璃。\n风化后，铅钡玻璃的氧化铝含量均值超过高钾玻璃，这可能反映了风化对氧化铝的显著影响。\n标准差（Std）和变异系数（CV）:\nNa2O（氧化钠）: 未风化玻璃中，铅钡玻璃的氧化钠含量均值较高，但风化后，高钾玻璃的氧化钠含量均值增加。\n这可能表明风化过程改变了氧化钠的分布。\nCaO（氧化钙）: 在所有条件下，铅钡玻璃的氧化钙含量均值均大于高钾玻璃，反映了铅钡玻璃的特有组成。\n偏度（Skew）和峰度（Kurt）:\nPbO（氧化铅）和BaO（氧化钡）: 在高钾和铅钡玻璃之间，这些成分的分布偏度和峰度存在显著差异。\n这可能反映了不同类型玻璃的结构差异和风化过程的不同影响。\n特定元素观察：\n二氧化硅 (SiO2): 未风化的高钾玻璃的二氧化硅含量约为铅钡玻璃的两倍，但风化后，两者的差异减小。\n这可能反映了风化对二氧化硅含量的影响。\n氧化铝 (Al2O3): 风化可能对氧化铝含量有显著影响，特别是在铅钡玻璃中。\n'

2.5 箱线图绘制

import matplotlib.pyplot as plt  # or another font that supports the special character
import seaborn as sns
plt.rcParams['font.family'] = 'DejaVu Sans'
# Correct the condition for each DataFrame
data_high_potassium_erosion = data[(data['类型'] == '高钾') & (data['表面风化'] == '风化')]
data_high_potassium_no_erosion = data[(data['类型'] == '高钾') & (data['表面风化'] == '无风化')]
data_lead_barium_erosion = data[(data['类型'] == '铅钡') & (data['表面风化'] == '风化')]
data_lead_barium_no_erosion = data[(data['类型'] == '铅钡') & (data['表面风化'] == '无风化')]

# Create a new DataFrame for boxplot
boxplot_data_high_potassium_erosion = data_high_potassium_erosion.melt(id_vars=['类型', '表面风化'], value_vars=component_cols)
boxplot_data_high_potassium_no_erosion = data_high_potassium_no_erosion.melt(id_vars=['类型', '表面风化'], value_vars=component_cols)
boxplot_data_lead_barium_erosion = data_lead_barium_erosion.melt(id_vars=['类型', '表面风化'], value_vars=component_cols)
boxplot_data_lead_barium_no_erosion = data_lead_barium_no_erosion.melt(id_vars=['类型', '表面风化'], value_vars=component_cols)

# Set the figure size
plt.figure(figsize=(20, 45))

# Create subplots
fig, axs = plt.subplots(2, 2, figsize=(12, 8))

# Reorder the data and titles to switch the positions of the plots
data_list = [boxplot_data_lead_barium_erosion, boxplot_data_lead_barium_no_erosion, boxplot_data_high_potassium_erosion, boxplot_data_high_potassium_no_erosion]
titles = ['Lead Barium Glass with Erosion', 'Lead Barium Glass without Erosion', 'High Potassium Glass with Erosion', 'High Potassium Glass without Erosion']

# Generate boxplots for each condition
for ax, data, title in zip(axs.flatten(), data_list, titles):
    sns.boxplot(y='variable', x='value', data=data, ax=ax, orient="h")
    ax.set_ylabel('Chemical Component')
    ax.set_xlabel('Content (%)')
    ax.set_title('{}'.format(title))
    ax.invert_yaxis() # Invert the y-axis labels

# Adjust layout
plt.tight_layout()
plt.show()

'''
铅钡玻璃：
风化前后的变化:

中位数下降: 大部分化学成分的中位数在风化过程中有所下降，特别是Al2O3、K2O、SiO2、CaO、MgO、Na2O。
这可能反映了风化过程中这些成分的流失。
离散程度下降: 这些成分的离散程度也在风化过程中减小，表明风化可能使这些成分的含量变得更一致。
特定化学成分观察:

铝氧化物 (Al2O3): 风化使铝氧化物的中位数下降，分布变得更紧密。
硅氧化物 (SiO2): 风化使硅氧化物的中位数下降，分布也更紧密。
钾氧化物 (K2O) 和 钠氧化物 (Na2O): 分布变得更紧密，中位数下降。
高钾玻璃：
风化前后的变化:

中位数下降: 大部分化学成分的中位数也在风化过程中下降，尤其是K2O和Na2O，与铅钡玻璃相似。
离散程度变化: 不同于铅钡玻璃，某些化学成分的分布在风化后变得更广，例如硅氧化物 (SiO2) 和钾氧化物 (K2O)。
特定化学成分观察:

铝氧化物 (Al2O3): 高钾玻璃的铝氧化物分布在风化后变得更广泛。
硅氧化物 (SiO2): 风化过程似乎没有明显改变硅氧化物的中位数，但分布变得更广。
钾氧化物 (K2O) 和 钠氧化物 (Na2O): 中位数大幅下降，分布更广。
总结：
通过这些箱线图，我们可以观察到风化过程对玻璃成分的具体影响。
对于铅钡玻璃和高钾玻璃，风化过程都可能导致某些成分的流失，但具体的影响程度可能会因为玻璃的类型和成分的种类而有所不同。
这些观察有助于我们理解风化对不同类型玻璃化学成分的影响，进而为文物保护和修复提供指导。
'''

'\n铅钡玻璃：\n风化前后的变化:\n\n中位数下降: 大部分化学成分的中位数在风化过程中有所下降，特别是Al2O3、K2O、SiO2、CaO、MgO、Na2O。\n这可能反映了风化过程中这些成分的流失。\n离散程度下降: 这些成分的离散程度也在风化过程中减小，表明风化可能使这些成分的含量变得更一致。\n特定化学成分观察:\n\n铝氧化物 (Al2O3): 风化使铝氧化物的中位数下降，分布变得更紧密。\n硅氧化物 (SiO2): 风化使硅氧化物的中位数下降，分布也更紧密。\n钾氧化物 (K2O) 和 钠氧化物 (Na2O): 分布变得更紧密，中位数下降。\n高钾玻璃：\n风化前后的变化:\n\n中位数下降: 大部分化学成分的中位数也在风化过程中下降，尤其是K2O和Na2O，与铅钡玻璃相似。\n离散程度变化: 不同于铅钡玻璃，某些化学成分的分布在风化后变得更广，例如硅氧化物 (SiO2) 和钾氧化物 (K2O)。\n特定化学成分观察:\n\n铝氧化物 (Al2O3): 高钾玻璃的铝氧化物分布在风化后变得更广泛。\n硅氧化物 (SiO2): 风化过程似乎没有明显改变硅氧化物的中位数，但分布变得更广。\n钾氧化物 (K2O) 和 钠氧化物 (Na2O): 中位数大幅下降，分布更广。\n总结：\n通过这些箱线图，我们可以观察到风化过程对玻璃成分的具体影响。\n对于铅钡玻璃和高钾玻璃，风化过程都可能导致某些成分的流失，但具体的影响程度可能会因为玻璃的类型和成分的种类而有所不同。\n这些观察有助于我们理解风化对不同类型玻璃化学成分的影响，进而为文物保护和修复提供指导。\n'

你可能感兴趣的:(数学建模python库,数学建模,python,scikit-learn)

【详细解析！】Python语法基础小新在学习 python python 开发语言
python基础语法1.优先级：在运算代码的时候，我们优先级是先乘除后加减注意：1.1：在python中，2/3=0.666666而不是0；在python里面的相除就是数学意义上的相除1.2：某一个结果为1.666666666665，而不是667，是因为我们在编程里面是一般是没有四舍五入的概念的；这个结果我们在代码里面称之为浮点数.IEE745标准，在这套规则下，我们在内存中表示浮点数的时候，可能
Python 大数据分析（二）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/5058e6970bd2a8d818ecc1f7f8fef74a译者：飞龙协议：CCBY-NC-SA4.0第六章：第五章处理缺失值和相关性分析学习目标到本章结束时，你将能够：使用PySpark检测和处理数据中的缺失值描述变量之间的相关性计算PySpark中两个或多个变量之间的相关性使用PySpark创建相关矩阵在本章中，我们将使用Iris数据集处理
Python机器学习：从零基础到项目实战 Yuner2000 Python 机器学习人工智能
目录第一部分：思想与基石——万法归宗，筑基问道第1章：初探智慧之境——机器学习世界观1.1何为学习？从人类学习到机器智能1.2机器学习的“前世今生”：一部思想与技术的演进史1.3为何是Python？——数据科学的“通用语”1.4破除迷思：AI是“神”还是“器”？第2章：工欲善其事——Python环境与核心工具链2.1“乾坤在握”：Anaconda与JupyterNotebook的安装与配置2.2“
python里class转换_python实现class对象转换成json/字典的方法八决子 python里class转换
python实现class对象转换成json/字典的方法发布于2016-03-2808:05:44|153次阅读|评论:0|来源:网友投递Python编程语言Python是一种面向对象、解释型计算机程序设计语言，由GuidovanRossum于1989年底发明，第一个公开发行版发行于1991年。Python语法简洁而清晰，具有丰富和强大的类库。它常被昵称为胶水语言，它能够把用其他语言制作的各种模块
解密 Python 的 MRO：C3 线性化如何优雅解决多重继承的菱形难题》
《解密Python的MRO：C3线性化如何优雅解决多重继承的菱形难题》引言：继承的优雅与复杂在Python的面向对象编程中，继承是一种强大的机制，它让我们能够复用代码、构建抽象层次、实现多态行为。然而，当我们引入多重继承时，继承体系的复杂性也随之而来，尤其是著名的“菱形继承问题”。Python通过一种称为C3线性化（C3Linearization）的算法来解决方法解析顺序（MethodResolu
《深入理解 Python 的对象构造机制：__new__ 与 __init__ 的本质区别与实战应用》清水白石008 开发语言学习笔记课程教程 python 开发语言
《深入理解Python的对象构造机制：new与init的本质区别与实战应用》引言：对象的诞生之谜在Python的面向对象编程中，我们习惯于使用__init__方法来初始化对象。但你是否曾注意到，还有一个鲜为人知却至关重要的魔法方法——__new__？它是对象构造过程的起点，掌控着类实例的真正创建。理解__new__与__init__的区别，不仅能帮助你掌握Python的对象模型，还能在构建不可变类
Day9: OpenCV学习（一）—— 图像基础
系列文章目录上一篇：Day8：Python工程化——模块、包文章目录系列文章目录前言一、安装和导入1.安装二、图像认识1.图像2.图像分类三、基础图像操作1.图像读取2.图像显示3.图像裁剪4.图形尺寸修改5.图像保存6.图像绘制7.视频捕获即显示总结前言OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成
python基础语法复习04——函数洛华363 python python
python基础语法目录python基础语法01——基本类型python基础语法02——复合类型python基础语法03——语句构成文章目录python基础语法目录一、初识函数1.定义2.调用二、函数的传参1.位置传参2.关键词传参3.参数默认值4.可变位置参数5.可变关键词参数6.参数解包7.值传递与引用传递总结一、初识函数函数是Python中可重复使用的代码块，用于执行特定任务。通过将代码封装
ubuntu18.04安装geemap 阿西是有梦想的咸鱼 python编程之路遥感影像处理可视化可视化 python ubuntu
文章目录安装测试GEE提供了JavaScript和PythonAPI，可以向EarthEngine服务器发出计算请求。与GEEJavaScriptAPI相比，PythonAPI缺乏易于理解的操作文档和交互式可视化结果的功能。由此，geemap诞生并填补了这一空白[1]。这里给大家介绍下我折腾了一晚上才搞定的geemap的安装及测试过程。这里是geemap的GitHub参考链接。安装如Github中
python进行geeMap环境安装箭梭_ python
近期需要利用geemap搭建一个界面，试了一下相应环境的配置，踏了挺多坑，下面我给大家具体介绍一下geemap的环境搭建：（1）geemap是基于googleearthengine的接口进行开发的，在安装geemap之前，需要先进行earthengie包的安装，参考链接如下：https://zhuanlan.zhihu.com/p/29186942#comment-549701602?notifi
API开发全攻略：从入门到精通的企业级API架构与实战 Android洋芋架构 API设计 RESTful API 微服务架构实战案例
简介API开发已成为现代软件架构的核心能力，掌握API设计与实现技术能显著提升开发效率和系统可扩展性。本文将从零开始，全面解析API的基础概念、架构设计、安全认证、性能优化等关键技术点，并提供完整的Python和Go语言代码实战示例，帮助开发者构建高性能、可扩展的企业级API系统。本文旨在为初学者和进阶开发者提供一份全面的API开发指南。内容涵盖API的基础概念、类型分类、架构设计、安全认证、性能
2023年NOC大赛创客智慧编程赛项Python 复赛模拟题（二）青少儿编程课堂少儿编程资料大全付费专栏 python numpy 开发语言 noc大赛真题 noc试题
题目来自：NOC大赛创客智慧编程赛项Python复赛模拟题(二)NOC大赛创客智慧编程赛项Python复赛模拟题（二）第一题：编写一个成绩评价系统，当输入语文、数学和英语三门课程成绩时，输出三门课程总成绩及其等级。(1)程序提示用户输入三个数字，数字分别表示语文、数学、英语分数，对应的变量名称是Chinese、Math、English,并计算三个分数的和(score)进行输出。注：input()函
【RS】GEE(Python)：大规模分析与导出数据
在前面的章节中，我们探讨了如何在GoogleEarthEngine(GEE)上进行数据加载、处理、分析和可视化。现在，我们将进一步扩展，探索如何处理大规模的数据集和执行复杂的分析任务。通过GEE的云计算能力，用户可以在全球范围内执行大规模的时空分析，并高效地将处理结果导出为所需的格式。大规模分析的基本原则在GEE中，大规模分析是通过ImageCollection和FeatureCollection
【Python篇】Python基础——08day.面向对象编程中类和对象的基本概念及属性和方法的常见分类和使用场景 WXX_s python基础篇 python 分类开发语言学习
目录前言一、类和对象1.类→Class1.1概念1.2创建2.对象→Object2.1概念2.2创建二、属性和方法1.实例属性2.实例方法3.类属性4.类方法5.静态方法5.1综合应用6.构造方法7.初始化方法8.魔术方法8.1常用方法8.2案例参考总结前言这章讲的面向对象编程（Object-OrientedProgramming，简称OOP）是一种通过组织对象来设计程序的编程方法。为什么需要类和
【Python篇】Python基础——04day.Python中运算（简单部分，如果会的可以直接跳过）
文章目录前言一.运算符1.1算术运算符1.2比较运算符1.3逻辑运算符1.4赋值运算符1.5位运算符1.6身份运算符1.7成员运算符1.8三目运算符1.9优先级二.表达式2.1算术表达式2.2比较表达式2.3逻辑表达式2.4赋值表达式2.5成员表达式2.6身份表达式2.7三元表达式2.8函数调用表达式三.推导式3.1列表推导式3.2字典推导式3.3集合推导式总结前言这一章写的是在python中会用
Python 现代时间序列预测第二版（五）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/22eab741fce9c15dfad894ecf37bdd51译者：飞龙协议：CCBY-NC-SA4.0第十七章：概率预测及更多在整本书中，我们学习了生成预测的不同技术，包括一些经典方法，使用机器学习以及一些深度学习架构。但我们一直在关注一种典型的预测问题——为连续时间序列生成点预测，并且没有层级关系且历史数据足够丰富。我们之所以这样做，是因为这
自动化测试中，测试数据如何管理？鱼鱼说测试 java linux 服务器
今晚在某个测试群，看到有人问了一个问题：把测试数据放配置文件读取和放文件通过函数调用读取有什么区别？Python接口自动化测试零基础入门到精通（2025最新版）当时我下意识的这么回答：数据量越大，配置文件越臃肿，放在专门的数据文件（比如excel，csv），方便针对性的维护。乍看没毛病，但回头和人讨论这个问题的时候，就认真思考了一下这个问题，下面是我的一些思考和讨论的一些结果，仅供参考。。。自动化
基于selenium的pyse自动化测试框架鱼鱼说测试 selenium 测试工具
Python接口自动化测试零基础入门到精通（2025最新版）介绍：pyse基于selenium（webdriver）进行了简单的二次封装，比selenium所提供的方法操作更简洁。特点：默认使用CSS定位，同时支持多种定位方法（id\name\class\link_text\xpath\css）。本框架只是对selenium（webdriver）原生方法进行了简单的封装，精简为大约30个方法，这些
自动化测试准备鱼鱼说测试自动化测试
什么是自动化测？Python接口自动化测试零基础入门到精通（2025最新版）首先理清自动化测试的概念，广义上来讲，自动化包括一切通过工具（程序）的方式来代替或辅助手工测试的行为都可以看做自动化，包括性能测试工具（loadrunner、jmeter）,或自己所写的一段程序，用于生成1到100个测试数据。狭义上来讲，通工具记录或编写脚本的方式模拟手工测试的过程，通过回放或运行脚本来执行测试用例，从而代
重塑未来：AI如何重新定义全栈开发熊猫钓鱼>_> 人工智能
在传统认知中，全栈开发者被誉为技术界的“全能选手”。——他们需要精通前端界面构建（HTML/CSS/JavaScript）、后端业务逻辑实现（Python/Java/Node.js）、数据库设计优化（MySQL/MongoDB）以及服务器部署运维（Linux/Docker）。这种“一人包打天下”的能力模型长期被视为高效开发的黄金标准，尤其受到创业公司和小型团队的青睐，因为它能大幅减少沟通成本，加速
OpenCV稠密光流法可直接运行的例程（python） indrrra opencv python 人工智能
#dense_optical_flow.pyimportcv2importnumpyasnpimportargparsedefdense_optical_flow(method,video_path,params=[],to_gray=False):#读取视频cap=cv2.VideoCapture(video_path)#读取第一帧ret,old_frame=cap.read()#创建HSV并使
分布式锁特点、以及用python3实现redis分布式锁数据知道 python3案例和总结分布式 redis 数据库 python
更多内容请见：python3案例和总结-专栏介绍和目录文章目录一、Redis分布式锁核心原理1.1Redis锁机制1.2锁释放二、基础实现代码2.1使用`redis-py`客户端2.2分布式锁类三、使用示例3.1基础锁操作3.2装饰器模式四、高级特性实现4.1Redlock算法（高可用方案）五、生产环境最佳实践5.1锁粒度控制5.2异常处理5.3监控与调试5.4重试机制六、测试代码6.1并发测试6
php、go、python后端接口签名实现奇华智能后台开发 linux 签名接口安全
1.php实现/**生成签名，$args为请求参数，$key为私钥*/functionmakeSignature($args,$key){if(isset($args['sign'])){$oldSign=$args['sign'];unset($args['sign']);}else{$oldSign='';}ksort($args);$requestString='';foreach($arg
python第一次作业
1.技术面试题（1）TCP与UDP的区别是什么？**答：1.TCP是面向连接的协议，而UDP是元连接的协议2.TCP协议传输是可靠的，而UDP协议的传输是“尽力而为3.TCP是可以实现流控，而UDP不行4.TCP可以实现分段，而UDP不行5.TCP的传输速率较慢，占用资源较大，UDP传输速率快，占用资源小。TCP/UDP的应用场景不同TCP适合可靠性高的效率要求低的，UDP可靠性低，效率高。（2）
python www_hhhhhhh python java 面试
1.技术面试题（1）解释Linux中的进程、线程和守护进程的概念，以及如何管理它们？答：进程：是操作系统进行资源分配的基本单位，拥有独立的地址空间、进程控制块，每个进程之间相互隔离。例如，打开一个终端窗口会启动一个bash进程。线程：是操作系统调度的基本单位，隶属于进程，共享进程的资源，但有独立的线程控制块和栈。线程切换开销远小于进程。例如，一个Web服务器的单个进程中，多个线程可同时处理不同客户
Python lambda表达式：匿名函数的适用场景与限制梦幻南瓜 python python 服务器 linux
目录1.Lambda表达式概述1.1Lambda表达式的基本语法1.2简单示例2.Lambda表达式的核心特点2.1匿名性2.2简洁性2.3即时性2.4函数式编程特性3.Lambda表达式的适用场景3.1作为高阶函数的参数3.2简单的数据转换3.3条件筛选3.4GUI编程中的回调函数3.5Pandas数据处理4.Lambda表达式的限制4.1只能包含单个表达式4.2没有语句4.3缺乏文档字符串4.
【python】 www_hhhhhhh python 面试职场和发展
1.技术面试题（1）TCP与UDP的区别是什么？答：TCP（传输控制协议）和UDP（用户数据报协议）是两种常见的传输层协议，主要区别在于连接方式和可靠性。TCP是面向连接的协议，传输数据前需建立连接，通过三次握手确保连接可靠，传输过程中有确认、重传和顺序控制机制，保证数据完整、按序到达，适用于网页浏览、文件传输等对可靠性要求高的场景。UDP是无连接的协议，无需建立连接即可发送数据，不保证数据可靠传
Python函数的返回值
1.返回值定义及案例：2.返回值与print的区别：print仅仅是打印在控制台，而return则是将return后面的部分作为返回值作为函数的输出，可以用变量接走，继续使用该返回值做其它事。3.保存函数的返回值如果一个函数return返回了一个数据，那么想要用这个数据，那么就需要保存.#定义函数defadd2num(a,b): returna+b#调用函数，顺便保存函数的返回值result=
python怎么把函数返回值_python函数怎么返回值
python函数使用return语句返回“返回值”，可以将其赋给其它变量作其它的用处。所有函数都有返回值，如果没有return语句，会隐式地调用returnNone作为返回值。python函数使用return语句返回"返回值"，可以将其赋给其它变量作其它的用处。所有函数都有返回值，如果没有return语句，会隐式地调用returnNone作为返回值。一个函数可以存在多条return语句，但只有一条
Python星球日记 - 第8天：函数基础 Code_流苏 Python星球日记 python 函数 def关键字函数参数返回值
引言：上一篇：Python星球日记-第7天：字典与集合名人说：路漫漫其修远兮，吾将上下而求索。——屈原《离骚》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）目录一、函数的定义与调用1.什么是函数？2.如何定义函数-`def`关键字3.函数调用方式二、参数与返回值1.函数参数类型2.如何传递参数3.返回值和`return`语句三、局部变量与全局变量1.变量作用域概念2.局部变
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d