丝绸之路是古代中西方文化交流的通道,其中玻璃是早期贸易往来的宝贵物证。早期的玻璃在西亚和埃及地区常被制作成珠形饰品传入 我 国, 我 国古代玻璃吸收其技术后在本土就地取材制作,因此与外来的玻璃制品外观相似,但化学成分却不相同。玻璃的主要原料是石英砂,主要化学成分是二氧化硅(SiO2)。由于纯石英砂的熔点较高,为了降低熔化温度,在炼制时需要添加助熔剂。古代常用的助熔剂草木灰、天然泡碱、硝石和铅矿石等,并添加石灰石作为稳定剂,石灰石煅烧以后转化为氧化钙( CaO)。添加的助熔剂不同,其主要化学成分也不同。例如,铅钡玻璃在烧制 过程 中加入铅矿石作为助熔剂,其氧化铅( PbO)、氧化钡 BaO 的 含量较高,通常被认为是我国自己发明的玻璃品种,楚文化的玻璃就是以铅钡玻璃为主。钾玻璃是以含钾量高的物质如草木灰作为助熔剂烧制而成 的 ,主要流行于我国 岭南以及东南亚和印度等区域。
现有一批我国古代玻璃制品的相关数据 考古工作者依据这些文物样品的化学成分和其他检测手段已将其分为高钾玻璃和铅钡玻璃两种类型。附件 表单 1给出了这些 文物的分类信息,附件 表单 2给出了 相应的主要成分所占比例(空白处表示未检测到该成分)。这些数据的特点是成分性,即各成分比例 的 累加和应为 100%,但因检测手段等原因可能导致其成分比例 的 累加和非 100%的情况 。本题中将成分比例累加和介于 85%~105%之间的数据视为有效数据。请你们团队依据附件中的相关数据进行分析建模,解决以下问题:
问题1 :对这些玻璃文物的表面风化与其玻璃类型、纹饰和颜色的关系进行分析;结合玻璃的类型,分析文物样品表面有无风化化学成分含量的统计规律 并根据风化点检测数据,预测其风化前的化学成分含量 。
解决方案:(1)该题是一个很典型的统计分析问题。并且表面风化、其玻璃类型、纹饰、和颜色几个特征都是因子变量。因此分析它们之间的关系,应该使用卡方检验、列联表分析、马赛克图可视化等可视化分析方法。并且针对因子数量较少的特征之间,不适合使用对应分析。
(2)结合玻璃的类型,分析文物样品表面有无风化化学成分含量的统计规律。这个可以使用方差分析等手段进行分析。例如下面的分析结果,每种情况的所占情况一目了然,可以进行相应的分析,然后进一步的进行多因素方差分析进行定量分析即可。预测风化前的化学成分含量,可以建立相应的回归类预测模型,或者参数估计模型。
问题2 :依据附件数据分析高钾玻璃、铅钡玻璃的分类规律;对于每个类别选择合适的化学成分对其进行亚类划分,给出具体的划分方法及划分结果并对分类结果的合理性和敏感性进行分析 。
解决方案:(1)分析分类规律。这一问比较简单,使用一些数据可视化方法进行辅助,即可发现数据的规律。
(2)对于每个类别选择合适的化学成分对其进行亚类划分。亚分类本质是一个数据聚类的问题。可以采用特征选择、或者特征提取的一些方法,对数据进行特征的处理与变换(方法有很多),从而可以更方便的对数据进行聚类。而对数据进行聚类的方法也有很多,使用的不同的方式组合,可能获得不同的数据亚分类结果。合理性和敏感性分析上可以采用数值量化、获得可视化的方式更直观的表示。聚类评价通常使用轮廓系数、Gap统计量等。例如:如下图所示的一种分析结果。
问题3 :对附件表单 3中未知类别玻璃文物的化学成分进行分析,鉴别其所属类型 并对分类结果的敏感性进行分析。
解决方案:(1)预测表单3中的数据类别。这是一个分类问题,该问题建立相应的分类模型即可,方法有很多种,简单的方法或者复杂的方法,提供的程序中都有展示。决策树、随机森林、支持向量机、神经网络等等都行。但是不同的算法分类精度是不一样的。例如下面的图像。
问题4 :针对不同类别的玻璃文物样品,分析其化学成分之间的关联关系,并比较不同类别之间的化学成分关联关系的差异性 。
解决方法:分析化学成分之间的关联关系这是一个相关性分析的问题,如:相关性分析、回归分析、机器学习回归等算法,都可以进行相应的预测。可以单个化学成分间的分析,也可以统一分析多个化学成分的关联。而差异性可以对比分析前面的分析结果,进行对比分析即可。例如,如下图所示的分析结果,根据改图就可以i对差异进行总结与统计。
相应的程序和分析结果可以通过下面的链接获取。
正在为您运送作品详情