2022数模国赛c题——赛后总结

目录

  • 前言
  • 一、竞赛时间安排
  • 二、建模方法
    • 1.第一问
      • 1.1 对这些玻璃文物的表面风化与其玻璃类型、纹饰和颜色的关系进行分析;
      • 1.2 结合玻璃的类型,分析文物样品表面有无风化化学成分含量的统计规律
      • 1.3 根据风化点检测数据,预测其风化前的化学成分含量
    • 2.第二问
      • 2.1 依据附件数据分析高钾玻璃、铅钡玻璃的分类规律;
      • 2.2 对于每个类别选择合适的化学成分对其进行亚类划分,给出具体的划分方法及划分结果。
      • 2.3 对分类结果的合理性和敏感性进行分析
    • 3.第三问
      • 3.1 对附件表单 3 中未知类别玻璃文物的化学成分进行分析,鉴别其所属类型
      • 3.2 对分类结果的敏感性进行分析
    • 4.第四问
      • 4.1 针对不同类别的玻璃文物样品,分析其化学成分之间的关联关系
      • 4.2 比较不同类别之间的化学成分关联关系的差异性
  • 总结


前言

提示:本人大二,第一次参加国赛,建模方法可能比较稚嫩,想看专业解答的可以点左上角了(不是)
我个人借鉴的c题答案来自川川菜鸟(c站数模人都应该知道吧)
以下是我个人的数学建模专栏(会不定时持续更新)
https://blog.csdn.net/zedkyx/category_11863143.html?spm=1001.2014.3001.5482


一、竞赛时间安排

本次比赛从9月15日晚上6点发题开始至9月18日晚上22点最后一次提交md5码结束。
个人的时间安排如下(本人负责建模):
9.15 晚上:查找论文、1.1、1.2、2.1 建模
9.16 一天:对2.2方法进行建模和修改
9.17 早上:四级
9.17 下午+晚上:对于2.3和3.2的合理性分析和敏感性分析进行研究并辅助编程及提供论文思路,查找资料得到1.3的思路
9.18 上午~下午2点:4.1的相关系数分析 和 4.2的典型相关分析
9.18 下午~晚上:1.3 草草结束

二、建模方法

1.第一问

1.1 对这些玻璃文物的表面风化与其玻璃类型、纹饰和颜色的关系进行分析;

 我当时看到第一小问的时候想简单了,觉得只是作柱状图/折线图再进行分析就可以了,但实际上遇到这种类型的问题还是要进行专业的相关性分析(实际编程也很容易)。

1.2 结合玻璃的类型,分析文物样品表面有无风化化学成分含量的统计规律

 有无风化很容易让人联想到反向使用logistic回归模型,只需要适当调整一下参数就可以了。

1.3 根据风化点检测数据,预测其风化前的化学成分含量

  标答是决策树。
  个人的想法:首先查找了很多化学方面的资料(以及题设里本身就有的文字),得到高钾和铅钡两个玻璃类型下分别最具代表性的化学成分,因为觉得其他的数据缺失值太多,而且受风化程度无法直从无风化和风化两个指标来计算(很显然会有风化的各个阶段),然后再根据上一问中得到的回归系数建立相应的拟合方程,实话说最后由于时间关系,系数矩阵和常数矩阵选取的蛮仓促的,尤其是系数矩阵还差很多因素还没有结果,所以最后结果也不太尽如人意。

2.第二问

2.1 依据附件数据分析高钾玻璃、铅钡玻璃的分类规律;

   还是和1.2一样,很快想到了支持向量机这种方式(还去多把第一问的颜色、纹饰、风化程度为三个自变量做了一遍来水字数哈哈哈哈哈),可以做的优化还有引入松弛变量(敏感性分析)和拉格朗日变换(当时没怎么看下去)

2.2 对于每个类别选择合适的化学成分对其进行亚类划分,给出具体的划分方法及划分结果。

   我们先确定最佳分类的数量。可以先用轮廓值对K-Means方法得到对聚类结果进行评价,并据此来确定最佳的类别数。(要聚类的对象是由2.1得到的三个具有代表性的化学元素)
   具体结果就不再阐述了,如果有matlab在数学建模中的应用这本书的话就知道和葡萄酒的评价很想(优化方案就是和别的例如层次聚类和c-means进行比较)

2.3 对分类结果的合理性和敏感性进行分析

 合理性: 对于总样本以及高钾和铅钡两个类型分别进行轮廓值分析,确定最佳类别数的合理性
 敏感性: 原来有想过k- means的距离优化用图论的相关知识套,但最后知识改了距离的计算公式(manhattan和切比雪夫)

3.第三问

3.1 对附件表单 3 中未知类别玻璃文物的化学成分进行分析,鉴别其所属类型

 将这八个文物的数据进行(2.1)类似的处理,将八个文物分别归到高钾和铅钡两个大类中。

3.2 对分类结果的敏感性进行分析

  进行(2.3)类似的处理,在采用不同的距离计算方法以及得到的不同聚点中心的前提下,对划分结果进行比较。   
  第三问主要就是第二问的延伸,敏感性分析也差不多。

4.第四问

4.1 针对不同类别的玻璃文物样品,分析其化学成分之间的关联关系

用相关系数法:用斯皮尔曼相关系数(皮尔逊相关系数由于数据非正太分布的关系,而且斯皮尔曼不容易出问题)ps:找了相关的论文,所以基本原理可以直接“引用”

4.2 比较不同类别之间的化学成分关联关系的差异性

典型相关分析不多解释了。

总结

  1. 缺很多数据可视化的作图手段
  2. 多看论文!!!(侧重点在于独特的优势),吸取经验,再接再厉!!!
  3. 队友关系和睦(题目再难也比不上一个猪队友)

你可能感兴趣的:(数学建模,机器学习,算法,统一建模语言,matlab)