美赛丨美赛冲刺美赛入门基础题型算法模型笔记

最近刚好在入门美赛,所以做了一些笔记~

视频:美赛冲刺课12节

1.建模步骤:

(①不要怕难题,难题获奖概率可能更大 ②每个人也许都应该学习一些Matlab编程)

模型准备 → 模型假设 → 模型建立 → 模型求解(Matlab编程) → 模型分析(图的表面、图深层含义的分析) → 模型检验(知识储备+已经调查的数据进行推断预测) → 模型应用(可以解决哪些问题)

2.数学建模有哪些问题?

①数据处理(获取数据,数据处理)#插值与拟合  ②关联与分析(根据数据进行关联和分析) ③分类与判别

④评价与决策   ⑤预测与预报  ⑥优化与控制

1)数据处理 [ 数据出现缺失/异常值 --插值与拟合 ]

比如题中只给出了部分地点的高程

①插值拟合:

主要用于对数据的不全和基本趋势分析

②小波分析,聚类分析(高斯混合聚类,K-均值聚类等)

主要用于诊断数据异常值并进行剔除

③主成分分析、线性判别分析、局部保留投影等

主要用于多维数据的降维处理,减少数据多余

④均值、方差分析、协方差分析等统计方法

主要用于数据的截取或特征选择

  (2) 关联与因果

①灰色关联分析方法(样本点的个数较少)

②Superman或kendall等级相关分析

③Person相关(样本点的个数比较多)

④Copula相关(比较难,金融数学,概率密度)

⑤典型相关分析(自变量X1234,因变量Y1234,各自变量相关性较强,哪些因变量与哪些自变量的关系比较紧密)

3)分类与判别

#对DNA的序列进行分类,对所属关系进行判别

SOM难度较大,可以用

①距离聚类(高斯聚类,系统聚类)常用   #距离类的概念

②关联性聚类

③层次聚类  #一堆数据,暂无距离类概念用34

④密度聚类

⑤其他聚类

⑥贝叶斯判别(统计判别方法)

⑦费舍尔判别(训练样本较少)

⑧模糊识别

4)评价与决策(都可以用神经网络)

#对于全球水资源的评价?

①模糊综合评判:评价一个对象优良中差等层次评价,评价一个学校等,不能排序 (无明显数据分层,模糊)

②主成分分析:评价多个对象的水平并排序,指标间关联性很强

③层次分析法:做决策,通过指标,综合考虑做决定   [low]

④数据包络分析法DEA:优化问题 (比如智慧城市政策运行情况的评价

⑤秩和比综合评价法:评价

⑥⭐神经网络评价:多指标 非线性关系明确的评价

#比如水质应该与多种指标有关….但是没有明确的线性关系

⑦优劣解距离法

⑧投影寻踪综合评价法:糅合多种算法(遗传算法、最优化理论)

⑨方差分析、协方差分析等

方差分析:看几类数据之间有无差异,差异性影响,例如:元素对麦子的产

量有无影响,差异量的多少;(1992年作物生长的施肥问题)

协方差分析:有几个因素,我们只考虑一个因素对问题的影响,忽略其他因

素,但注意初始数据的量纲以及初始情况。(2006年,艾滋病疗法的评价以及

预测问题)

(5)预测与预报

#eg SARS的传播;

方法

①小样本内部预测 #基本不考

②大样本内部预测 #基本不考 

③小样本未来预测 #容易考 最常用  灰色预测模型

④大样本的随机因素或周期特征的未来预测

⑤大样本的未来预测

模型

灰色预测模型(必须掌握)

满足两个条件可用:

a.数据样本点个数少,6-15个

b.数据呈现指数或曲线的形式

②微分方程预测(备用)

无法直接找到原始数据之间的关系,但可以找到原始数据变化速度之间的关系,通过公式推导转化为原始数据之间的关系

回归分析预测(必须掌握)

求一个因变量与若干自变量之间的关系,若自变量变化之后,求因变量如何变化;

样本点的个数有要求:

a自变量之间协方差比较小,最好趋于零,自变量间的关系小;

b样本点的个数n>3k+1,k为自变量的个数;

c因变量要符合正态分布

④马尔科夫预测(备用)

一个序列之间没有信息的传递,前后没有联系,数据与数据之间随机性强,相互不影响;今天的温度与昨天、后天没有直接联系,预测后天温度高、中、低的概率,只能得到概率

#和之前没有什么关系,只和现在有关,比如说一种新的政策

时间序列预测(必须掌握)

与马尔科夫预测互补,至少有2个点需要信息的传递,ARMA模型,周

期模型,季节模型等。

⑥小波分析预测

⑦神经网络预测

⑧混沌序列预测

##  样本很多时用67

(6)优化与控制

#eg.公交车调度,生产线,怎么找一个最优方案; 或者说试验台的控制器,怎么设计;各个地方运输(线性规划等规划类问题),美赛浴缸设计(?)

①线性规划、整数规划、0-1规划(有约束,确定的目标)

#运输问题..

②非线性规划与智能优化算法

#非线性因素

③多目标规划和目标规划(柔性约束,目标含糊,超过)

#要达到多个目标,省钱省力,很多条件..

④动态规划

⑤图论、网络优化(多因素交错复杂)

#给了一个图,规划出一个路线;(如大坝的选址问题)

⑥排队论与计算机仿真

#排队,怎么安排顾客关系

⑦模糊规划(范围约束)

⑧灰色规划(难)

(智能算法选讲)

遗传算法:交叉变异,使更有利于环境生存的性状存留

模拟退火:随机性。对于不想要的结果给一个比较小的概率。

粒子群算法:

你可能感兴趣的:(算法,聚类,机器学习,matlab,美国大学生数学建模竞赛)