【美赛】备赛~

day1

组队分工——建模人

其工作主要是建立模型

数学知识的应用能力:
①概率与数理统计
②运筹与线性规划
③微分方程还有与计算机知识相交叉的知识:计算机模拟等等

建模步骤

模型准备——>模型假设——>模型建立——>模型求解——>模型分析——>模型检验(检验假设是否正确)——>模型应用

建模过程

数据分析——>关联与分析——>分类与辨别——>评价与决策——>预测与预报——>优化与控制

数据处理问题

①插值拟合
主要用于对数据的补全和基本的趋势分析
②小波分析,聚类分析(高斯混合聚类,K-均值聚类等)
主要用于诊断数据异常值并进行剔除
③主成分分析、线性判别分析、局部保留投影等
主要用于多维数据的降维处理,减少数据冗余

关联与因果

①灰色关联分析方法(样本点的个数较少)
②Superman或kendall等级相关分析
③Person相关(样本点的个数比较多)
④Copula相关(比较难,金融数学,概率密度)
⑤典型相关分析(因变量Y1234,自变量组X1234,各自变量组相关性比较强,问哪一个因变量与哪一个自变量关系比较紧密?)

分类与辨别

①距离聚类(系统聚类)常用
②关联性聚类(常用)
③层次聚类
④密度聚类
⑤其他聚类
⑥贝叶斯判别(统计判别方法)
⑦费舍尔判别(训练的样本比较少)
⑧模糊识别(分好类的数据点比较少)

评价与决策

①模糊综合评判:评价一个对象优、良、中、差等层次评价,评价一个学校等,不能排序
②主成分分析:评价多个对象的水平并排序,指标间关联性很强
③层次分析法:做决策,通过指标,综合考虑做决定
④数据包络(DEA)分析法:优化问题,对各省发展状况进行评判
⑤秩和比综合评价法:评价各个对象并排序,指标间关联性不强
⑥神经网络评价:适用于多指标非线性关系明确的评价
⑦优劣解距离法(TOPSIS法)
⑧投影寻踪综合评价法:糅合多种算法,比如遗传算法、最优化理论
⑨方差分析、协方差分析等
方差分析:看几类数据之间有无差异,差异性影响,例如:元素对麦子的产量有无影响,差异量的多少;
协方差分析:有几个因素,我们只考虑一个因素对问题的影响,忽略其他因素,但注意初始数据的量纲以及初始情况。

预测与预报

主要有五种:
小样本内部预测
大样本的内部预测
小样本的未来预测
大样本的随机因素或周期特征的未来预测
大样本的未来预测
①灰色预测模型(必须掌握)
满足两个条件可用:
a数据样本点个数少,6-15个
b数据呈现指数或曲线的形式
②微分方程预测(备用)
无法直接找到原始数据之间的关系,但可以找到原始数据变化速度之间的关系,通过公式推导转化为原始数据之间的关系。
③回归分析预测(必须掌握)
求一个因变量与若干自变量之间的关系,若自变量变化之后,求因变量如何变化
样本点的个数有要求:
a自变量之间协方差比较小,最好趋于零,自变量之间的关系小
b样本点的个数n>3k+1,k为自变量的个数
c因变量要符合正态分布

优化与控制

①线性规划、整数规划、0-1规划(有约束,确定的目标)
②非线性规划与智能优化算法
③多目标规划和目标规划(柔性约束,目标含糊,超过)
④动态规划
⑤图论、网格优化(多因素交错复杂)
⑥排队论与计算机仿真
⑦模糊规划(范围约束)
⑧灰色规划(难)
day2

线性规划模型(LP)

线性规划问题的三个重要因素

决策变量
目标函数
约束条件

MATLAB软件求解

命令为:linprog,解决的线性规划的标准格式为:
【美赛】备赛~_第1张图片

其中,A,b,c,x,Aeq,beq,VLB,VUB等均表示矩阵,特别b,c,x,beq,VLB,VUB为列矩阵。

命令linprog的基本调用格式:
【美赛】备赛~_第2张图片如果没有等式约束,就在相应位置上输入空数组[],不等式约束和上下界也类似,最后的输入项若没有,则可以省略
还可以增加输出
【美赛】备赛~_第3张图片

插值与拟合

数据拟合在很多赛题中有应用,与图形处理有关的问题很多与插值和拟合有关系,例如98年美国赛A题,生物组织切片的三维插值处理,94年A题逢山开路,山体海拔高度的插值计算,2002年吵得火热的“非典”问题也要用到数据拟合算法,观察数据的走向进行处理,2005年的雨量预报的评价的插值计算。2001年的公交车调度拟合问题,2003年的饮酒驾车拟合问题。

区别:
插值问题不一定得到近似函数的表达形式,仅通过插值方法找到未知点对应的值。数据拟合要求得到一个具体的近似函数的表达式。

数据插值

1、interp1():一维插值函数
调用格式:Y1=interp1(X,Y,x1,method)
其中,X、Y是两个等长的已知向量,分别表示采样点和采样值。x1是一个向量或标量,表示要插值的点。 method参数用于指定插值的计算方法:
(1)linear:线性插值(默认方法)。将与插值点靠近的两个数据点用直线连接,然后在直线上选取对应插值点数据。
(2)nearest:最近点插值。选择最近样本点插值。
(3)pchip:分段3次埃尔米特插值。采用分段三次多项式,除满足插值条件,还需满足在若干节点处相邻段插值函数的一阶导数相等,使得曲线光滑的同时,还具有保形性。
(4)spline:3次样条插值。每个分段内构造一个三次多项式,使其插值函数除满足插值条件外,还要求在各节点处具有连续的一阶和二阶导数。
2、interp2():二维插值函数
调用格式:Z1=interp2(X,Y,Z,x1,Y1,method)
其中,X、Y是两个已知向量,表示两个参数的采样点,Z是采样点对应的函数值。x1、Y1是两个向量或标量,表示要插值的点。

曲线拟合

曲线拟合同数据插值类似,也是函数逼近的方法:构造函数g(x)去逼近未知函数f(x),使得误差
在这里插入图片描述1、最小二乘法:最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和来寻找数据的最佳函数匹配。

设p(x)是一个多项式函数
在这里插入图片描述

【美赛】备赛~_第4张图片
的值最小,则p(x)为原函数y=f(x)的逼近函数。

2、MATLAB中的多项式拟合函数为polyfit(),其功能为求得最小二乘拟合多项式系数,其调用格式为:
(1)P=polyfit(X,Y,m)
(2)[P,S]=polyfit(X,Y,m)
(3)[P,S,mu]=polyfit(X,Y,m):根据样本数据X和Y,产生一个m次多项式P及其在采样点误差数据S,mu是一个二元向量,mu(1)是mean(X),而mu(2)是 std(X)。

3、注意事项
(1)要对问题的背景进行详细的分析。
(2)采样点并非越多越好,适当的时候,可以减少采样点,分段进行拟合。

你可能感兴趣的:(数学建模,算法,数学建模)