决策论一般分为了两种类型:
首先我们要把所有的目标函数都写出来
m a x { Z 1 = f 1 ( x ) . . . Z n = f n ( x ) max\left\{ \begin{array}{l} Z_1=f_1\left( x \right)\\ ...\\ Z_n=f_n\left( x \right)\\ \end{array} \right. max⎩⎨⎧Z1=f1(x)...Zn=fn(x)
x视具体情况而定,不一定是单一变量。关于解的讨论其实就是多目标进化优化里面的帕累托解,一般来说,假如是最大化,如果存在多个解在各个维度上都大于或等于大部分其他解,则这一些解就是帕累托解或者可行解
以上的方法是经典方法,在现实生活中很难使用到,一般会使用matlab软件进行计算(数值比较),在使用机器的时候,做课题或者做科研的时候很重要的思想:蒙特卡洛思想(通过概率来研究问题)经典,不过时
与视频不同,我本人是学过一点点蒙特卡洛的思想的,而蒙特卡洛是一个赌城,所以你大概知道这是一个赌徒思想,总体来说它遵循概率里面的大数定律,就是样本越多的情况下它越有可能接近最优解。
优化在优化过程中一般都是:有最优解找最优解,没有找次优解,再没有找有效解,再没有就不求甚解(要改变模型了)…
运筹学框架:
这个知识点本身不难,跟管理学等科目很相关,偏思想性
意思是我只知道我现在有多少东西,以及我的卖价和生产成本,但具体有没有顾客来买,这件事情我们是不清楚的,也就是亏不亏本也是不清楚的
这个时候我们首先将自己手上的数据进行一些处理,例如将穷举所有成本和可能卖出的数量进行建模成矩阵,我们将其分布成一个矩阵,可以叫做收益矩阵或者损失矩阵
这个时候我们就可以看成一个与自然的博弈过程,只不过这个过程,我们可以看到,这只不过是一个我们可以做出决策的一个过程
书本上有5个要求需要我们去思考:
乐观主义 激进原则,放到数学里面,就是先找每行里面的最大值,然后选择其中最小值。
悲观主义 悲观主义其实是一种保守的原则,在我损失最小情况我去找到一个最大值,在数学上来看,就是先取一个最小再取一个最大,分别对每行找一个最小的出来,,当然从我们上面来看,就是不生产。这是不合理的…
折衷(中)主义 这是一个涉及程度的问题,用a来表示乐观(悲观)系数,表示乐观(悲观)的程度问题,需要利用一个这样的范式,对于每一行,站在乐观来看,我们可以得到一个数,从悲观来看,我们又可以得到一个数,最终Hi就是我们折衷的收益,这个a的取值很关键
m a x H i = a a i j ( ( max ) ) + ( 1 − a ) a i j ( min ) max\ \\H_i=aa_{ij\left( \left( \max \right) \right)}+\left( 1-a \right) a_{ij\left( \min \right)} max Hi=aaij((max))+(1−a)aij(min)
等可能性 对于每个事件的发生,如果我们没有办法决定那一种事件更容易发生,然后我们只能基于每个事件都是等可能性去思考(古典概型),所以上面每个事件的可能性都是0.2,然后用来算期望,最后得到最大的那一个
最小机会损失准则(后悔值、遗憾值)既不是激进也不是保守们也不是等可能性,外号为“别后悔”,处理出我们能够看到我们后悔的情况,假设上面那个表格,我们假如选则事件1,相较于其他情况,我们选择S1,我们无损失,其他都有损失,所以只有选S1才最不后悔,所以从数学上来看,我们从每一列中找最大的数(代表事件的最优解),然后找到的最大的数-对应列各位的数,取绝对值(作为后悔的程度)(得到这一列中最后悔的程度),然后修正上面得到的表,再这个表的基础上,我们先取每行最大的后悔值,再在后悔值里面选一个最小值,从上面来看,我们会选择S5
跟上面的区别在于上面的概率是不知道的或者很难知道,而风险决策的概率是可以知道的或者不难得到的
涉及到概率,一般就涉及到了期望,所以方法有:
最大期望收益准则 就是将前面的等概率改成对应的概率,就可以求解出来对应的期望,然后得到最大的期望值
最小机会损失决策准则 跟概率相关了。出现期望的意味,先计算各策略的期望损失值,然后在各期望值中损失值中找到最小的。首先根据上面的情况我们算出一个后悔程度的表格,然后修改每行对应位置的概率乘以对应的值,再选择最小值
定理,假定我们原来的矩阵记为EMV,后悔矩阵记为EOL,我们可以得到如下定理
EMV + EOL =K(定值)K值如下:
k = p 1 a 11 + p 2 a 22 + . . . + p n a n n k\ =\ p_1a_{11}+p_2a_{22}+...+p_na_{nn} k = p1a11+p2a22+...+pnann
主要涉及为条件概率、全概率公式和贝叶斯公式
由于本人学过贝叶斯公式,所以在这里就不赘述了,这里给出一个学习的链接:全概率公式、贝叶斯公式 - 知乎 (zhihu.com)
贝叶斯公式使用的主要特征,首先肯定知道B发生以后A发生的概率,求A发生以后B发生的概率(全集分解思想)
建议大家去看看这个视频,有些东西不好言传,只可意会:关于我强烈建议大家看看这个视频。我相信如果之前没有对贝叶斯有很深刻的了解,这个视频绝对会对大家有所帮助
【运筹学】基础教程(已完结){适用范围:本科、考研、考博}_哔哩哔哩_bilibili
一般来说对于投入,就会得到一个收益,但是这个投入到收益的转换很难做到百分之一百,因为中间会有损失,所以这就涉及到了效用函数(函数) ,同时在这里还会涉及到了一个转化率的问题,一般来说,赚钱是开心的,亏钱是难过的,而且赚钱的开心程度比亏掉同样大小的金钱数伤心的程度要小的多。但是效用函数,一般偏向为一个对数函数,通常表示为保守型或者激进型两种曲线,经济学注重现象,管理学注重过程。
所谓决策树,数学本质上其实就是穷举法,所以决策树只能帮我们处理有限的情况。
在画决策树之前,首先我们要先做好说明,例如使用圆圈作为决策,矩形作为事件,三角形作为收益,横线表示为支出。每个决策肯定有放置或者不放置,然后就会产生一个事件,然后会产生一个反应,所以会继续做决策,做完决策以后就又会产生一个事件,然后接着做决策,直至结束。
在画完决策树,以后,我们根据树的每个枝的最叶子处进行计算(倒着算),首先根据对应的收入进行计算,选择收入最大的那个树枝,例如一个分叉的树枝,一边的期望值为7,一边的期望值为2,我们会舍弃掉为2的分支,并只记录期望值为7的分支,然后使用期望值为7继续向上进行迭代。向上迭代的过程中,不断选择期望值最大的值,最后根据期望值做出我们相应的决策
当我们加入之前所提到的效用值,我们可以将效用值当作概率进行使用,与利益相乘就可以得到相应的期望值,跟上面迭代过程一样,最终做出我们期望最大的决策
通过波动其中一些参数或者概率,来检验我们的决策的结果是否发生变化以及会发生变化范围的大小