运筹优化(十九)--决策论基础及其最优化求解

研究决策的问题包括:决策的基本原理、决策的程序、决策的信息、决策的方法(定量与定性的方法)、决策的风险、决策中的人因素、决策的思维方式、决策的组织、决策的实施 等。

决策科学包括的内容十分广泛:涉及社会学、决策心理学、决策行为学、决策的量化方 法和评价、决策支持系统和决策自动化等多学科和多领域的综合应用。

单目标决策

决策的分类

从不同的角度出发可得不同的决策分类。

1. 按性质的重要性分类

可将决策分为战略决策、策略决策和执行决策 , 或叫战略计划、管理控制和运行控制。

战略决策是涉及某组织发展和生存有关的全局性、长远问题的决策 , 如厂址的选择、 新产品开发方向、新市场的开发、原料供应地的选择等。

策略决策是为完成战略决策所规定的目的而进行的决策 , 如对一个企业产品规格的选择、工艺方案和设备的选择、厂区和车间内工艺路线的布置等。

执行决策是根据策略决策的要求对执行行为方案的选择 , 如生产中产品合格标准的选择、日常生产调度的决策等。

2. 按决策的结构分类

分为程序决策和非程序决策。
程序决策是一种有章可循的决策 , 一般是可重复的。 非程序决策一般是无章可循的决策, 只能凭经验直觉作出应变的决策, 一般是一次性的。

3. 按定量和定性分类
分为定量决策和定性决策 , 描述决策对象的指标都可以量化时可用定量决策 , 否则只能用定性决策。总的发展趋势是尽可能地把决策问题量化。

4. 按决策环境分类

可将决策问题分为确定型的、风险型的和不确定型的三种。确定型的决策是指决策环境是完全确定的, 作出的选择的结果也是确定 的。风险型决策是指决策的环境不是完全确定的 , 而其发生的概率是已知的。不确定型决策是指决策者对将发生结果的概率一无所知 , 只能凭决策者的主观倾向进行决策。

5. 按决策过程的连续性分类

可分为单项决策和序贯决策。单项决策是指整个决策过程只作一次决策就得到结果, 序贯决策是指整个决策过程由一系列决策组成 , 一般讲管理活动是由一系列决策组成的, 但在这一系列决策中往往有几个关键环节要作决策 , 可以把这些关键的决策分别看作 单项决策。

决策过程

构造人们决策行为的模型主要有两种方法 : 一种是面向决策结果的方法 ; 另一种是面向决策过程的方法。

面向决策结果的方法认为 : 若决策者能正确地预见到决策结果 , 其核心是决策的结果和正确的预测。通常的单目标和多目标决策是属这类型的。

面向决策过程的方法认为 : 若决策者了解了决策过程 , 掌握了过程和能控制过程 , 他就能正确地预见决策的结果。

任何决策都有一个过程和程序, 绝非决策者灵机一动拍板就行。面向决策过程的方法一般包括预决策→决策→决策后三个互相依赖的阶段。

预决策阶段是指当要决策的问题摆在决策者面前时 , 决策者能立即想到各种可能方案 , 并意识到没有理想方案时, 就会产生矛盾。他开始企图寻找减少矛盾的方案 , 沿着这企图扩大线索时, 就需要收集信息。收集信息时开始时比较客观 , 无倾向性, 以后逐渐变 得主观和有倾向了。当预决策进行得较顺利, 可以进行局部决策。

决策阶段可分为分部决策和最终决策两个阶段。分部决策包括对决策处境作方向性的调整 , 如排除劣解 , 重新考虑已放弃的方案 , 增加和去掉一些评价准则。 在合并一些方案后, 减少了变量数和方案数, 决策者按主观倾向重新估价各方案, 并保留倾向的少数方 案 , 以便进行最终决策。

决策后阶段 , 当进行了最终决策 , 这时主要考虑的问题是决策后看法不一致。这时决策者倾向于解释和强调已选方案的优点 , 并寻 找更多的信息来证明已选方案的优点和正确性。应克服愿听取相同意见、不愿听取不同意见的现象。决策后阶段要对决策实施进 行了解,这是十分重要的, 决策实施是决策的继续,决策后阶段往往也是下次决策的预决策阶段。

任何决策问题都有以下要素构成决策模型 :

(1) 决策者,他的任务是进行决策。决策者可以是个人、委员会或某个组织。一般指领导者或领导集体。

(2) 可供选择的方案(替代方案)、行动或策略。参谋人员的任务是为决策者提供各种可行方案。这里包括了解研究对象的属性 , 确定目的和目标。

  • 属性是指研究对象的特性,它们是客观存在的, 是可以客观量度的, 并由决策者主观选定的 , 如选拔飞行员时 , 按身高、年龄、健康状况等数值来表明其属性。
  • 目的是表明选择属性的方向 , 如要优秀还是良好 , 反映了决策者的要求和愿望。
  • 目标是给出了参数值的目的 , 如目的是选择一种省油的汽车时 , 那么以每公升能行驶 60 公里为目标。

(3) 准则是衡量选择方案, 包括目的、目标、属性、正确性的标准, 在决策时有单一准 则和多准则。

(4) 事件是指不为决策者所控制的客观存在的将发生的状态。

(5) 每一事件的发生将会产生某种结果,如获得收益或损失。

(6) 决策者的价值观,如决策者对货币额或不同风险程度的主观价值观念。

定型的决策是指不包含有随机因素的决策问题 , 每个决策都会得到一个唯一的事先可知的结果。从决策论的观点来看, 前面讨论的规划论等都是确定型的决策问题。这里讨论的决策问题都是具有不确定因素和有风险的决策。

不确定型的决策

所谓不确定型的决策是指决策者对环境情况一无所知。这时决策者是根据自己的主观倾向进行决策, 由决策者的主观态度不同基本可分为四种准则 : 悲观主义准则、乐观主义准则、等可能性准则、最小机会准则。

  • 悲观主义(max min)决策准则

悲观主义决策准则亦称保守主义决策准则。当决策者面临着各事件的发生概率不清时 , 决策者考虑可能由于决策错误而造成重大经济损失。由于自己的经济实力比较脆弱 , 他在处理问题时就较谨慎。他分析各种最坏的可能结果 , 从中选择最好者, 以它对应的策略为决策策略,用符号表示为 max min 决策准则。在收益矩阵中先从各策略所对应的可 能发生的“策略—事件”对的结果中选出最小值 , 将它们列于表的最右列。 再从此列的数值中选出最大者 , 以它对应的策略为决策者应选的决策策略。

  • 乐观主义(maxmax)决策准则

持乐观主义(max max)决策准则的决策者对待风险的态度与悲观主义者不同, 当他面临情况不明的策略问题时, 他绝不放弃任何一个可获得最好结果的机会 , 以争取好中之好的乐观态度来选择他的决策策略。决策者在分析收益矩阵各策略的“策略—事件”对的 结果中选出最大者, 记在表的最右列。再从该列数值中选择最大者 , 以它对应的策略为决策策略

  • 等可能性(Laplace)准则

等可能性(Laplace)准则是 19 世纪数学家 Laplace 提出的。他认为: 当一个人面临着 某事件集合 , 在没有什么确切理由来说明这一事件比那一事件有更多发生机会时 , 只能认为各事件发生的机会是均等的。即每一事件发生的概率都是 1/ 事件数。决策者计算各 策略的收益期望值 , 然后在所有这些期望值中选择最大者, 以它对应的策略为决策策略。然后按下式决定决策策略。

S_{k}^{*} \rightarrow \underset{i}{max}\left \{ E(S_{i}) \right \}

  • 最小机会损失准则

最小机会损失决策准则亦称最小遗憾值决策准则或 Savage 决策准则。首先将收益矩阵中各元素变换为每一“策略—事件”对的机会损失值(遗憾值, 后悔值)。其含义是: 当某一事件发生后,由于决策者没有选用收益最大的策略, 而形成的损失值。若发生件,各策略的收益为 aik ,i=1,2,⋯,5,其中最大者为:

a_{i,k} = \underset{i}{max} \,(a_{i,k})

这时各策略的机会损失值为:a_{i,k}^{'} = \left \{\underset{i}{max} \,(a_{i,k}) - a_{i,k} \right \}, i = 1, ..., 5

从所有最大机会损失值中选取最小者 , 它对应的策略为决策策略。用公式表示为 :S_{k}^{*} \rightarrow \underset{i}{min}\, \underset{j}{max}\, a_{i,j}^{'}

  • 折中主义准则

当用 min max 决策准则或 max max 决策准则来处理问题时, 有的决策者认为这样太极端了。于是提出把这两种决策准则给予综合,令 a为乐观系数, 且 0≤a≤1。并用以下关系式表示:

H_{i} = aa_{i_{max}} + (1 - a )a_{i_{min}}

其中aimax和aimin分别表示第 i个策略可能得到的最大收益值与最小收益值。

在不确定性决策中是因人因地因时选择决策准则的, 但在实际中当决策者面临不确定性决策问题时, 他首先是获取有关各事件发生的信息 , 使不确定性决策问题转化为风险决策。

风险决策

风险决策是指决策者对客观情况不甚了 解 , 但对将发生各事件的概率是已知的。 决策者往往通过调查, 根据过去的经验或主观估计等途径获得这些概率。在风险决策中一般采用期望值作为决策准则, 常用的有最大期望收益决策准则和最小机会损失决策准则。

  • 最大期望收益决策准则(expectedmonetaryvalue,EMV)

决策矩阵的各元素代表“策略—事件”对的收益值, 各事件发生的概率为pj先计算各策略的期望收益值:

\sum_{j}\, p_{J} a_{i,j}, i = 1,2,..,n

然后从这些期望收益值中选取最大者, 它对应的策略为决策应选策略。即:

\underset{i}{max}\sum_{j} p_{j}a_{i,j}\rightarrow S_{k}^{*}

EMV决策准则适用于一次决策多次重复进行生产的情况,所以它是平均意义下的最大收益。

  • 最小机会损失决策准则(expected opportunity loss,EOL)

矩阵的各元素代表“策略—事件”对的机会损失值, 各事件发生的概率为 pj , 先计算各策略的期望损失值。

\sum_{j}\, p_{J} a_{i,j}^{'}, i = 1,2,..,n

然后从这些期望损失值中选取最小者 , 它对应的策略应是决策者所选策略。即

\underset{i}{min}\sum_{j} p_{j}a_{i,j}^{'}\rightarrow S_{k}^{*}

从本质上讲 EMV 与 EOL 决策准则是一样的。

风险决策的代表,就是贝叶斯决策的应用。这里不啰嗦了。

决策论,还有一个概念是决策树,其重点不是机器学习决策树算法的应用,而是,自然意义上的决策行为和对应行为收益的加权和。

多目标决策

在考虑单目标最优化问题时 , 只要比较任意两个解对应的目标函数值后 , 就能确定谁优谁劣 ( 目标值相等时除外 ) 。在多目标情况 , 就不能作这样简单的比较来确定谁优谁劣了。要求若干目标同时都实现最优往往是很难的。经常是有所失才能有所得, 那么问题的失得在何时最好。各种不同的思路可引出各种合理处理得失的方法。以下介绍化多为少的方法。

化多为少的方法

主要目标法

解决主要问题 , 并适当兼顾其他要求。

1. 优选法:在实际问题中通过分析讨论,抓住其中一两个主要目标, 让它们尽可能地好, 而其他指标只要满足一定要求即可 , 通过若干次试验以达到最佳。

2. 数学规划法:转换多目标决策为非线性规划问题。

线性加权和法

若有m个目标fi( x ) , 分别给以权系数λi ( i = 1 , 2 , ⋯ , m ) , 然后作新的目标函数(也称效用函数)。

平方和加权法

设有m个规定值f1* ,⋯,fm* ,要求m个函数f1 (x),⋯,fm(x)分别与规定的值相差尽量小,若对其中不同值的要求相差程度又可不完全一样, 即有的要求重一些,有的轻一些。这时可采用下述评价函数:U(x) = \sum_{i = 1}^{m} \lambda_{i}\left [ f_{i}(x) - f_{i}^{*} \right ]^2要求minU( x) , 其中λi可按要求相差程度分别给出。

理想点法

假设可以找到每个目标函数的最优值,这些最优值形成原多目标函数的理想点,然后定义一定的模,在这个模的意义下找一个点尽量接近理想点。

乘除法

将目标函数分为两部分,一部分取最大,一部分取最小,然后定义取最小的目标函数连乘作为分子,取最大的目标函数连乘作为分母,形成新的目标函数,该单目标函数取最小。

功效系数法——几何平均法

设m个目标f1 (x),⋯,fm(x),其中k1个目标要求实现最大,k2 个目标要求实现最小,其余的目标是过大不行,过小也不行。对于这些目标 fi( x)分别给以一定的功效系数 (即评分)di,di 是在[0,1]之间的某一数。当目标最满意达到时,取di =1;当最差时取di =0。描述di与fi(x)的关系,称为功效函数,表示为di =Fi(fi)。对于不同类型目标应 选用不同类型的功效函数。

分层序列法

由于同时处理 m个目标是比较麻烦,故可采用分层法。分层法的思想是把目标按其重要性给出一个序列, 分为最重要目标、次要目标等。设给出的重要性序列为f1 (x),f2(x),⋯,fm(x) ,首先对第一个目标求最优,并找出所有最优解的集合记为 R0 。然后在 R0 内求第二个目标的最优解, 记这时的最优解集合为 R1 , 如此等等一直到求出第m个目标的最优解。

直解求非劣解

上述种种方法的基本点是将多目标最优化问题转换为一个或一系列单目标最优化问题。把对后者求得的解作为多目标问题的解 , 这种解往往是非劣解。对经转换后的问题所求出的最优解往往只是原问题的一个(或部分) 非劣解 , 至于其他非劣解的情况却不得 而知。于是出现第三类直接求所有非劣解的方法 , 当这些非劣解都找到后 , 就可供决策者 作最后的选择 , 选出的好解就称为选好解。显然决策者这时的选好 , 必须取决于他心中的 另一个目标。这可能是定性的或无法奉告的。运筹学工作者主要是根据已知的目标 , 尽可能地列出非劣解,以供决策者选择 , 非劣解求法很多 , 这里仅介绍线性加权和改变权系数的方法。

多目标线性规划的解法

当所有目标函数是线性函数 , 约束条件也都是线性时 , 可有些特殊的解法。特别是泽勒内(Zeleny)等将解线性规划的单纯形法给予适当修正后,用来解多目标线性规划问题, 或把多目标线性规划问题化成单目标的线性规划问题后求解 ,逐步法

逐步法是一种迭代法。在求解过程中 , 每进行 一步 , 分 析者把 计算 结果 告诉决 策者 , 决策者对计算结果作出评价。若认为已满意了 , 则迭代停止 ; 否则分析者再根据决策者的 意见进行修改和再计算 , 如此直到求得决策者认为满意的解为止 , 故称此法为逐步进行法 或对话式方法。

层次分析法

层次分析法是指将一个复杂的多目标决策系统作为一个系统,将目标分解为多个目标或准则,进而分解为多指标(或准则、约束)的若干层次,通过定性指标模糊量化方法算出层次单排序(权数)和总排序,以作为目标(多指标)、多方案优化决策的系统方法。

层次分析法是将决策问题按总目标、各层子目标、评价准则直至具体的备投方案的顺序分解为不同的层次结构,然后用求解判断矩阵特征向量的办法,求得每一层次的各元素对上一层次某元素的优先权重,最后再加权和的方法递阶归并各备择方案对总目标的最终权重,此最终权重最大者即为最优方案。

层次分析法比较适合于具有分层交错评价指标的目标系统,而且目标值又难于定量描述的决策问题

1.建立层次结构模型

将决策的目标、考虑的因素(决策准则)和决策对象按它们之间的相互关系分为最高层、中间层和最低层,绘出层次结构图。 最高层是指决策的目的、要解决的问题。 最低层是指决策时的备选方案。 中间层是指考虑的因素、决策的准则。对于相邻的两层,称高层为目标层,低层为因素层。

2.构造判断(成对比较)矩阵

在确定各层次各因素之间的权重时,如果只是定性的结果,则常常不容易被别人接受,因而Santy等人提出一致矩阵法,即不把所有因素放在一起比较,而是两两相互比较,对此时采用相对尺度,以尽可能减少性质不同的诸因素相互比较的困难,以提高准确度。如对某一准则,对其下的各方案进行两两对比,并按其重要性程度评定等级。a_{ij}为要素i与要素j重要性比较结果,表1列出Saaty给出的9个重要性等级及其赋值。按两两比较结果构成的矩阵称作判断矩阵。判断矩阵具有如下性质:

a_{ij} = 1 / a_{ji}

判断矩阵元素a_{i,j}的标度方法如下:

表1 比例标度表

因素i比因素j

量化值

同等重要

1

稍微重要

3

较强重要

5

强烈重要

7

极端重要

9

两相邻判断的中间值

2,4,6,8

3.层次单排序及其一致性检验

对应于判断矩阵最大特征根\lambda_{max}的特征向量,经归一化(使向量中各元素之和等于1)后记为W。W的元素为同一层次因素对于上一层次因素某因素相对重要性的排序权值,这一过程称为层次单排序。能否确认层次单排序,则需要进行一致性检验,所谓一致性检验是指对A确定不一致的允许范围。其中,n阶一致阵的唯一非零特征根为n;n 阶正互反阵A的最大特征根\lambda\geqslant n, 当且仅当\lambda = n时,A为一致矩阵。由于λ连续的依赖于a_{ij},则λ 比n 大的越多,A的不一致性越严重,一致性指标用CI计算,CI越小,说明一致性越大。用最大特征值对应的特征向量作为被比较因素对上层某因素影响程度的权向量,其不一致程度越大,引起的判断误差越大。因而可以用 λ-n 数值的大小来衡量A 的不一致程度。定义一致性指标为:

CI = \frac{\lambda - n}{n - 1}

CI=0,有完全的一致性;CI 接近于0,有满意的一致性;CI 越大,不一致越严重。

为衡量CI 的大小,引入随机一致性指标 RI:

RI =\frac{\sum_{i=1}^{n} CI_{i}}{n}

其中,随机一致性指标RI和判断矩阵的阶数有关,一般情况下,矩阵阶数越大,则出现一致性随机偏离的可能性也越大,其对应关系如表2:

表2 平均随机一致性指标RI标准值(不同的标准不同,RI的值也会有微小的差异)

矩阵阶数

1

2

3

4

5

6

7

8

9

10

RI

0

0

0.58

0.90

1.12

1.24

1.32

1.41

1.45

1.49

考虑到一致性的偏离可能是由于随机原因造成的,因此在检验判断矩阵是否具有满意的一致性时,还需将CI和随机一致性指标RI进行比较,得出检验系数CR,公式如下:

CR= \frac{CI}{RI}

一般,如果CR<0.1 ,则认为该判断矩阵通过一致性检验,否则就不具有满意一致性。

4.层次总排序及其一致性检验

计算某一层次所有因素对于最高层(总目标)相对重要性的权值,称为层次总排序。这一过程是从最高层次到最低层次依次进行的。

5.注意

在运用层次分析法时,如果所选的要素不合理,其含义混淆不清,或要素间的关系不正确,都会降低AHP法的结果质量,甚至导致AHP法决策失败。为保证递阶层次结构的合理性,需把握以下原则:

  1. 分解简化问题时把握主要因素,不漏不多;

  2. 注意相比较元素之间的强度关系,相差太悬殊的要素不能在同一层次比较

你可能感兴趣的:(运筹优化)