目录
一、存储论
1.存储模型的结构及基本概念
2.确定型存储模型
3.随机型存储模型
二、对策论(博弈论)
1.对策行为的三个基本要素
2.矩阵对策的基本定理
3.矩阵对策的解法
4*.其他类型对策简介
三、决策论
1.单目标决策
2.多目标决策
四*、排序问题
1.车间生产计划排序问题
2.旅行售货员问题
存储论是研究如何根据生产或者销售活动的实际存储问题建立起数学模型,然后通过费用分析求出产品、商品的最佳供应量和供应周期这些数量指标。
(1)存储论的结构
①需求:对存储来说,由于需求,从存储中取出一定的数量,使存储量减少,这就是存储的输出。有的需求是间断式的,有的需求是连续均匀的。
②补充(订货或生产):存储由于需求而不断减少,必须加以补充,否则最终将无法满足需求。补充就是存储的输入。“存储”往往需要一段备货时间,为了在某一时刻能补充存储,必须提前订货,这段时间称之为提前时间。
存储论要解决的问题是:多少时间补充一次,每次补充的数量应该是多少。
(2)费用构成
①订货费
订货费是从每次订货到货物入库所需的全部费用。它主要包括两项费用。
i.订购费。固定费用,它仅与订购次数有关,而与订购数量无关。
ii.货物成本费。可变费用,它因订购数量的不同而变化。
②存储费
存储费是货物从入库到出库阶段内由于库存保管所需要的费用,它因存储数量的增加而增加。
③缺货费
当存储供不应求时所引起的经济损失。
④*生产费
补充存储时,如不需向外厂订货,由本厂自行生产时需要支出的两项费用:装配费用;与生产数量有关的可变费用。
(3)存储控制的数量指标和参数符号
①订购点q
订购点是指当库存量减少至某一数量指标时,应立即补充购货的系统最低存储量。
②订购批量Q
订购批量是指库存量达到订购点时,决定一次补充购货的数量。订购批量是存储模型中最为关心的一个数量指标。
③拖后时间L
从开始订货到存储的实现(入库)需要经历一段时间。这段时间既可以称为拖后时间,也可以称为提前时间。实际存储问题中,如果拖后时间很短,以致可以忽略,就说拖后时间为零。如拖后时间较长,则它可以是确定的,也可以是随机性的。
为了建立模型方便,在讨论具体的存储模型前,首先给出各类存储模型有关参数符号如下:
a——每批货物的订购费;
e——单位货物成本费;
b——单位时间内单位货物的存储费;
c——单位时间内单位货物的缺货费;
P——单位时间内货物的补充量;
u——单位时间内货物的需求量;
t——订货周期或者生产周期(也可以称为补充时间间隔);
Q——每批货物的订购批量;
q——存储系统必须立即进货的最低存储量;
L——拖后时间,从开始订货到存储实现(入库)的间隔时间。
(4)存储控制策略
在存储控制中,需求是服务的对象,补充是控制的对象。因此,控制并确定输入过程中订货周期和订购批量的不同方法,则形成存储模型不同的控制策略。
①t-循环策略。每经过一个循环时间t就补充存储量Q。这一方法也称为经济批量法。
②(q,Q)策略。对库存进行连续性检查,每当存储量时不补充,当时就即刻补充存储,且每次订货批量都为。
③(t,s,S)混合策略。每经过t时间检查存储量,当时不补充,当时,补充量(即,将存储量补充到S).
(1)模型一:不允许缺货,备货时间很短(订货批量模型)
这个存储模型的基本假设前提是:
①订购点q为零,库存量减少到零时立即补充,瞬间到货,补充一次性完成;
②需求均匀连续,需求速率u为常数,在订货周期t内的需求量为,显然,它即为每次订购批量;
③每次订购费a相同,单位时间内单位货物的存储费b不变。
存储模型费用的评价标准是单位时间内存储货物的平均总费用,设它为函数。在订货周期内总费用为订货费与存储费之和。
根据假设,每次订购费为,货物单价为,则一次订货费为。所以,单位时间的订货费为。可知,在订货周期内的存储量为一个三角形的面积:,因此,单位时间内的平均存储量为,单位时间内的存储费为。
由此,可知单位时间内存储货物的平均费用函数为
最小平均费用为
(2)模型二:允许缺货,备货时间很短
这个存储模型的基本假设前提是:
①当库存减少到零时,延迟一段时间再进行补充。但一旦进行补充,瞬间就能到货,补充一次性完成。
②需求均匀连续,需求速率u为常数,在订货周期t内的需求量为,每次订购批量
③每次订购费a相同,单位时间内单位货物的存储费b不变,单位货物的缺货费c不变。
每一个订货周期内的最大缺货量为,实际进库量为,当进货时,每批的订购批量为
设单位时间内存储货物总费用的平均值为函数。在订货周期内总费用为订货费、存储费与缺货费之和。则,单位时间内存储货物的平均总费用函数为
将对和分别求一阶偏导数,即,解此方程组,可得:
最佳订货周期
最小平均费用
(3)模型三:不允许缺货,生产需一定时间(生产批量模型)
该存储模型的基本假设前提是:
①生产和需求都是连续均匀的,且生产速率p大于需求速率u;
②订购点为零,即库存量减少到零时就开工生产进行产品补充,边补充边输出,库存量以的速率增长。当生产批量Q完成以后,就停止生产,然后库存量按照需求速率u减少,到时刻t时库存为零。
③生产时间为,生产批量为,
生产周期分为两个时期,在时期是边生产边输出,生产结束时存储量达到最大量,并有。显然,。在生产周期内的存储量为一个三角形的面积:。因此,单位时间内的平均存储量为,单位时间内的存储费为。而时间内的生产费用为。由此,可知单位时间内存储产品所需费用的平均值
最佳循环周期
最佳生产时间
最佳生产批量
最小平均费用
当进货是均匀连续时,该模型同样适用于订货批量模型。
(4)模型四:允许缺货(需补足缺货),生产需一定时间
假设条件允许缺货生产需一定时间,其余条件与模型一相同。
(5)有数量折扣的订货批量模型
所未有数量折扣,就是提供存储货物的企业为鼓励拥护多购货物,对于一次购买较多数量的用户在价格上给予一定的优惠。单位货物购置费e应看作是订购量Q的函数。设价格折扣率为,有
其中,为折扣点。
它也是的分段函数,因此不能运用令倒数为零的方法确定极值点。
在实际问题中,单位货物购置费可能会有多个分界点,,在不同的区段可以有不同的折扣,按照具体情况讨论。
随机性存储模型的重要特点是需求为随机的,其概率或分布为已知的。可供选择的策略主要有三种:
此外与确定性模型不同的特点还有:不允许缺货的条件只能从概率的意义方面理解。存储策略的优劣通常以盈利的期望值的大小作为衡量的标准。
(1)模型五:需求是随机离散的
【报童问题】报童每日售报数量是一个随机变量。报童每售一份报纸赚元。如报纸未能售出,每份赔元。每日售出报纸份数的概率根据以往的经验是已知的。求解报童每日最好准备多少报纸。
报童应准备的报纸最佳数量应按下列不等式确定
(2)模型六:需求是连续的随机变量
设货物单位成本为,货物单位售价为,单位存储费为,需求是连续的随机变量,密度函数为,表示随机变量在与之间的概率,其分布函数,生产或订购的数量为。求解如何确定的数值,使盈利的期望值最大。
盈利的期望值
记
令
记
即
从此式中解出,记为。为的极小值点,在本模型中也是最小值点。
如果缺货时要付出的费用,应有
推导得出
(3)模型七:(s,S)策略存储模型
假设供需过程可以分成若干个阶段(每个阶段的是时间长度相同),拖后时间为零,每个阶段对存储货物的需求量是一个随机变量。如果对于不同的阶段来说,销售、需求只是一种重复性的活动,所以只要研究一个阶段的存储问题就可以了,因此称它为单阶段的随机存储模型,采用(s,S)策略。
现设是一个离散型的随机变量,它取的数值分别为,的概率分布为
自然,应有
在每阶段处检查库存,若发现库存量低于规定的数量,就立即补充货物并把库存量提高到规定的数值。在下面讨论中,就以一个阶段的时间长度作为单位时间。
①值的确定
设在阶段初未进货时的库存量,阶段初补充的数量为,因而补充后的库存量。假设这阶段的存储费和缺货损失费按这阶段末的库存量来计算。因此,这个阶段(单位时间)内总费用的期望值为
因此,应是满足下列不等式的最大的值再加1,
或者是满足下列不等式的最小的:
但是的取值集合为,故应取满足上述不等式的最小。
②值的确定
为满足下列不等式的最小值:
(4)模型八:(q,Q)策略存储模型
(q,Q)策略的基本内容是:对库存水平进行连续检查,当库存水平减少到订购点以下时,提出订购量为的订货请求,经过拖后时间后,数量为的货物一定入库。这个存储模型具有下列几点基本假设:
①拖后时间为固定常数,在拖后时间内,需求量为随机变量,其概率密度函数为已知,且数学期望。
②在拖后时间结束前,当实际需求量超过时,允许出现缺货现象。当库存量减少到零以后,将未能满足需求的缺货累积起来,待到货后再补交,也就是说它为缺货有预约。
③每次订购费为,单位时间内单位货物的存储费为,单位时间内单位货物的缺货费为。
考虑单位时间内货物存储的平均总费用同前面模型一样
订购费+存储费+缺货费
从而,求得单位时间内货物存储的总平均费用的期望值
将上式分别对和求一阶偏导,令其等于零,解方程组得:
(1)
(2)
但是,在和的计算公式中,因包含有相互关联的未知量,而不能直接求出最终结果,为此采用逐步逼近的迭代求解,具体算法步骤如下:
①令,,,;
②取,代入式(1),计算;
③取,代入式(2),计算;
④取,代入式(3),计算;
⑤判断,是否成立?
若是,则和即为所求的最优订购批量和最优订购点,算法终止;
若否,则取,转步骤②继续计算。
在这个算法中,的计算比较困难。在实际问题中,拖后时间内的需求量多数服从正态分布。
(1)局中人:在一个对策行为(或一局对策)中,有权决策自己行动方案的对策参加者称为局中人。
(2)策略集:一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。
(3)赢得函数(支付函数)
(1)矩阵对策的数学模型
在矩阵对策中,一般用Ⅰ、Ⅱ分别表示两个局中人,并设局中人Ⅰ有m个纯策略,局中人Ⅱ有n个纯策略,则局中人Ⅰ、Ⅱ的策略集分别为
当局中人Ⅰ选定纯策略和局中人Ⅱ选定纯策略后,就形成了一个纯局势。可见,这样的纯局势共有m×n个。对任一纯局势,记局中人Ⅰ的赢得值为,并称
为局中人Ⅰ的赢得矩阵(或为局中人Ⅱ的支付矩阵)。由于假定对策为零和的,故局中人Ⅱ的赢得矩阵就是。
当局中人Ⅰ、Ⅱ和策略集及局中人Ⅰ的赢得矩阵确定后,一个矩阵对策也就给定了。通常,将一个矩阵对策记成
Ⅰ,Ⅱ;或
【定义1】设为矩阵对策。其中
若等式
成立,记。则称为对策的值,称使上式成立的纯局势为在纯策略下的解(或平衡局势),与分别称为局中人Ⅰ、Ⅱ的最优纯策略。
【定理1】矩阵对策在纯策略意义下有解的充分必要条件是:存在纯局势使得对一切,均有
【定义2】设为一个定义在及上的实值函数,如果存在,使得对一切和,有
则称为函数的一个鞍点。
【性质1】无差别性。即若和是对策的两个解,则。
【性质2】可交换性。即若和是对策的两个解,则和也是解。
(2)矩阵对策的混合策略
【定义3】设有矩阵对策,其中,记
则和分别称为局中人Ⅰ和Ⅱ的混合策略(或策略集);和分别称为局中人Ⅰ和Ⅱ的混合策略(或策略);对,称为一个混合局势(或局势),局中人Ⅰ的赢得函数记成
这样得到的一个新的对策记成,称为对策的混合扩充。
【定义4】设是矩阵对策的混合扩充,如果
记其值为,则称为对策的值,称使上式成立的混合局势为在混合策略意义下的解(或简称解),和分别称为局中人Ⅰ和Ⅱ的最优混合策略(或简称最优策略)。
【定理2】矩阵对策在混合策略意义下有解的充要条件是:存在,使为函数的一个鞍点,即对一切,有
(3)矩阵对策的基本定理
先给出如下两个记号:
当局中人Ⅰ取纯策略时,记其相应的赢得函数为,于是
当局中人Ⅱ取纯策略时,记其相应的赢得函数为,于是
【定理3】设,则是的解的充要条件是:对任意和,有
【定理4】设,则为的解的充要条件是:存在数,使得和分别是不等式组(Ⅰ)和(Ⅱ)的解,且。
(Ⅰ)
【定理5】对任一矩阵对策,一定存在混合策略意义下的解。
【定理6】设是矩阵对策的解,,则
记矩阵对策的解集为。
【定理7】设有两个矩阵对策
其中,为任一常数,则有
【定理8】设有两个矩阵对策
其中为任一常数。则
【定理9】设为一矩阵对策,且为斜对称矩阵(亦称这种对策为对称对策)。则
【定义5】设有矩阵对策,其中,如果对一切都有,即矩阵的第行元素均不小于第行的对应元素,则称局中人Ⅰ的纯策略优超于;同样,若对一切,都有,即矩阵的第列元素均不小于第对应元素,则称局中人Ⅱ的纯策略优超于。
【定理10】设为矩阵对策,其中,如果纯策略被其余纯策略中之一所优超,由可得到一个新的矩阵对策
其中
于是有
【推论】在定理10 中,若不是为纯策略中之一所优超,而是为的某个凸线性组合所优超,定理的结论仍然成立。
(1)公式法、图解法和方程组法
(2)线性规划法
任一矩阵对策的求解等价于一对互为对偶的线性规划问题,而定理4表明,对策的解和等价于下面不等式组(Ⅰ)和(Ⅱ)的解。
(Ⅰ)
其中
就是对策的值。
【定理11】设矩阵对策的值为,则
(1)二人无限零和对策
【定义6】设为二人无限零和对策。若存在,使得
记其值为,则称为对策的值,称使上式成立的为在纯策略意义下的解,分别称为局中人Ⅰ和Ⅱ的最优纯策略。
【定理12】为在纯策略意义下的解的充要条件是:对任意,有
【定义7】如果有
则称为对策的值,称使上式成立的为对策的解,和分别为局中人Ⅰ和Ⅱ的最优策略。
【定理13】为对策的解的充要条件是:对任意,有
当,且为连续函数时,称这样的对策为连续对策。对连续对策而言,局中人Ⅰ、Ⅱ的混合策略即为区间上的分布函数。记区间上的分布函数的集合为,则有
对连续对策,记
【定理14】对任何连续对策,一定有。
(2)对多人非合作对策
一般非合作对策模型可描述为:
- 局中人集合:
- 每个局中人的策略集:(均为有限集)
- 局势:
- 每个局中人的赢得函数记为,一般来说,一个非合作n人对策一般用符号表示。
为讨论非合作n人对策的平衡局势,引入记号
它的含义是:在局势中,局中人将自己的策略由换成,其他局中人的策略不变而得到的一个新局势。如果存在一个局势,使得对任意,有
则称局势对局中人有利,也就是说,若局势对局中人有利,则不论局中人将自己的策略如何置换,都不会得到比在局势下更多的赢得。
【定义8】如果局势对所有的局中人都有利,即对任意,有
则称为非合作对策的一个平衡局势(或平衡点)。
【定义9】若对任意,有
则称为非合作n人对策的一个平衡局势(或平衡点)。
【定理15】(纳什定理)非合作n人对策在混合策略意义下的平衡局势一定存在。
(3)合作对策
构成合作对策的两个基本要素是:局中人集合和特征函数,其中,为的任一子集,也就是任何一个可能形成的联盟,表示联盟在对策中的所得。合作对策的可行解是一个满足下列条件的n维向量
将满足上述两式的向量称为一个分配。
(1)决策的分类
①按性质的重要性分类
可将决策分为战略决策、策略决策和执行决策,或叫战略计划、管理控制和运行控制。
战略决策是涉及某组织发展和生存有关的全局性、长远性问题的决策;策略决策是为完成战略决策所规定的目的而进行的决策;执行决策是根据策略决策的要求对执行行为方案的选择。
②按决策的结构分类
分为程序决策和费程序决策。
程序决策是一种有章可循的决策,一般是可重复的。
非程序决策一般是无章可循的决策,只能凭经验直觉做出应变的决策,一般是一次性的。
解决问题的方式 | 程序决策 | 非程序决策 |
传统方式 | 习惯,标准规程 | 直观判断,创造性观察,选拔人才 |
现代方式 | 运筹学,管理信息系统 | 培训决策者,人工智能,专家系统 |
③按定量和定性分类
分为定量决策和定性决策,描述决策对象的指标都可以量化时可用定量决策,否则只能用定性决策。总的发展趋势是尽可能地把决策问题量化。
④按决策环境分类
可将决策问题分为确定型的、风险型的和不确定型的。
确定型的决策是指决策环境是完全确定的,做出的选择的结果也是确定的。风险型决策是指决策的环境不是完全确定的,而其发生的概率是已知的。不确定型决策是指决策者对将发生结果的概率一无所知,只能凭决策者的主观倾向进行决策。
⑤按决策过程的连续性分类
可分为单项决策和序贯决策。
单项决策是指整个决策过程只作一次决策就得到结果,序贯决策是指整个决策过程由一系列决策组成。
(2)决策过程
构造决策行为的模型主要有两种方法:一种是面向决策结果的方法;另一种是面向决策过程的方法。
面向决策结果的方法认为:若决策者能正确地预见到决策结果,其核心是决策的结果和正确的预测。通常的单目标决策和多目标决策是属于这种类型的。面向决策结果的方法的程序比较简单,
面向决策过程的方法认为:若决策者了解了决策过程,掌握了过程和能控制过程,他就能正确地预见决策结果。面向决策过程的方法一般包括预决策→决策→决策后三个互相依赖的阶段。
预决策阶段是指当要决策的问题摆在决策者面前时,决策者能立即想到各种可能方案,并意识到没有理想的方案时,就会产生矛盾。他开始企图寻找减少矛盾的方案,沿着这企图扩大线索时,就需要收集信息。收集信息时开始比较客观,无倾向性,以后逐渐变得有主观和有倾向性了。当预决策进行得较顺利,可以进行局部决策。
决策阶段可分为分部决策和最终决策两个阶段。分部决策包括对决策处境作方向性的调整,如排除劣解,重新考虑已放弃的方案,增加和去掉一些评价准则。在合并一些方案后,减少了变量数和方案数,决策者按主观倾向重新估价各方案,并保留倾向的少数方案,以便进行最终方案。
决策后阶段,当进行了最终决策,这时主要考虑的问题是决策后看法不一致。这时决策者倾向于解释和强调已选方案的优点,并寻找更多的信息来证明已选方案的优点和正确性。
任何决策问题都由以下要素构成决策模型:
①决策者,他的任务是进行决策。决策者可以是个人、委员会或某个组织。一般指领导者或领导集体。
②可供选择的方案(替代方案)、行动或策略。参谋人员的任务是为决策者提供各种可行方案。这里包括了了解研究对象的属性,确定目的和目标。
- 属性是指研究对象的特性,它们是客观存在的,是可以客观量度的,并由决策者主观选定。
- 目的是表明选择属性的方向,反映了决策者的要求和愿望。
- 目标是给出了参数值的目的。
③准则是衡量选择方案,包括目的、目标、属性、正确性的标准,在决策时有单一准则和多准则。
④事件是指不为决策者所控制的客观存在的将发生的状态。
⑤每一件事的发生将会产生某种结果,如获得收益或损失。
⑥决策者的价值观。
(3)不确定型的决策
所谓不确定型的决策是指决策者对环境情况一无所知。这时决策者是根据自己的主观倾向进行决策。常用的处理这类不确定型决策问题的方法有:乐观值准则、悲观值准则、折中值准则、后悔值准则和等可能准则。
设为可能选择的第个策略,为可能出现的第个自然状态,那么不确定型决策问题一般可用下述5个要素来描述:
- 策略集;
- 自然状态集;
- 收益函数——采取策略而出现状态时的收益值;
- 自然状态的概率分布——状态出现的概率;
- 决策目标。
收益函数可以由矩阵给定,称矩阵为收益矩阵,也可描述成下表所示的决策收益表:
状态以及概率分布 策略
①乐观值决策准则
采用乐观值决策准则的决策者,属于敢承担风险的进取型人才,对未来结果往往持乐观的态度,总是假设出现最有利的状态,认为即使出现不利的情况也未必会有多大的损失,但是一旦出现最有利的情况却能得到很大的收益。乐观值决策准则又称大中取大的准则。该准则为:
i.根据效益矩阵,确定每一个策略可能获得的最好结果:
ii.选取,使得。
②悲观值决策准则
采用悲观值决策准则的决策者,决策比较谨慎,不希望因为决策失误而造成失误,是从每一个可能出现的最差结果出发,通过分析多种最坏的可能结果,从中选择最好者,即从最不利的结果中选择最有利的结果,悲观值决策准则又称小中取大的准则。该准则为:
i.根据效益矩阵,确定每一个策略可能得到的最坏结果:
ii.选取,使得。
③折中值决策准则
折中值决策准则是介于悲观和乐观之间的决策准则,认为乐观值决策准则太冒险,悲观值决策准则太保守,那么考虑折中一下。即既不完全乐观,也不完全悲观,而是采用引进一个乐观系数来反映;而就称为悲观系数。该准则为:
i.根据乐观值准则中的和悲观值中的计算折中值:
ii.选取,使得。
④后悔值决策准则
在决策过程中,当某种状态可能出现时,决策者必然要选择使收益最大的策略,但决策者由于决策失误而没有选择收益最大的策略,就会感到后悔。后悔值决策准则的思想就是尽量减少决策后的后悔程度。衡量决策者后悔程度的一个指标,称为后悔值。事实上,相应于每对都可以定义一个后悔值:
其中为决策者在状态时可获得的最大收益,即。该准则为:
i.计算出后悔值;
ii.对每个可能产生后悔最大的数值:
iii.选取,使得
⑤等可能决策准则
在各种自然状态发生的概率总是相同的条件下。采用等可能决策准则来选择最优策略。该准则为:
i.计算各策略在各自然状态等概率条件下的效益期望值:
ii.由期望值中的最大者,来确定相应的作为最优策略。
(4)风险决策(随机型决策)
风险决策是指决策者对客观情况不甚了解,但对将发生各事件的概率是已知的。在风险决策中一般采用期望值作为决策准则,常用的有最大期望收益决策准则和最小机会损失决策准则。
①最大期望收益决策准则(expected monetry value,EMV)
决策矩阵的各元素代表“策略—事件”对的收益值,各事件发生的概率为。先计算各策略的期望收益值
然后从这些期望收益值中选取最大者,它对应的策略为决策应选策略。即
EMV决策准则适用于一次决策多次重复进行生产的情况,所以它是平均意义下的最大收益。
②最小机会损失决策准则(expected opportunity loss,EOL)
矩阵的各元素代表“策略—事件”对的机会损失,各事件发生的概率为,先计算各策略的期望损失值。
然后从这些期望损失值中选取最小者,它对应的策略是决策者所选策略。即
③EMV与EOL决策准则的关系
从本质上讲EMV与EOL决策准则是一样的。在决策时用这两个决策准则所得结果是相同的。
④全情报的价值(expected value of perfactinformation,EVPI)
当决策者耗费了一定经费进行调研,获得了各事件发生概率的信息,应采用“随机应变”战术。这时所得的期望收益称为全情报的期望收益记作EPPL。这收益应当大于至少大于最大期望收益,即,则
称为对全情报的价值。这就是说获取情报的费用不能超过EVPI值,否则就没有增加收入。
⑤主观概率
风险决策时决策者要估计各事件出现的概率,而许多决策问题的概率不能通过随机试验去确定,根本无法进行重复试,只能由决策者根据他对这件事的了解去确定。这样确定的概率反映了决策者对事件出现的信念程度,称为主观概率。客观概率论者认为概率是研究对象的物理属性。而主观概率论者则认为概率是人们对现象的知识的现状的测度,而不是现象本身的测度。所以主观概率是进行决策的依据。确定主观概率时,一般采用专家估计法。
i.直接估计法
ii.间接估计法:参加估计者通过排队或相互比较等间接途径给出概率的估计方法。
⑥修正概率的方法——贝叶斯公式的应用
在随机型决策中,对自然状态的概率分布所作估计的精确性,直接影响到决策的收益期望值,称概率分布为先验概率。为了提高先验概率的精确性,可以对决策系统进行一次试验或者调查,并根据试验或者调查的结果来修改先验概率,以便在计算新的各个相关受益期望值时可以把新的信息体现在模型中,称这些新的概率分布为后验概率。决策者通过调查及做试验等途径去获得更多的更确切的信息,以便掌握各事件发生的概率,这时可以利用贝叶斯公式来实现,它体现了最大程度的利用现有信息,并加以连续观察和重新估计。其步骤为:
i.先由过去的经验或专家估计获得将发生事件的先验概率。
ii.根据调查或试验计算得到条件概率,利用贝叶斯公式:
计算出各事件的后验概率。
假定试验或者调查后出现的结果是,并且条件概率能够估算出来。贝叶斯决策的基本步骤是:
i.验前分析。决策者根据自己的经验和判断估计,然后凭借这种验前概率分布和收益函数,计算,利用期望值准则做出决策。假定相应得出的收益期望值为。
ii.预验分析。在实际试验或者调查前,可先对是否值得花一笔费用进行试验或者调查以获得新信息进行研究分析,从而作出是否试验或者调查的抉择。
iii.验后分析。在实际问题中,如果确实进行了试验或者调查,根据所得结果对验前概率分布作修正,得出验后概率分布,由新的概率分布和效益函数,计算新的,利用期望值准则重新作决策。
iv.阶段分析。为了提高决策的正确性,将试验或者调查搜索信息的过程划分为若干阶段,在每一阶段都作预验分析和验后分析。
(5)效用函数方法
①效用值决策准则
效用值是一个相对的指标,它的大小表示决策者对于风险的态度,对某事物的倾向和偏差等主观因素的强弱程度,在一个决策问题中,通常情况下,将可能得到的最大收益值的效用值取为1;而把可能得到的最小收益值的效用值取为0。为此,在对某个问题提供决策的咨询意见时,可以通过与决策者的对话来建立相应的效用函数。此效用函数能在一定程度上反映决策者在决策问题上的决策偏向和评价标准。于是,利用这种效用函数作决策,依据的原则就被称为效用值准则。
②效用函数曲线
如何通过与决策者对话建立相应的效用函数呢?对于一个决策问题,如果最小收益值为,最大收益值为,以收益为自变量,上的效用函数设为,并有。对于,称为的效用值,。
一般可以用插值方法来确定中其他的效用值,若已知和,,如果通过对话不断修改之值,直至最后发现决策者心目中“稳获利的假想方案与获利的概率为、获利的概率为之假想方案的效用值是相等”的时候,则令
若已确定中对应的效用值,那么就可以用一条光滑曲线把这些点连接起来,这就是效用函数曲线。
不同的决策者对待风险的态度有所不同,因此会得到形状不同的效用曲线。一般有保守型(避险型)、冒险性(进取型)和中间型(无关型)3种类型。
i.保守型
这是一条上凸曲线。它的特点是当收益值较小时,效用值增加较快;而随着收益值的增大,效用值增加的速度越来越慢。
ii.冒险型
这是一条下凹曲线。它的特点是:当收益值较小时,效用值增加较为缓慢;而随着收益值的增大,效用值增加的速度越来越快。
iii.中间型
这是一条直线。它的特点是:收益值与效用值成正比例上升。
③效用曲线的确定
确定效用曲线的基本方法有两种,一种是直接提问法;另一种是对比提问法。
i.直接提问法
直接提问法是向决策者提出一系列问题,要求决策者进行主观衡量并作出回答。
ii.对比提问法
提问的方式大致是每次固定其它值,改变其中一个变量,问决策者:变量取何值时,认为几个决策方案等价。
④效用曲线的拟合
当用计算机时需用解析式来表示效用曲线,并对决策者测得的数据进行拟合,常用的关系式有以下六种:
(6)决策树
描述序列决策的有力工具之一是决策树,决策树是由决策点,事件点及结果构成的树形图。
决策树就是将问题中有关策略、自然形态、概率及收益值等,通过线条和图形用类似于树状的形式表示出来。借助于决策树,利用期望值准则作决策,具体步骤如下:
①绘制决策树:自左至右绘制;
②计算期望值:自右向左计算各策略的期望值,并将结果标在相应的状态结点处;
③选择策略:根据期望值最大准则从后向前进行“剪枝”决策,直到开始的决策点,选出期望值最大的策略。
(7)灵敏度分析
通常在决策模型中自然状态的概率和损益值往往由估计或预测得到,不可能十分正确,此外实际情况也在不断地变化,现需分析为决策所用的数据可在多大范围内变动,原最优决策方案继续有效,进行这种分析称为灵敏度分析。
若数据在某允许范围内变动,而最优方案保持不变,这方案就是比较稳定的。反之,这些数据在某允许范围内稍加变动,则最优方案就有变化,这方案就是不稳定的。由此可以得出那些非常敏感的变量,那些不太敏感的变量,以及最优方案不变条件下,这些变量允许变化的范围。
(1)基本概念
假定有m个目标同时要考查,并要求越大越好。在不考虑其他目标时,记第个目标的最优值为
相应的最优解记为;其中是解的约束集合。
当这些都相同时,就以这共同解作为多目标的共同最优解。为了与单目标最优化的记号有所区别,用
或
表示在约束集合内求多目标问题的最优(亦称求向量最优);其中
若各目标值都要求越小越好,就用下式表示:
假定所有解是属于全空间中某一个约束集合,即,在上对任一个解可以定义一个半序:,(表示优于),且可把分成三个子集:
显然
【定义1】解叫做在内“非劣”,如果。
【定义2】解叫做在内最优,如果。
【推论】若是最优解,则必为非劣解。反之不然。
(2)化多为少的方法
①主要目标法
i.优选法
在实际问题中通过讨论分析,抓住其中一两个主要目标,让它们尽可能好,而其他指标只要满足一定要求即可。
ii.数学规划法
设有m个目标要考查,其中方案变量(约束集合),若以某目标为主要目标,如要求实现最优(最大),而对其他目标只满足一定规格要求即可,如
其中,当或就变成单边限制,这样问题可化成求下述非线性规划问题:
②线性加权和法
若有m个目标,分别给以权系数,然后作新目标函数(也称效用函数)。
该方法的难点是如何找到合理的权系数,使多个目标用同一尺度统一起来。同时所找到的最优解又是向量极值的好的非劣解。
i.α—法
对于有m个目标的情况,不妨设其中要求最小化,而要求最大化,这时可构成下述新目标函数,
其中满足方程组
其中
ii.λ—法
当m个目标都要求实现最大时,可用下述加权和效用函数,即
③平方和加权法
设有m个规定值,要求m个函数分别与规定的值相差尽量小,若对其中不同值的要求相差程度又可不完全一样,即有的要求重一些,有的轻一些。这时可采用下述评价函数:
要求,其中可按要求相差程度分别给出。
④理想点法
有m个目标,每个目标分别有其最优值
若所有都相同,设为,则令时,对每个目标都能达到其各自的最优点,可惜一般做不到,因此对向量函数
来说,向量
只是一个理想点(即一般达不到它)
理想点法的中心思想是定义一定的模,在这个模意义下找到一个点尽量接近理想点,即让模
对于不同的模,可以找到不同意义下的最优点,这个模也可看做评价函数,一般定义的p-模式:
其中,p的取值一般在。
⑤乘除法
当m各目标,不妨设其中k个要求实现最小,其余要求实现最大,并假定
这时可采用评价函数
⑥功效系数法——几何平均法
设m个目标,其中个目标要求实现最大,个目标要丢实现最小,其余的目标是过大不行,过小也不行。对于这些目标分别给以一定的功效系数(即评分),是在之间的某一数。当目标最满意达到时,取;当最差时取。描述与的关系,称为功效函数,表示为。对于不同类型目标应选用不同类型的功效函数。
Ⅰ型:当越大;也越大;越小,也越小。
Ⅱ型:越小,越大;越大,越小。
Ⅲ型:当取适当值时,最大;而取偏值(即过大或过小)时,变小。
具体功效函数构造法可以很多,有直线法,折线法,指数法等等。
(3)分层序列法
由于同时处理m个目标是比较麻烦,故可采用分层法。分层法的思想是把目标按其重要性给出一个序列,分为最重要目标、次要目标等。设给出的重要性序列为
下面介绍逐个地求最优化的序列最优化。
首先对第一个目标求最优,并找出所有最优解的集合记为,然后在内求第二个目标的最优解,记这时的最优解集合为,如此等等一直到求出第m个目标的最优解,其模型如下:
该方法有解的前提是非空,同时都不能只有一个元素,否则就很难进行下去。
当是紧致集,函数都是上半连续,则按下式定义的集求解。
,其中都非空,特别是非空。故有最优解,而且是共同的最优解。
(4)直解求非劣解
若假设约束集合为凸集,只要不断改变权系数,对其相应的加权和目标函数
求出的最优解可以跑遍所有多目标问题的非劣解集,但这方法只是从原则上(而且要有一定假设)可以求出所有非劣解,而在实际处理上却有一定的困难。如何依次变动权系数,而使其得出最优解,正好得到所有非劣解。
(5)多目标线性规划的解法
①逐步法(STEM)
逐步法是一种迭代法。在求解过程中,每进行一步,分析者把计算结果告诉决策者,决策者对计算结果做出评价。若认为已满足了,则迭代停止;否则分析者再根据决策者的意见进行修改和再评价,如此直到求得决策者认为满意的解为止,故称此法为逐步进行法或对话式方法。
设有个目标的线性规划问题
其中,为m×n矩阵,为k×n矩阵,也可表示为
求解的计算步骤为:
第一步:分别求个单目标线性规划问题的解。
得到最优解及相应的。显然
并做表,如下所示。其中,
第二步:求权系数。
从表中得到
及
为了找出目标值的相对偏差以及消除不同的目标值的量纲不同的问题,进行如下处理。
经归一化后,得权系数
第三步:构造以下线性规划问题,并求解。
假定求得的解为,相应的个目标值为,若为决策者的理想解,其相应的个目标值为。这时决策者将的目标值进行比较后,认为满意了就可以停止计算。若认为相差太远,则考虑适当修正。如考虑对第个目标宽容一下,即让点步,减少或增加一个,并将约束集改为
并令第个目标的权系数,这表示降低这个目标的要求。再解以下线性规划问题。
若求得的解为,再与决策者对话,如此重复,直到决策者满意为止。
②妥协约束法
设有两个目标的情况,即
,为m×n矩阵,
这方法的中心是引进一个新的超目标函数。为权系数,;此外构造一个妥协约束
分别为的最大值(当)。求解的具体步骤为
第一步:解线性规划问题。
得到最优解及相应的目标函数值。
第二步:解线性规划问题。
得到最优解及相应的目标函数值。
在具体求解时可以先用试一试,看是否是的最优解。若是,则这问题已找到完全最优解,停止求解;若不是,则求及相应的。
第三步:解下面三个线性规划问题之一
得到的解为妥协解。
(6)层次分析法
层次分析法是一种定性与定量分析相结合的多目标决策分析方法。特别是将决策者的经验判断给予量化,对目标(因素)结构复杂且缺乏必要的数据情况下更为实用。
①AHP法原理
设有n/件物体;它们的重量分别为。若将它们两两比较重量,其比值可构成n×n矩阵。
矩阵具有如下性质:若用重量向量
右乘矩阵,得到
即
由矩阵理论可知,为特征向量,为特征值。若为未知时,则可根据决策者对物体之间两两相比的关系,主观作出比值的判断,或用Delphi法来确定这些比值,使矩阵为已知,故判断矩阵记作。
由于人们对复杂事物的各因素,采用两两比较时,不可能做到判断的完全一致,而存在估计误差,这必然导致特征值及特征向量也有偏差。这时,问题由变成,这里是矩阵的最大特征值,便是带有偏差的相对权重向量。这就是由判断不相容引起的误差,为了避免误差太大,所以要衡量矩阵的一致性,当矩阵完全一致时,因,
存在唯一的非零。而当矩阵存在判别不一致时,一般是。这时
以其平均值作为检验判断矩阵一致性指标(CI)。
当,为完全一致;CI值越大,判断矩阵的完全一致性越差。一般只要,认为判断矩阵的一致性可以接受,否则重新进行两两比较判断。
判断矩阵的维数n越大,判断的一致性将越差,故应放宽对高维判断矩阵一致性的要求。于是引入修正值RI,见下表,并取更为合理的CR为衡量判断矩阵一致性的指标。
维数 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
RI | 0.00 | 0.00 | 0.58 | 0.90 | 1.12 | 1.24 | 1.32 | 1.41 | 1.45 |
②标度
为了使各因素之间进行两两比较得到量化的判断矩阵,引入1~9的标度。根据心理学家的研究提出:人们区分信息等级的极限能力为,特制定下表
标度 | 定 义 |
1 | 因素与因素同样重要 |
3 | 因素比因素略重要 |
5 | 因素比因素较重要 |
7 | 因素比因素非常重要 |
9 | 因素比因素绝对重要 |
2,4,6,8 | 为以上两判断之间的中间状态对应的标度值 |
倒数 | 若因素与因素比较,得到判断值为 |
因为自己与自己比是同等重要的,因此对角线上元素不用做判断比较,只需要给出矩阵对角线上三角形中的元素。
除上表的标度方法意外,还可以用其他标度的方法。
③层次模型
根据具体问题一般分为目标层、准则层和措施层。复杂的问题可分为总目标层、子目标层、准则层(或制约因素层)、方案措施层,或分为层次更多的结构。
④计算方法
一般讲,在AHP法中计算判断矩阵的最大特征值与特征向量,并不需要很高的精度,故用近似法计算即可。最简单的方法是求和法及其改进的方法,但方根法更好。
i.方根法
当各层次的诸因素的相对权重都得到后,进行措施层的组合权重设计。
ii.组合权重计算
设有目标层A,准则层C、方案层P构成的层次模型,目标层A对准则层C的相对权重为
准则层的各准则对方案层P个方案的相对权重为
那么各方案对目标而言,其相对权重是通过权重与组合而得到的,其计算可采用下列表格进行。
P层 | 因素及权重 | 组合权重 |
C层
|
||
(1)一台机器和n个工件的排序问题
【例4-1】设一个机修车间(可以把它看作一台机器)有台不同的机床(可以看作为工件)要进行大修。它们的维修时间已知为。而机床在车间逗留的过程中,每单位时间的损失费为。试求一种排序,使得台机床在修理完毕时,总的损失费为最小。
令集合
为的一种排序
若现在台机床维修的排序为,则机床维修完毕的时间,台机床按此排序维修完毕时总的损失费为。因此,本问题即为寻找一种排序满足条件:
【定理4-1】若在排序中,有
则排除比为优。
【例4-2】设有个工件要在一台机器上加工,加工时间分别为,要求的交货日期分别为,试求一种加工排序,使得误期交货的工件最少。
【定理4-2】若为满足的一种排序,为这种排序下工件的交货日期,若为满足下列条件的正整数:
又设
则有
根据定理4-2,对本问题建立如下算法:
①取初始排序,满足:
②是否存在正整数,使得,且有
若是,则取。令,取,转步骤②。
若否,则算法终止。集合中元素个数为误期工件个数(为有序集合)。
(2)两台机器和n个工件的排序问题
【例4-3】现有个零件,这些工件都必须先经机器加工,再在机器上加工,且规定机器加工工件的排序必须一致。已知机器加工工件的时间为。问这个工件应如何排序(假设机器开始加工第一个零件的时刻为零),使机器加工完最后一个工件的总完工时间最早?
【定理4-3】对于排序及排序,若有
或
则排序的总完工时间不大于排序的总完工时间。
将两台机器加工个工件的排序问题的算法归纳如下:
①取初始排序
②
若是,则算法终止。即为所求(仅含一个序号:)
若否,则取,转步骤③。
③若的指标,则,
若的指标,则,转步骤②。
在本算法中,R及M都为有序集。
(3)3台机器和n个工件的排序问题
【例4-4】3台机器加工个工件。每个工件先经机器加工,然后由机器加工,再由机器加工,且3台机器加工此个工件的顺序必须一致。设机器加工工件的时间为。问这个工件应如何排序,使总完工时间最小?
对这类问题采用分支定界法来求解。
若为的一个排列,则3台机器按照排序加工个工件的总完工时间记为。对排序,可以构造一个赋权有向图,如下图所示。
【定理4-4】中顶点至顶点的最长路径长度为。
(1)旅行售货员问题
【例4-5】(旅行售货员问题)现有一位旅行售货员欲到城市进行商品销售。已知从城市到城市旅途所需时间为。现在他从个城市中的某一个城市出发,试问他应该如何计划他的旅行路线,使它对每个城市恰好进行一次访问后又返回出发城市,而旅途所花费时间最少?
给出启发性算法。
— | ||||
— | ||||
— |
首先在诸中选取最小元素,在上表中划去行及列和元素。然后从出发,在行未划去的元素中选取最小元素,划去行、列和元素。再从出发,在行未划去的元素中选取最小元素。以此类推,直到得到一条旅行售货员路线。
最近邻点启发性算法步骤如下:
①取,令。
②
若是,取,,转步骤②。
若否,转步骤③。
③,算法终止。
(2)分支定界法
对旅行售货员问题例4-5,列出其模型,设
于是,得旅行售货员问题的0-1规划模型:
其中(充分大的正数)。设其可行域为,该问题记为。
现在用分支定界法求解,取其松弛问题为
记它的可行域为,该问题记为。显然,有。
问题为一个最优分配问题,其费用矩阵,因此可用匈牙利方法求解。
现记。若用匈牙利方法求解,得最优解,且。于是,在中存在子回路。不妨设其中一个为
现令
由于中任一可行解不允许存在子回路,因此,有
从而有
而
所以,在中取个子集:
且有
问题相应的松弛问题的可行域分别为
在用匈牙利方法对分别求解时,应将费用矩阵中元素分别改为(充分大的正数),
初始时,不妨取中的一个可行解:,其余;取该可行解的目标函数值为定界:
1.运筹学教材编写组 编. 《运筹学》第4版. 清华大学出版社. 1982
2.傅家良 编著. 《运筹学方法与模型》. 复旦大学出版社. 2014