肖人彬华中科技大学讲决策理论第三讲多目标决策概述

讲师:肖仁斌,华中科技大学管理学院,第一讲,决策理论基础,第二讲,统计决策理论,第三讲,多目标决策概述,第四讲,层次分析法及其新进展 6, , 7, to DSS and :决策过程(狭义)决策:决策行为智能设计/生成选择实现运筹学的一个分支是经济和管理科学的重要组成部分,或控制论的延伸。决策理论也是系统科学和系统工程的重要组成部分。决策理论是社会科学与自然科学的相互作用。 ,有不同的分类标准,主要包括: 1.按容易区分的因素划分 2.按涉及的宽度划分 3.个人事务决策和公务决策 4.决策者的角色和决策分析员分为四元组 形式上表示决策要素的自然状态集合——(也表示为 S 或 Ω,下面两篇讨论) 概率和主观概率 概率的定义是在 1812 年给出的,而ov 在 1930 年的定义中给出了概率公理。

上述概率是对重复试验中随机事件A发生概率的度量。在实际决策问题中,自然状态的概率无法通过反复实验得到,通常不包括同等可能的基本事件。由于以上原因,需要一种在频率观点不适用且实际不可能进行随机实验时设置概率的方法,即主观概率( );同时,上述概率称为客观概率( )。概率的数学定义 上述定义适用于客观和主观概率,即两者具有完全相同的数学定义。客观概率论者认为,概率是系统固有的客观属性,是相同条件下重复实验频率的限制。主观概率论者认为,概率是观察者的属性,而不是系统的属性,是观察者在一定状态下对系统的信任程度。在决策分析中,未通过实验收集到状态信息的信息称为先验信息,由先验信息确定的概率分布称为先验分布(Prior)。设置先验分布是贝叶斯分析(Bayes)的要求。设置先验分布时的几个假设 假设1 连通性(),也称为可比性() 假设2 传递性() 假设3 部分小于整体 假设4 为离散事件序列,B 为固定事件,任意假设5 区间[0, 1]内有一个均匀分布的随机变量。

先验分布的设置——离散变量和连续变量1、离散随机变量的先验分布设置下注方式以上两种方式只适用于状态数较少的场合。当状态的数量很大时,可以使用下面描述的相对似然法。直方图法 这种方法适用于以 θ 值为实轴的一定区间。具体步骤是: 对区间进行离散变换 这种方法的主要缺点是: 不容易确定每个子区间的似然比0.050.1 0.15 < @0.2 0.25 1% 2% 3% 4% 5% 6% 7% 8% 9% 10% 11% 12% 相对似然法 这种方法适用于某个区间的值θ 是实轴。具体步骤是给每个子区间赋值,进行离散化。有两种方法: a) 选择似然比最高的一种。子区间用作基准; b) 给出了每两个子区间的似然比之间的比例关系。归一化区间二分法适用于随机变量。这是一个开区间步骤。最多确定 () 缺点:与给定形式的分布函数匹配的精度差 这是最常见且经常被滥用的方法步骤:选择与先验信息最匹配的函数,例如均匀分布、二项分布、正态分布、泊松分布、指数分布、柯西分布等。参数估计决定了先验概率密度函数的参数。一种更好的方法是分位数方法。决策者主观估计先验分布的几个分位数,然后选择合适的分布函数形式得到概率密度。该函数尽可能地匹配这些分位数。

使用过去的数据来设置先验分布1、带有θ的统计数据当它确实是客观概率论意义上的随机变量时,有时会有统计数据可以用来设置先验分布。在过去的类似情况下无法直接观察到2、状态θ时效用函数是凹函数含义,在定量评估可能动作的各种后果时遇到了两个主要问题。一是后果本身是用文字表达的,可能没有任何合适的直接衡量尺度。其次,即使有一个明确的衡量后果的尺度,在这个尺度上衡量的数量也可能无法反映后果对决策者的真实价值。让我们看下面两个例子: 例子 3.1 考虑金钱对同一个人的价值。假设一个学生很紧张,有机会赚100块钱,但他要做的只是一份他很讨厌的工作。 1)如果他的经济状况不好,他会认为100元的实际价值已经足够大,即使要做的工作很烦人,他还是会去做; 2)如果他先有10000块钱,如果他想做这份他讨厌的工作,100块钱,他很可能会辞职。所以,10100元的价值不等于10000元的价值加上你身无分文时的100元的价值。这就是经济学中的边际递减价值。这个例子说明,即使数字量化的后果,它对决策者的实际价值仍有待确定。示例 3.2 决策者面临图 3.1 中决策树所示的选择:获得 1000 元的礼物,或参与抽奖:50% 的机会获得 0 元, 50% 的机会获得 2500 元。

礼品抽奖图3.1 示例3.2 决策树0.5 0.5 2500 1.01000 有1000元的收入,确定性为选择。彩票的期望值虽然大,但风险也大,实际价值还不如1000元的保险。而也有人认为礼物不如抽奖,因为抽奖提供了抽2500元的机会。从以上两个例子可以看出:在进行决策分析时,存在一个问题,即如何向决策者描述或表达后果的实际价值,从而反映决策者心中对各种后果的偏好顺序。 偏好顺序是决策者个性和价值观的反映,与决策者的社会地位、经济地位、文化素养、心理和生理(生理)状况有关。在决策理论中,后果对决策者的实际价值,即决策者对后果的偏好顺序用效用( )来描述。效用是偏好的量化,一个数字(实值函数)。他在 1738 年指出,如果一个人面临从给定行动集合(风险前景集合)中进行选择的决策问题,如果他知道与给定行动相关的未来自然状态,以及这些状态的概率发生是已知的。或者可以估计,他应该对各种可能的后果选择偏好期望值最高的动作。效用的定义 1。基本概念和符号);也就是说,除非受到外部因素的逼迫,否则决策者只会选择a而不选择b。

无差异“~”a~b(或记为aIb)意思是“a与b无法区分”b);也就是说,决策者对选择感到满意或同等满意。 () 前景是指决策的可能前景,即各种后果的组合和后果发生的概率,记为P=抽签,确定当量由机会点和每个机会分支的概率组成由这个机会点和相应的后果发出的图形称为彩票(),彩票也称为彩票。决策者认为某个确定性结果与彩票没有区别,即 ,则该确定性结果称为彩票的确定性等价物 ( )。 1.0 2.效用的定义 根据上面的讨论和符号,效用函数的定义可以初步给出如下。将 3.1 定义为效用函数。效用函数定义在前景集 P 而不是结果集 C 上,使得效用函数可以反映决策者的状态效用存在公理(理性行为公理 3.1 连通性() 也称为 ( ) .2 () .3 .4 Axiom ( of ) . 3 过马路问题例子3. 4 狂犬病疫苗接种问题(类似例子3.3 案例3.悖论() 但马路过马路 10 -8 1-10 -8 死亡达到目的1.0 无法到达目的地0.89 $500,000 0.11 场景 B0.90 $2,500,0000.10 0.890.01 $500,000 $2,500,0000.10 $500,000 1.00 Case A ii.u(aP iii. 对于满足上述条件的 u(P) 称为(基数)效用函数 * 关于线性:泛化 ii. 通俗地说,基数:实数,例如 1, 2、3、π序数:如first、、…、4、3、2、1的区别基数效用函数和序数效用函数之间:1.基数效用函数定义在前景集P上(考虑后果及其概率分布),是一个实数;序数效用定义在结果集C上,不涉及概率,可以是整数正数。

2.基数效用反映偏好强度:(在正线性变换下,只有一)原始序列可以变换为:b+c, 2b+c, 3b+c, 100b +c; 其中序数不反映偏好强度,(只有一)在保序变换下,原序数可以变换为16,9,4,1;或者8,6,4效用函数是凹函数含义, 2, or 10,7,6, 的存在公理: .1′ 结果C上连通性的优先关系是连通的,即如果公理3.2’传递性公理3.3′ 连续性对任何确定性结果成立,其下级集和上级集都是闭集。定理3.2 如果结果 C 上的优先关系满足上述公理3.1′ 到公理< @3.3' ,则在C上有一个(序数)效用函数,所以: 在保序变换下是唯一的,即当f是严格递增函数时,它仍然是序数效用函数上。 3.3 构造效用函数的方法 1. 估计效用的方法 函数值 概率等价法 确定性等价法 增益等价法 损失等价法 从纯理论的角度来看,这四种方法没有本质区别;增益的保守性)和损失的风险比概率等价法(, 1982))更严重;增益等价法和损失等价法产生的误差也比概率等价法大, 所以只要有可能 , 尽量使用概率等价3.32. 离散结果的效用 当结果是离散随机变量时, 结果集 C 中的元素个数是有限的, 并且在结果集上构造效用函数有两个方面,一是确定结果之间的优先级,二是确定结果之间的优先级。

离散后果效用值可以通过概率等价法,简称NM法来设定。该方法的具体步骤如下: 示例3.6 天气预报说比赛期间可能会下雨,足球迷想决定是否去球场看比赛。首先,该问题的决策树如图所示。从题意可以看出,决策者对四种后果的排序是:c.看球看电视 第二步是问决策者,下雨在家看电视的后果就相当于去球场看球被淋雨的概率。如果决策者的答案是 0.3,那么 c = 0.7。第三步,问决策者,不下雨看电视的后果就相当于下雨去球场看球的概率。如果决策者的答案是 0.6,那么 c=0.4 。第四步是执行一致性检查。 ,验证通过。当c为连续变量时,u(c)是光滑的,因此可以分段构造,计算特征点的效用,然后连接形成光滑曲线。随着学习时间的增加,效用值也会增加。但由于进入状态需要一定的时间,当t较小时,效用的增加较慢;在短时间内,效用和花费的时间基本呈线性关系;随着学习时间的不断增加,人会感到疲倦,效率会下降;如果时间过长,此时的效果不如时间适中,即有一个效用值最大的点tm;如果学习时间增加,它会从最大效用值开始减少。其中对应于效用最大值的 tm 因人而异。由于效用函数的唯一性(即在正线性变换下唯一,见效用公理化定义),效用的取值范围可以是整个实轴,不一定限于[0,1]区间。

风险的含义 Risk包括两个方面,一是损失后果的严重程度,二是损失的可能性。有几种风险度量: 方差 情景 a 自方差 当注意力集中在可能的损失上时,自方差可用于衡量风险。式中,c为决策者设定的临界值,即决策者将小于收益的部分视为风险。使用自方差具有集中研究风险的优点,但并不可靠。临界概率是概率密度函数在临界值以下的区域。不过这个描述还是比较粗略的,如下图(c),但一般人认为选项a的风险更大。的风险定义。 a=2时,上式为自方差;当a=0时,上式为临界概率。对风险的态度显示为几个典型的效用函数曲线。曲线 A 是凹函数,曲线 N 是线性函数,曲线 P 是凸函数。这三种曲线形状反映了决策者的三种风险态度:风险厌恶(risk)、风险中性(risk)和风险追求(risk pr)。 2、对后果的偏好强度考虑货币的边际价值:假设一个人的现有储蓄为0,则增加1000元对这个人的影响(价值)等于增加1000元后增加1500元的效果(价值)。值函数是一个凹函数,如右图所示。如果向决策者询问货币后果的实际价值,即效用,决策者认为是1000元(0.5,0;0.5,2500) ,那么这个人与其说是风险厌恶,不如说他是相对风险中性的。

因此,有必要量化确定性后果的偏好强度,即可测量的价值函数。 3、可测量值函数——结果偏好强度的确定性量化定义:结果空间 X 上的实值函数 v 称为可测量值函数。可测量值函数的示意图如右图所示。解释:z) 表示 w 和 x 之间的偏好强度之间的差异超过了 y 和 z 之间的偏好强度之间的差异。根据定义中的性质,可测价值函数具有基数,这与基数效用不同,因为价值函数不反映决策者的风险态度。可测价值函数设置在后果空间上,可以起到序数效用的作用,但它不同于序数效用函数:因为序数效用函数不能反映决策者对后果的偏好强度,而是函数可以反映结果的偏好强度。决策者真实的风险态度称为相对风险态度(risk)。假设效用函数和测量值函数都是单调递增且连续二次可微的。 1. 效用函数反映的局部风险度量是线性的,风险中性的。风险追踪2。偏好强度的局部度量,由可测量的价值函数反映,边际值在 x 3 处递增。决策者的真实风险态度称为 x 处的相对风险厌恶,称为 x 处的相对风险追求

© 版权声明
THE END
喜欢就支持一下吧
点赞61赞赏 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容