[文集] [专题] [检索] [独立评论] [海阔天空] [矛盾江湖] [全版论坛]

独立评论

作者: 录娄脥路脠芒   脭脵脵漏脪禄掳脩隆掳脣芦潞矛掳眉脩冒脙媒隆卤 2022-08-13 03:28:49  [点击:3328]
一、悖论的回顾

前一帖介绍了概率论中的一个悖论。为了方便讨论,俺姑且称其为“双红包悖论”,它的一个版本复述如下。

设想有家商场在搞促销,商店老板为每个购物者准备了两个外观相同的红包,其中的一个所含金额是另一个的两倍。顾客预先并不知晓红包中的钱数,他被允许任意抽取一只红包作为奖品。根据抽奖规则,当抽奖者打开抽到的红包,观察到其中的金额为 \(x>0\) 元之后,将面临一次额外的选择机会——他既可以保留红包,也可以把到手的奖金归还给老板,换取老板手里的另一只红包。

这位顾客推断老板手里的那只红包要么装有 \(x_H=2x\) 元,要么装有 \(x_L=x/2\) 元。假定这两种可能性出现的几率分别为 \(\nu_1\) 和 \(\nu_2\),那么该红包所含金额的期望值为
\[
E=\nu_1\cdot x_H+\nu_2\cdot x_L=\left(2\nu_1+\frac{\nu_2}{2}\right)x
\label{av}
\tag{1}
\]
倘若 \eqref{av} 式之值小于已抽到的 \(x\) 元,顾客显然愿意保留已经到手的奖金离开商场;否则,若 \(E > x\),他将希望进一步和老板交易,更换红包,以获得更大的收益。

由于顾客对老板的封装过程一无所知,况且第一只红包是自己随机抽取的,挡在“无知之幕”外面的他只能先验地假设另一只红包装有 \(x_H=2x\) 元的几率跟装有 \(x_L=x/2\) 元的几率是相等的,\(\nu_1=\nu_2=\frac{1}{2}\)。将这些先验值代入 \eqref{av} 式,便可算出留在老板手里的红包含有金额的期望值为 \(E=5x/4\)。

令人多少有些惊奇的是,期望值 \(E=5x/4\) 总是大于已抽到手的金额 \(x\),抽奖者难免觉得更换红包永远是划算的。问题是两个外观相同的红包,为何偏偏自己随机取走的那一只所含的金额总是小于留在老板那里的金额预期值呢?没错,老婆是别人的好,但红包毕竟不是老婆呀-_- 因此很难认为 \(E=5x/4\) 反映了真实的期望值;如果以这个不靠谱的数值作为出发点制定进一步的行动策略,那样的决策显然无助于抽奖人获益。

二、贝叶斯分析

为了解决这一悖论,前一帖遵循 Christensen 和 Utts 在三十年前提出的建议,对期望值 \(E\) 作了些许贝叶斯分析。整个讨论的思路如下:当顾客观察到所领取的红包中有 \(x\) 元后,应当用条件概率 \(P(1|x)\) 和 \(P(2|x)\) 分别代替 \eqref{av} 式中原本与 \(x\) 无关的先验值 \(\nu_1=\frac{1}{2}\) 和 \(\nu_2=\frac{1}{2}\),以使得更新之后的期望值
\[
E'=P(1|x)\cdot x_H+P(2|x)\cdot x_L
\label{bv}
\tag{2}
\]
更接近于真实。通过对贝叶斯公式的分子分母进行约分,不难看到这两个条件概率将由某个非负的参量 \(\lambda(x)\) 刻画:
\[
P(1|x)=\frac{\lambda(x)}{1+\lambda(x)},~~~~~~P(2|x)=\frac{1}{1+\lambda(x)}
\label{px}
\tag{3}
\]
注意到产生悖论的先验值 \(\nu_1=\nu_2=\frac{1}{2}\) 对应于常值函数 \(\lambda(x)\equiv 1\),该情形是俺们在构造具体模型时需要加以避免的。

俺在前一帖中讨论了一个简化的玩具模型,并利用该模型实际计算了 \(\lambda(x)\),发现它是有界区间 \(x\in [x_*,2x^*]\) 上定义的分段常值函数,分段的断点出现在两个正数 \(2x_* < x^*\) 之处:
\[
\lambda(x)=\left\{\begin{array}{ll}
\infty, & x_* \le x < 2x_*
\\
2, & 2x_*\le x \le x^*
\\
0, & x^*< x \le 2x^*
\end{array}\right.
\label{lambda}
\tag{4}
\]
按照这些结果,抽奖者在第一个红包中观察到的金额存在一个阈值 \(x^*\),当顾客抽到的金额大于该阈值,即 \(x>x^*\) 时,\eqref{bv} 式给出更换红包的收益预期 \(E'=x_L=x/2 \) 小于顾客已抽到的金额 \(x\),故这名抽奖者应“见好就收”,停止继续交易,保留已到手的红包。

反之,如果顾客抽到的金额小于阈值,\(x < x^*\),则进行红包交换的收益预期或为 \(E'=x_H=2x\),或为 \(E'=2x_H/3+x_L/3=3x/2\),两者均大于已抽到的 \(x\),故此时抽奖人应“见坏就上”,继续跟老板进行交易。于是,经贝叶斯更新的期望值 \eqref{bv} 不仅避免了悖论,也比刻板地用先验值直接计算更能反映现实。在此基础上做出的决策当然更加靠谱有效。

三、“自反而缩”

上述期望值的改进,是对“博弈对手”(彼方)披露的信息进行加工得出的。通过贝叶斯分析,俺们修正了 \eqref{av} 中权重因子 \(\nu_1,\nu_2\) 的先验值,使结果更为客观,以此为据的决策因而更为可靠。

加工并利用彼方曝露出来的信息仅仅是故事的一方面;另一方面,通过对己方(如价值取向等)的调整,往往也有助于在博弈过程中更加得心应手。以俄乌局势为例,不仅仅国际社会对俄军军力(彼方)的先验判断是错误的,人们同时也误判了乌克兰(己方)的自我调整能力。的确,早先的乌政府充其量是个二流政府,宪政民主盘面不稳,贪腐盛行,民心涣散。这些观感导致人们根本不看好乌克兰的战力,拜登政府甚至在俄乌战争暴发初期建议泽伦斯基立马流亡波兰。然而,情况并不像拜登预料的那样糟——从前在川普的霸凌面前窝窝囊囊的泽伦斯基,在危机中迅速调整了自己,一跃成为世界级的政治领袖,凝聚起自由世界方方面面的力量,率领乌克兰人英勇抗敌。这个世界上有太多的人在重大危机面前不由自主地趴下,但也会有人直到危难发生时,人格才得到升华,成为英雄。那位创造了航空史上奇迹的萨利机长就是这样一位英雄,泽伦斯基则更是典型。曾子所说的“自反而不缩,虽褐宽博,吾不惴焉;自反而缩,虽千万人吾往矣”,正可用以形容乌克兰人调整了自己的价值取向之后迸发出的为自由而战的力量。

当俺们试图通过数学考察“己方的调整”对期望值 \eqref{av} 产生的影响(进而影响到后续决策)时,俺们所要做的不再是对外部参数 \(\nu_1,\nu_2\) 进行贝叶斯修正,而是需要调整金额 \(x_H,x_L\) 就“己方”(即抽奖者本人)而言的内禀价值或效用。这提示俺们遵从 Bob Agnew 博士的建议——把钱或财产 \(w\) 的效用函数 \(u(w)\) 引进双红包悖论的讨论中,并用效用期望值来代替金额本身的期望值 \eqref{av}:
\[
E''=\nu_1\cdot u(w_0+2x)+\nu_2\cdot u(w_0+x/2)=\frac{1}{2}u(w_0+2x)+\frac{1}{2}u(w_0+x/2)
\label{eu}
\tag{5}
\]
在上式中,\(w_0\) 是抽奖人的初始财产,\(x\) 是其打开第一个红包后观察到的金额。注意到 \(E''\) 是抽奖人跟老板交换红包后产生的效用预期,如果这一预期大于抽到的第一个红包的效用,即 \(E'' > u(w_0+x)\),那么抽奖者应该跟老板交易红包;否则,若 \(E'' < u(w_0+x)\),则抽奖者应保留第一只红包。由此可知,是否选择后续的交易将依赖于下列判别式的正负号:
\[
\Delta(x)=\frac{1}{2}u(w_0+2x)+\frac{1}{2}u(w_0+x/2)-u(w_0+x)
\label{delta}
\tag{6}
\]

四、若干经济学术语

为了本帖的继续,俺将不得不硬着头皮在平正兄面前班门弄斧,不甚规范地使用一些经济学术语-_- 经济学假定每个个体对待财富 \(w>0\) 都有着自己独特的效用函数 \(u(w)\)。同样一笔钱交付给不同的人(如王子和乞丐),他们获得的幸福感通常是不同的。一个饥肠辘辘的流浪汉在路边捡到五块钱,其效用显然远大于比尔·盖茨——后者据说压根儿就不稀得弯腰去捡哪怕是他自己掉的钱-_- 但是,无论你是穷人还是富可敌国者,只要你不违反经济理性,钱总归多多益善,换言之效用函数 \(u(w)\) 应设为财富 \(w\) 的单调增函数,\(u'(w)>0\)。另外,经济学家还假定边际效应的存在,亦即尽管更多的财富将带来更多的满足,单位财富产生的满足感却会随着财富的不断积累变得越来越小。用数学表达该性质,俺们要求 \(u''(w) \le 0\)。这些性质对每个“理性人”都成立。

个体的效用函数 \(u(w)\) 一旦给定,俺们即可评估其对风险的承受度。假定这位个体的财产 \(w\) 出现了随机波动,\(w\to w+\epsilon\),这里 \(\epsilon\) 是某个随机的微扰量。由下列方程,俺们可通过效用函数随机扰动的期望值 \(E[u(w+\epsilon)]\) 来定义“风险贴水”\(\pi\):
\[
u(w-\pi)=E[u(w+\epsilon)]
\label{pr}
\tag{7}
\]
不妨把随机扰动量的均值及方差分别取成 \(E[\epsilon]=0, ~E[\epsilon^2]=\sigma^2\),对 \eqref{pr} 式两边做泰勒展开并近似到次最低阶,有
\[
u(w)-u'(w)\pi \approx u(w)+u'(w)E[\epsilon]+\frac{1}{2}u''(w)E[\epsilon^2]~\Rightarrow~\pi\approx -\frac{\sigma^2\cdot u''(w)}{2u'(w)}
\]
这个表达式启发俺们引进“风险趋避”函数
\[
\alpha(w)=-\frac{u''(w)}{u'(w)}
\label{ra}
\tag{8}
\]
不难看出,\(\alpha(w)\) 描述效用函数 \(u(w)\) 图像的局部弯曲程度。

五、双红包悖论的经济学分析

让俺们讨论两种最简单的情形。

情形1:风险趋避函数恒等于零,\(\alpha(w)\equiv 0\) 。这时,由常微分方程 \(u''(w)=0\) 解出效用函数 \(u(w)=a w+b\),通过改变财富的计量单位及单独引进初始财富 \(w_0\),可令 \(a=1,~b=0\),这一情形的 \(u(w)=w\),即效用函数之值平庸地沦为金额本身,故 \eqref{av} 仍将产生悖论。

情形2:风险趋避函数 \(\alpha(w)\) 恒取非零常数 \(k > 0\),此时 \(u''(w)=-ku'(w)\) 蕴含有 \(u'(w)=ae^{-k w}\),进而 \(u(w)=-\frac{a}{k}e^{-k w}+b\)。代入判别式 \eqref{delta} 有
\[
\begin{array}{l}
\displaystyle
\Delta(x)=-\frac{ae^{-k(w_0+x/2)}}{2k}\left[e^{-3kx/2}+1-2 e^{-kx/2}\right]
\\
\displaystyle~~~~~~~~~
=\frac{ae^{-k(w_0+x/2)}}{2k}\left(1-e^{-kx/2}\right)\left(e^{-kx/2}+\frac{\sqrt{5}+1}{2}\right)
\left(e^{-kx/2}-\frac{\sqrt{5}-1}{2}\right)
\end{array}
\]
由于 \(0< e^{-k x/2} < 1\),上式除了最后一个括弧,其余的因子均为正数。最后一个括弧的正负号将根据 \(e^{-kx/2} > (\sqrt{5}-1)/2\approx 0.618\) 及 \(e^{-kx/2} < (\sqrt{5}-1)/2\) 而定。从这一分析即知,抽奖者观察到第一个红包的金额 \(x\) 存在一个阈值
\[
x^*=-\frac{2}{k}\log\frac{\sqrt{5}-1}{2}
\label{xstar}
\tag{9}
\]
当 \(x > x^*\) 时因 \(e^{-kx/2} < \frac{\sqrt{5}-1}{2}\),进而 \(\Delta(x)<0\),抽奖者应该“见好就收”,保留抽到手的红包;否则,当 \(x < x^*\) 时应该“见坏就上”,交换老板手里的另一只红包。在这里,通过选择适当的效用函数,俺们再一次消除了悖论,得出了(效用)期望值的合理估算。

<b>六、结语

尽管俺们讨论的悖论并不复杂,该悖论的解决有趣地诠释了孙子所说的“知彼知己,百战不殆”。在这里,“知彼”当然指的是从博弈对手那里俘获信息进行加工;“知己”则更包括了调正升华自己的价值取向。
锟斤拷锟洁辑时锟斤拷: 2022-08-13 11:52:51

加跟贴

笔名:     新网友请先注册笔名 密码:
主题: 进文集
内容: