纳什均衡中的几个概念的整理占优策略(dominantstrategy):在囚徒

纳什均衡中的几个概念的整理占优策略(dominantstrategy):在囚徒


2024年4月26日发(作者:最好的音乐播放器十大排名)

纳什均衡中的几个概念的整理

占优策略(dominant strategy):在囚徒困境中,我们发现,一个局中人的最优

策略选择不依赖另一个局中人的策略选择,即无论其他局中人选择什么策略,他

的最优策略是唯一的(在囚徒困境中,如果双变量矩阵中的得益的具体数字0,

-1,-6,-9换成任意的

T

R

P

S

,只要满足

T

>

R

>

P

>

S

,上述结论依然成立),

我们把这样的最优策略称为“占优策略”(dominant strategy).

严格劣策略(strictly dominated strategy):在标准型博弈G={S1,„,Sn;

u1,„,un}中,令si和si代表局中人i的两个可行策略(即是Si中的元素)。

如果对其他局中人每一个可能的策略组合,i选择si的收益都小于其选择si

的收益,则称策略si相对于策略si是严格劣策略:

u

i

(s

1

,

,s

i

1

,

,s

n

)

u

i

(s

1

,

,s

i

1

,s

i



,s

i

1

,

,s

n

)

对其他局中人在其策略空间S1,„,S i-1,„,Sn中每一组可能的策略

(s1,„,si-1,„,sn)都成立。也就是说严格劣策略就是不管其它博弈方的策略

如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策

略。

占优策略均衡:在标准型博弈G={S1,„,Sn;u1,„,un}中,如果对于所有

的i, si是局中人i的占优策略,那么,策略组合s〞=(s〞1, „,s〞n)称为

占优均衡(dominant-strategy equilibrium)。一个博弈的某个策略组合中的

所有策略都是各个博弈方各自的占优策略,必然是该博弈比较稳定的结果。

重复剔除的占优均衡(Iterated Elimination of Strictly Dominated

Strategies):如果s〞=(s〞1, „,s〞n)它是重复剔除严格劣策略后剩下的策略

组合,策略组合s〞=(s〞1, „,s〞n) 称为重复剔除的占优均衡。如果这种唯

一的策略组合是存在的,我们就说该博弈是重复剔除占优可解的。

纳什均衡与占优均衡的关系:在有n个局中人的标准型博弈G={S1,„,Sn;

u1,„,un}中,如果重复剔除严格劣策略剔除了除策略组合{s1*,„„,sn*}

外的所有策略,那么这唯一的策略组合为该博弈的惟一纳什均衡,反之则不一定。

即纳什均衡一定是重复剔除严格劣策略的过程完成后没有被剔除的策略组合,但

没有被剔除的策略组合不一定是纳什均衡,除非它是唯一的。

同时,在n个博弈方的博弈中G={S1,„,Sn;u1,„,un}中,如果{s1*,„„,

sn*}是一个纳什均衡,那么严格剔除劣策略一定不会将它剔除。

不同纳什均衡的关系:

纳什均衡的存在性:在n个局中人的标准型博弈G={S1,„,Sn;u1,„,un}

中,如果n是有限的,且对每个i,Si是有限的,则博弈存在至少一个纳什均衡,

均衡可能包含混合策略。

纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本

原因之一。

策略(strategy):参与人在给定信息集的情况下选择行动的规则,它规定参与

人在什么情况下选择什么行动,是参与人的“相机行动方案”。

纯策略(pure strategy):如果一个策略规定参与人在每一个给定的信息情况下

只选择一种特定的行动,该战略为纯策略。

混合策略(mixed strategy):如果一个策略规定参与人在给定信息情况下以某

种概率分布随机地选择不同的行动,则该策略为混合策略。对标准型博弈

G={S1,„,Sn;u1,„„,un},假设Si={sil,„,sik}。那么,局中人i的一个

混合策略为概率分布pi=(pil,„,pik),其中对所有k=1,„,K,0≤Pik≤1,且

pil+„+pik=1。

假设局中人i有K个纯策略:Si={sil,„sik},则局中人i的一个混合策略是一

个概率分布(Pil,„„,Pik),其中Pik表示对所有k=1,„,K,局中人i选择

策略sik的概率,由于pik是一个概率,对所有k=1,„,K,有0≤pik≤1且

Pil+„+Pik=1。我们用Pi表示基于Si的任意一个混合策略,其中包含了选择每

一个纯策略的概率,正如我们用si表示Si内任意一个纯策略一样。

纯策略可以理解为混合策略的特例,即在诸多策略中,选该纯策略si的概

率为1,选其他纯策略的概率为0。

扩展的纳什均衡(mixed-strategy Nash Equilibrium):在两个局中人标准型

博弈G={S1,S2;u1,u2}中,混合策略(p1*,p2*)是纳什均衡的充要条件为:

每一局中人的混合策略是另一局中人混合策略的最优反应。

加入了混合策略后纳什均衡的关系:


发布者:admin,转转请注明出处:http://www.yc00.com/xitong/1714139638a2389046.html

相关推荐

发表回复

评论列表(0条)

  • 暂无评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信