百科

演化稳定策略

20 世纪 70 年代,J Maynard Smith在研究生态现象时,最早提出了演化稳定策略(evolutionary stable strategy , ESS) 的概念。ESS 的基本思想是:如果突变小群体在混合群体中博弈所得支付大于原群体中个体支付所得,小群体就将有能力入侵大群体;反之,就不能侵入大群体,而是在演化过程中趋于消失。演化稳定策略是演化博弈论的核心,演化博弈强调经济变迁过程中以个体多样性变异机制和偏好选择机制为代表的种群研究,它认为种群选择的策略能够获得最佳的收益并消除任何小的突变群体的扰动。ESS 强调了策略的演化过程 ,与之有紧密联系的复制者动态方程(replicator dynamic equation) 则描述了变异可能性情况下的演化稳定状态,其通过适应度函数(fitness function) 和雅可比矩阵(Jaconbian) 即可求解出不同演化路径下的ESS。

简单介绍一下 ESS 求解过程中所用到的几个主要概念。Smith 认为 ,每一个种群的行为都程式化为一个策略 ,而群体中的个体则在所有种群构成的大群体中展开策略博弈。如果考虑 K 个相互博弈的种群 ,每个种群 k ( k = 0 ,1 , ⋯, n ) 有 N 种策略。种群 k 对应的 N 维向量集为

s k = { x = ( x1 ,x2 , ⋯, xn ) | xi≥0 , x1 + x2 + ⋯+ xn =1}。向量s k表示种群k中采用每种策略的个体在该种群中所占的比例。他用适应度函数来表示每个种群在博弈策略下的支付 ,个体的适应度被表示为个体策略和当前状态的函数 ,并且状态对时间是连续可导的。适应度函数形式:

f ( r , s) = { f1 ( r1, s) , f2 ( r2, s) , ⋯,f k ( r k , s) }。r k表示种群k的任一个体的混合策略, s表示状态。复制动态是描述某一特定策略在一个种群中被采用的频数或频度的动态微分方程 ,指用某一纯策略的个体数在群体中所占比例的增长率等于使用该策略时所得支付与群体平均支付之差。复制动态反映了演化博弈理论的基本动态 ,一般表示为:

其中, xm 为一个种群中采用策略m的比例, u( m , s)表示采用策略m时的适应度, u( s , s) 表示平均适应度, m代表不同的策略。求策略的 ESS 过程就是用适应度函数求出平均适应度(群体平均支付),并将之与某种策略支付的差值乘以策略概率,得出具体策略增长率的复制动态方程,然后对未知概率求偏导得到相应的Jaconbian矩阵,最后根据 Jaconbian矩阵行列式的值和矩阵的迹来判定具体策略是否是ESS。

在传统的博弈理论中,一般假定个体具有完全理性,并在完全信息条件下进行博弈。演化博弈论则放松了经典博弈论中将人模型化为超级理性的假设 ,认为人应当是有限理性的,历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡选择产生影响。演化博弈从演化过程来考察理性的生成,从数理逻辑上局部论证了演化经济学中的演化理性观。相对于古典博弈论对静态博弈均衡的集中讨论,演化博弈论更着重于对所有参与博弈的个体在经过反复博弈后选择的某个最优的演化稳定策略的动态行为进行研究,并以此来预测个体行为。演化稳定策略认为人类博弈的最优均衡是均衡过程中群体策略调整的函数,不能在初始时达到,必须通过试错的方法,经过大量反复的博弈过程去修正和改进个体策略才能达到。传统博弈论认为一个博弈可能存在多个纳什均衡 ,而演化博弈论则进一步指出哪一个均衡才是现实中可以真正实现的,即 ESS必然是纳什均衡 ,而那些较弱的纳什均衡通常不能满足ESS的要求则被剔除, ESS是比纳什均衡更加严格的均衡。