囚徒困境中的博弈方参与合作的.doc
上传人:sy****28 上传时间:2024-09-15 格式:DOC 页数:15 大小:81KB 金币:15 举报 版权申诉
预览加载中,请您耐心等待几秒...

囚徒困境中的博弈方参与合作的.doc

囚徒困境中的博弈方参与合作的.doc

预览

免费试读已结束,剩余 5 页请下载文档后查看

15 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

博弈论论文囚徒困境中的博弈方参与合作的----------重复博弈分析囚徒困境中的博弈方参与合作的----------重复博弈分析摘要:在单次博弈的囚徒困境中,每个参与者都是对自己利益最大化的主体,在最求最大化个人利益的过程中形成了“囚徒困境”的纳什均衡解。但是这样的纳什均衡对于所有的博弈者来说并不是最优的。通过重复博弈的,增加博弈的次数可以增加信息的透明度、提高博弈者之间的信任程度进而减少欺诈行为的发生,为合作博弈提供了可能性。试图分析囚徒困境的参与者相互合作的原因,并提出如何让博弈参与者走出“囚徒的困境”TOC\h\z\c"图表"错误!未找到图形项目表。。关键词:重复博弈;囚徒困境;合作;最优一、引言人类社会和大自然中都存在着竞争与矛盾冲突。自然界有捕食者和猎物之间的生存竞争,人类社会有国家与国家之间的军备竞争,以及公司与公司之间的价格战。现实经济生活中,有很多一次博弈的“囚徒困境”的例子,例如两个之间的价格竞争,为了自己的经济利益最大化都不消减产量,使得两个厂商都达不到真正的最优。“囚徒困境”启示我们,只顾及单方面利益的做法往往不但无法达到理想的目标,而且可能会使个体利益水平在原有的基础上下降,社会总利益也会受损。基于提高博弈者之间博弈的效率、使博弈双方效用最大化的目的,以博弈论的基本原理之一——重复博弈理论为切入点,试图通过对囚徒困境的参与者彼此合作行为的解析,达到在重复博弈条件下走出囚徒困境的目的。在单独的一次博弈过程中,每个人都倾向于利用自身的优势为自己谋求最大的利益,而对方只要有机会也会这么做,于是双方都要采取措施来防范对方,这就是“囚徒困境”。但运用“重复博弈”,可以减少欺骗,增加相互的信任,因为上当受骗的人能够进行“一报还一报”的报复行动,从而走出“囚徒困境”。本文在认识“囚徒困境”和“重复博弈”的基础上,试图分析在重复博弈的条件下如何使“囚徒困境”得到破解从而促进合作,实现共赢。二、重复博弈理论综述(一)重复博弈的定义重复博弈是指动态或静态博弈的重复进行,或者说重复进行的过程。其中的每次博弈称为阶段博弈,它是动态博弈中的重要内容。在每个阶段博弈中,参与者可能同时行动,也可能不同时行动,因为其他参与者过去的行动的历史是可以观测的,因此在重复博弈中,每个参与者可以使自己在每个阶段选择的策略依赖于其他参与者过去的行为。在重复博弈中,每次博弈的条件、规则和内容都是相同的,但由于有一个长期利益的存在,因此各博弈方在当前阶段的博弈中要考虑到不能引起其它博弈方在后面阶段的对抗、报复或恶性竞争,即不能像在一次性静态博弈中那样毫不顾及其它博弈方的利益。有时,一方做出一种合作的姿态,可能使其它博弈方在今后阶段采取合作的态度,从而实现共同的长期利益。(二)重复博弈的特征重复博弈具有前一阶段不改变后一阶段的结构,博弈历史可观测及博弈者关心长期得益等三个特征。首先,重复博弈的每次博弈之间没有物质上的联系,即前一阶段的博弈不改变后一阶段的结构。其次,所有参与者都可以观察到博弈过去的历史。在每一个新的阶段的重复博弈中,两个参与者都知道对方在过去的每次博弈中选择了合作还是不合作,对于这一点,参与者可以通过自己过去的收益数量发现。最后,重复的博弈者关心的是整个博弈的总得益,而总得益是所有阶段博弈得益的贴现值之和,如果长期可获得的收益大于眼前利益,博弈者将会放弃眼前利益而选择长期行为——合作。影响重复博弈均衡结构的主要因素是博弈次数和信息的完备性。因为重复次数的存在,参与者会在短期利益与长期利益之间进行权衡,他们有时会为了长期利益而暂时牺牲短期利益,而信息的不完备性则可能使参与者为了自己的长远利益而积极地建立良好的声誉,从而为自己的长期行为建立基础。(三)重复博弈的分类影响重复博弈均衡结果的主要因素是博弈重复的次数和信息的完备性,因此重复博弈既可以按照博弈重复的次数分类,也可以按照信息的完备性分类。重复博弈按博弈重复的次数分为有限次重复博弈与无限次重复博弈。在有限次重复博弈中,所有参与者都可以明确无误地了解重复的次数,即可以准确地HYPERLINK"http://wiki.mbalib.com/wiki/%E9%A2%84%E6%B5%8B"\o"预测"预测到最后一个阶段博弈,而在最后阶段的博弈中,任何一个参与者选择不合作,不会导致其他参与者的报复。有限次重复博弈与无限次重复博弈的共同点为试图合作和惩罚不合作是实现理想均衡的关键,是构造高效率均衡战略的核心构件。而两者的区别为,首先,无限次重复博弈没有结束重复的确定时间,在有限次重复博弈中,存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系,使重复博弈无法实现更高效率均衡的关键问题。其次,无限次重复博弈不能忽视不同时间得益的价值