合作博弈

博弈论读书笔记(五)重复博弈

≯℡__Kan透↙ 提交于 2020-02-07 17:29:53
2.3重复博弈 从这里开始,就进入博弈论比较难以理解的地方了。我也不跟着书上的章节走,根据自己的理解和书上的例子来写,如果理解有什么不对的地方,欢迎各位大佬的指正。 首先我们来明晰博弈论到底在讨论些什么: 对于这个问题,前面几章的内容可能对大家会造成一定的误导。因为根据前面几章的例子,我们可以很容易地认为,博弈论就是在讨论在某个规则下,参与者最优的策略和参与者之间达到的平衡。 这句话本身没有错误,但是我们很容易理解为:这个平衡是像最开始那两个囚徒一样,选择“保证对方不会背叛并且自己在此情况下能获得最大利益”的战略所达到的平衡(这句话有点难以理解,不过我相信你能明白我的意思)。例如第一章第一节中囚徒困境双方都选择招认(因为选择合作即不招认,结果可能是被背叛)。 但是一旦进入了重复博弈那么我们就不能只考虑眼前的利益(即保守地只去选择单次博弈的纳什均衡),而要考虑多次重复博弈的总收益。这个时候就需要参与双方共同商定一个“协议”(例如双方说好都选择不招认),这个协议必须是对于双方都有利的(至少由于选择单次博弈的纳什均衡,例如双方不招认总比双方都招认要好),并且协议中会对不遵守规则的进行惩罚,以便于对每个人来说选择合作是最好的结果。 从这里我们就可以理解“博弈论教你如何制定规则的”这句话了。 好了,这一章最核心的思想在这里已经讲完了,虽然我可能说的不是那么清晰

博弈论

风流意气都作罢 提交于 2019-11-28 08:18:35
博弈论入门 什么是博弈论 博弈论是指双方或多方在竞争、合作、冲突等情况下,充分了解各方信息,并以此选择一种能为本方争取最大利益的最优决策的理论。 博弈论四个要素: 最少有两个参与者 利益 策略 信息 博弈论的结果划分: 负和博弈: 博弈的所有参与者最后得到的收获都小于付出,都没有占到便宜,是一种两败俱伤的博弈。 零和博弈: 参与者一方获益,另一方出现损失,参与者之间的收益和损失之和为零。 正和博弈: 双赢博弈,参与者的多方都获得了对应的收益,也是博弈最好的结果,也是最好的一种博弈。 著名的囚徒困境的问题在于他们没有选择对两人来说最优的策略,而是选择对自己最优的策略,根本原因在于双方被隔离审讯,无法掌握对方的信息,所以看似每个人都作出了对自己最有利的策略,结果却是两败俱伤。 田忌赛马是典型的对掌握的信息调整对应的策略。 原有是上对上,中对中,下对下,三局两胜。 调整策略后,下对上,中对下,上对中。 一个能争取最大利益的策略,也就是最优策略。 博弈用来比喻为了利益进行竞争。 博弈论是硬系统的理论,属于应用数学的一个分支。 即了解充分的信息,做出最优策略。 博弈作为一种争取利益的竞争。 博弈论的发展过程:古代(孙子兵法) à 近代(冯 · 诺依曼) à 现代(约翰 · 福布斯 · 纳什) 经济史上三次伟大的革命:边际分析革命 à 凯恩斯革命 à 博弈论革命。 博弈论就是在一定情况下