合作博弈、匹配理论与市场设计实践及其政策启示

时间：2021-01-10 06:02:05　来源：工作范文网本文已影响人

摘要： 2012年的诺贝尔经济学奖由罗伊德·沙普利和阿尔文·罗斯共同获得，以表彰他们在合作博弈、稳定匹配和市场设计理论与实践方面的重要贡献。合作博弈理论主要研究个人集合团体（“联盟”）如何通过合作扩大自己的利益，稳定匹配和市场设计所要解决的核心问题是如何更好地将不同的市场参与主体匹配起来。这些研究成果对于中国经济问题的研究以及对解决中国当前发展中出现的问题具有启示和借鉴作用，如管理层应重视并建立公平合理的分配机制，并用市场机制设计的方式来提高特定市场的效率等。

关键词：合作博弈；沙普利值；稳定匹配；市场设计；诺贝尔经济学奖

中图分类号：F 01 文献标识码：A 文章编号：1671623X（2013）01001306

2012年10月15日瑞典皇家科学院宣布，将2012年诺贝尔经济学奖授予美国哈佛大学哈佛商学院教授阿尔文·罗思（Alvin E. Roth）与美国加利福尼亚大学洛杉矶分校教授罗伊德·沙普利（Lloyd S. Shapley），以此嘉奖两位教授在合作博弈理论、稳定匹配理论与市场设计实践上的成就。

合作博弈理论主要研究个人集合团体（“联盟”）如何通过合作扩大自己的利益，因此，合作分析的出发点是对每个联盟所能达成的结果进行分析。对合作博弈理论的发展做出主要贡献的是罗伊德·沙普利。

2012年获得诺贝尔经济学奖的成就主要还包括一个用于分析资源配置的理论框架，以及对现实世界中的体系（如劳动力市场交流中心和学校招生程序）进行的实证研究和真实再设计。经济学家在研究社会资源如何分配的问题时发现，一些分配问题可以在价格体系中获得解决，例如，某一职位用高工资吸引劳动者，高能源价格引导消费者去节约能源。但在许多情况下，使用价格体系会遭致法律和道德上的异议，如人体器官在需要移植的病人中的分配。并且，许多市场中虽然存在价格体系运作，但传统上假设的完全竞争仍未接近于实现。尤其是许多商品是由不同的商品组成且是不可分割的，而每一分类商品的市场十分稀薄。这些稀薄的市场如何配置资源取决于管理这些交易的体系。解决这一问题的理论框架的基础是1962年戴维·盖尔（David Gale）和罗伊德·沙普利建立的对特定一类分配问题进行的数学探讨。自1984年始，罗思和他的同事利用这个理论框架，结合实证研究、对照实验室实验和计算机模拟，对其他市场的运作进行了研究。这些研究以及实证分析已经促使一门被称作“市场设计”的新兴经济学分支的出现。那么它对于中国经济问题的研究以及对解决中国现今发展中出现的问题将有哪些启示和借鉴作用呢？

以下，将首先简要介绍罗伊德·沙普利和阿尔文·罗思这两位诺奖得主的主要研究贡献。随后对这两位经济学家的主要理论——合作博弈理论、稳定匹配理论与市场设计实践成果的学术价值和实践意义进行简单回顾和梳理。在此基础上讨论这些理论的政策启示。

一、两位诺贝尔经济学奖得主的主要贡献

（一）罗伊德·沙普利的研究贡献

罗伊德·沙普利，1923年6月2日生于美国，1953年在普林斯顿大学获得博士学位，目前仍是加州大学洛杉矶分校数学及经济学名誉退休教师。他对数理经济学，特别是合作博弈理论做出过杰出贡献，被很多专家认为是合作博弈论的化身。

1.合作博弈的基石——沙普利（Shapley）值

与非合作博弈着重个人理性不同，合作博弈强调的是集体主义、团体理性，故而合作博弈也称为联盟博弈。理性主体往往为了利益与其他理性主体订立协议，形成联盟。这个联盟形成后，能够使博弈双方的利益都有所增加，或者至少是一方的利益增加，而另一方的利益不受损害，因而整个社会的利益有所增加，所以这是一种正和博弈。若不带来更大的利益，联盟是不可能形成的。但联盟形成后如何分配获得的收益呢？这是合作博弈所关心的核心问题。

收益分配，取决于博弈各方的力量对比和技巧运用。因此，妥协必须经过博弈各方的讨价还价，达成共识，进行合作。在这里，合作剩余的分配既是妥协的结果，又是达成妥协的条件。长期以来，经济学家对求解这种多重理性手足无措，只能避而远之。合作博弈在理论上的重要突破及其以后的发展在很大程度上起源于沙普利的研究及其公理化刻画。

沙普利将“核（core）”发展为合作博弈的一般利益分配集合，即它是一种所有成员均无法提升自身效用的稳定联盟状态。由于“核”这个概念不能给出联盟内成员效用分配的唯一预测，沙普利进一步在合作博弈框架中加入了一些着眼于“公平”分配合作利益的公理。沙普利首先对“公平”、“合理”等概念给予了严格的公理化描述，然后寻求是否有满足人们想要的那些公理的解。当然，如果对一个解的性质或公理要求太多，则这样的解可能不存在；另一方面，如果这些性质或公理要求得少，则又可能有许多解，即解存在但不唯一。

沙普利证明，在这些公理的约束下，存在唯一的效用分配方案，这就是沙普利值。沙普利值是根据各人给联盟带来的增值来分配，在直观上是所有边际贡献的平均值。沙普利值计算方法简单，而且能得到合作博弈的唯一解，使用较为广泛。到目前为止，这个解仍然是合作博弈领域内最重要的结果之一。不仅如此，沙普利的工作具有方法论上的重要意义，他的公理化方法使我们可以研究讨论合作博弈中其他各种各样的解。[1，2，3]

2.稳定匹配理论——盖尔和沙普利的双边匹配算法

在许多市场中，商品是私人的，但是由不同的商品组成且是不可分割的，传统上假设的完全竞争是无法维持的。在这样的市场中，参与者必须适当匹配才能相互交易。例如，考虑到一个市场有两个不相交的对象集（如买家和卖家，劳动者和公司，学生和学校）必须互相匹配以进行交易。盖尔和沙普利研究的就是这种双边匹配市场。

（1）稳定匹配（stable matchings）

为了说明何谓稳定匹配，本文先介绍“改进”这个概念。若某个联盟的成员可以利用自己的资源让自身的境况更好，那么就可以说这个联盟能够“改进”支付向量。一般来说，一个匹配如果不能被任何联盟“改进”，那么它就是稳定的匹配。事实上，没有联盟能够通过利用自己的资源，带来令所有成员更青睐的结果，就是所谓的稳定匹配。具体而言，假设市场的一方为医学院学生，另一方为医疗机构，每个机构需要一名实习生，每个医学院学生都想获得一个实习职位。很自然，学生和医疗机构对对方都有偏好的选择（为了方便起见，我们假设偏好是严格的）。对于双方的任何一个对象来说，如果匹配之后不如未匹配之前，那么这个匹配就是“不可接受的”。如此稳定的匹配必须满足以下两个条件：一是没有一个对象认为匹配不可接受；二是没有任何一对机构和学生希望是他们之间匹配，而不是各自目前的匹配。条件1即“个体理性”（individual rationality），条件2则是“成对稳定性”（pairwise stability）。两个条件意味着没有一个联盟、没有一对机构和学生能对目前的配对进行改进。

（2）盖尔-沙普利算法（the GaleShapley algorithm）

盖尔和沙普利为了寻找一个稳定匹配，设计出了“延迟接受算法”（deferredacceptance algorithm）。市场一方中的对象（医疗机构）向另一方中的对象（医学院学生）提出要约，每个学生会对自己接到的要约进行考虑，然后抓住自己青睐的（认为它是可接受的），拒绝其他的。该算法的一个关键之处在于，合意的要约不会立即被接受，而只是被“抓住”（hold on to），也就是“延迟接受”。要约被拒绝后，医疗机构才可以向另一名学生发出新的要约。整个程序一直持续到没有机构再希望发出新的要约为止，到那个时候，学生们才最终接受各自“抓住”的要约。在这个过程中，每个医疗机构首先向被自己列为第一位的求职者发出要约，也就是最想接收为实习生的那个医学院学生。如果这个要约被拒绝，这家机构才能向被自己列为第二位的学生发出要约，依次类推。因此，在该算法的操作中，医疗机构的预期随着要约对象所处偏好排序降低而下调（当然，医疗机构不会对不可接受的求职者发出要约）。反过来说，由于学生总是抓着所接收要约中最合意的那个，且要约不能被撤回，因此，每个学生的满意度在该算法的操作中是单调递增的。当医疗机构下降的预期与学生提高的志向变得相一致时，该算法停止。

盖尔和沙普利证明，延迟接受算法是稳定的，也就是说，它总能产生一个稳定的匹配。该算法为这种类型的双边匹配问题提供了一个存在性证明：既然它总会终止于一个稳定匹配，那么稳定匹配是存在的。这些方法同时也限制了市场主体操纵匹配过程的动机。[4]

沙普利的其他重要贡献还包括沙普利-舒贝克（the ShapleyShubik）权利指数、奥曼-沙普利定价（AumannShapley pricing）、海萨尼-沙普利解（the HarsanyiShapley solution）、沙普利-福克曼定理（the Shapleytheorem）以及对随机博弈理论的研究成果，等等。

（二）阿尔文·罗思的研究贡献

阿尔文·罗思1951年12月19日出生于美国，1971年本科毕业于哥伦比亚大学，获得运筹学学士学位，1973年获斯坦福大学运筹学硕士学位，1974年获斯坦福大学运筹学博士学位，目前在哈佛商学院担任经济及工商管理教授。罗斯主要在博弈论、市场设计和实验经济学等领域进行研究，并做出显著贡献。从1995年应用理论改革美国医学院毕业生分配体系开始，他一直着手于解决现实问题，是少见的既有精深理论贡献，又非“纸上谈兵”的经济学家。

1.市场设计理论与微观经济工程学

“市场设计理论”最早由美国经济学家赫维奇提出，马斯金和迈尔森则进一步发展了这一理论，他们因此共同摘得了2007年诺贝尔经济学奖。该理论研究的核心问题是，在信息不完全、决策分散化、自愿选择和交换的条件下，如何设计出一套经济机制，以实现资源的最优化利用。

罗斯2002年发表的一篇题为“经济学家作为工程师：博弈论、实验法、计算作为设计经济学的工具”的文章中提出，经济环境不仅是“演化”出来的，一定程度上也是“设计”出来的，一门新学科——设计经济学正在诞生。而市场的设计，仅靠高度简化的理论模型是不够的，须考虑到现实生活中种种细节的复杂。为此，罗斯认为，有必要使用实验经济学和计算经济学作为博弈论的补充，因此，该新兴学科也被一些学者称为微观经济工程学。[5]

2.匹配和市场设计的应用

虽然匹配理论的研究在20世纪60、70代就得到了学界的重视，但是它的实际应用却一直到80年代才逐渐为人们所重视。匹配和市场设计的应用主要归功于罗思，他在1984年的研究中清楚地表明类似于GS的算法是美国住院医生制度得到改善的根本原因。[6]

在1940年代，美国的住院医生制度是非常糟糕的。医院为了竞争优秀的医学院学生，不断将给学生提供岗位的日期提前，甚至提前到学生毕业前几年，而且为了让自己心仪的学生和医院签约，医院给学生考虑的时间日渐缩短，这样做的恶果很多：一是这个匹配结果本身未必是有效的；二是学生在压力下的签约通常会导致后悔；三是医院在被学生拒绝的情况下，不能给其他合适的学生提供更多的机会。

罗思在1984年发表的研究文章中发现，美国的新医生市场长久以来受到一系列市场失灵因素的影响，但一家集中的交流中心由于采用了本质上相当于盖尔和沙普利的延迟接受的程序而大大改善了当时的情况。罗思的这篇文章阐明了市场所执行的任务，并说明这个稳定概念如何提供了一个组织原则，帮助我们理解为何市场有时运转正常，有时不正常。[7]

罗思关于匹配和市场设计实践的第二个著名例子是美国的肾脏交换项目。每年等待肾脏捐赠的患者名单上有8.5万人，而每年有约4 000名患者因器官短缺而死亡，一个重要原因是捐赠匹配系统的效率太低。2003 年，罗思开始负责设计新系统。对于想捐肾给亲人，但由于血型不匹配无法实现的案例，该系统可以帮助他们与其他不匹配的捐赠组交换器官。目前，虽然利用这一系统进行肾脏移植的患者还不多，2009年只有不到1 000例，但是它的前景仍为许多人看好。而这个成功在很大程度上要归功于研究匹配和市场设计的学者们，特别是罗斯教授这样的人。[8]

二、获奖者学术成果的理论价值、

实践意义以及对中国经济的启示（一）经济学诺奖成果的理论价值和实践意义

诺贝尔经济学奖不仅可以为我们解决现实经济问题提供思路和方法，而且能够为经济学研究在方法、手段、分析工具等方面提供最有价值的理论模型，同时还能激励人们不断创新，加深人们对经济学理论和经济系统本身的认识与理解。

1.沙普利值的理论价值和实践意义

“沙普利值”提出了一个好的方法和机制，可以帮助企业根据边际贡献进行分配。由于“沙普利值”强烈的直观吸引力及数学上的易处理，它已成为很多研究的应用焦点，尤其是在大型经济模型中。“沙普利值”在经济理论上的其他应用包括税收模型，其中，政治权力结构建立在交换经济或生产经济的基础之上。此外，确定“沙普利值”的那些公理可以方便地转换为适合于解决诸如以一种“公平”的方式考察配置联合成本的问题。[9]

合作博弈、匹配理论与市场设计实践及其政策启示

最新文章

有关的专题