第七讲
从最优解到均衡解:博弈论拥抱人工智能
你好,这里是吴飞的数字专栏《走进人工智能》。上一讲中我们介绍了“从华丽转身到炼金术之困:深度学习”。在专栏的第七讲,我为你准备的内容是“从最优解到均衡解:博弈论拥抱人工智能”。一般来说,人工智能是从数据出发,学习数据中所蕴含的模式,构建一个最佳模型,完成特定任务。但是在解决商品竞拍和资源分配等现实问题时,我们的目标往往不是最优解,而是均衡解,也就是给出让参与各方都能接受的解决之道,这就需要将博弈论与人工智能进行碰撞融合。这一讲中我将介绍纳什均衡这一博弈模型,以及博弈智能在围棋、德州扑克和星际争霸等领域的体现。
纳什均衡:洞悉“看不见的手”
“博弈”这一概念自古有之,古汉语中的“博弈”二字最初是指六博和围棋两种游戏。《论语•阳货》中有言:“子曰:饱食终日,无所用心,难矣哉!不有博弈者乎?为之,犹贤乎已。”这句话与“仓廪实而知礼节”有异曲同工之妙,即温饱之后可以参加围棋等高雅活动。《史记•孙子吴起列传》中记载的田忌赛马故事就是中国古代博弈思想的体现。
博弈论主要研究的内容是博弈行为中最优对抗策略及博弈稳定局势。在博弈对决中,带有相互竞争意图的若干主体,为了达到各自 的目标和利益,采取带有对抗性的行为进行斗争。博弈论研究的目的是为博弈参与者谋取最大利益,也就是让博弈参与者“两害相权取其轻,两利相权取其重”,《墨子•大取》中 “利之中取大、害之中取小”也表达了相似的思想。
现代博弈论思想起源于冯·诺伊曼(John von Neumann)与奥斯卡·摩根斯特恩(Oskar Morgenstern)于1944年合作出版的《博弈论与经济行为》这一本书。该书以数学形式阐述了博弈论及其思想。
约翰·纳什(John Forbes Nash Jr.)是将博弈论发扬光大的先驱者。1950年,他在完成的27页博士论文中提出了“非合作博弈(non-cooperative games)”这一思想,证明了博弈主体参与竞争的过程中存在均衡解,这一均衡解就被称为纳什均衡(Nash equilibrium)。
为了进一步解释纳什均衡,我们先来看看亚当斯密(Adam Smith)在1776年出版的《国富论》一书中的论断。他认为市场机制是“一只看不见的手”,价格在市场中作为一种信息引导着资源配置,最终达到有效率的均衡配置。这一理论强调,每个人在市场中都追求自身利益最大化,最终导致集体利益最大化。纳什却否定了这一观点,他提出的纳什均衡认为每个人在市场中按照自身利益最大化去决策,达到的结果并不一定意味着集体利益最大化。纳什本人因提出了纳什均衡对“看不见的手”的洞悉,成为经济学应用中核心的理论,于1994年获得了诺贝尔经济学奖。
值得提及的是,2012年,加州大学洛杉矶分校数学及经济学名誉退休教授罗伊德.沙普利(Lloyd S. Shapley)为了解决大学录取和婚姻求偶等合作场景中相互匹配的问题,提出了稳定配对(stable matching)模型,获得了当年诺贝尔经济学奖,这是博弈论与经济学相结合并再次获奖。
很好