【本集金句】格雷格布罗克曼:“我们所做的一切都只是简单的想法,但正确吗?我们还没有搞清楚,有点茫然。”
第63集 打破僵局
在马斯克与奥特曼的那场对谈后,2016年12月,OpenAI发布了软件平台Universe,这个平台是用于在全球游戏、网站和其他应用程序中测量和训练AI的通用智能。Universe将帮助AI,通过查看屏幕操作虚拟的键盘和鼠标,像人类一样使用计算机,从而助力研究人员开发出一个独立的人工智能,能够灵活应用其在Universe的环境中的经验快速掌握陌生、困难环境,完成人类用计算机完成的任何任务。OpenAI将这个目标视作人工智能拥有更强的通用性的重要一步。
Universe可以视作Gym外的新工具包,也是OpenAI实现三个目标的重要助力,这三个目标就是此前提到的:开发家用机器人、游戏人工智能,以及通用的、可以通过图灵测试的人工智能系统。而且幸运的是,OpenAI和奥特曼等人不需要与时间赛跑,因为人工智能领域是一个长期赛道。
OpenAI的最大竞争对手,Google DeepMind的创始人杰米斯哈萨比斯也认同这个观点,他在一次采访中说:“通用人工智能不是那种你可以在某个早上醒来后说,这是一个很酷的创业想法的项目。它需要你投入自己人生的全部,片刻不停的去钻研它。这是DeepMind和其他人工智能项目最大的区别,我们试图将对计算机科学和神经科学的理解融合在一起,来深入了解系统神经科学,包括大脑使用的算法、知识的表现形式与架构等等。”现在,在DeepMind之外,又多了一个以10年、20年为单位,投入人工智能项目研究的机构。
那么,人工智能项目将如何在20年内影响人类的生活?奥特曼、布罗克曼和米尔斯有相同的看法,他们都相信,随着这个领域的研发逐渐深入,首先受益的肯定是科学,尤其是在那些需要大量探索的领域,比如埃隆马斯克和他的特斯拉工厂正在生产并且向普通人提供的自动驾驶汽车,而这仅仅只是狭义的人工智能应用之一。如果将这个时间线拉长,米尔斯对通用人工智能的未来有更加大胆的想象,他说:“在20年内,许多看起来很复杂的事情,将在分解后变得清晰,比如人类的大脑,我们正在进行脑部扫描,区分发现涉及创造力和情感的大脑分区,我们准备去构建大脑的模型。这些研究或许可以帮助我们了解大脑的工作过程,如果可以理解大脑如何工作,或许就能让人工智能诞生创造力。到了那个时候,AI是或许可以制作出有趣的电影?或者写出一本小说?未来充满着可能性。”
而在短期内,比如5年,人工智能领域的工作主要是,将人工智能与日常工具结合、让这些工具更加智能,更具适应性。比如在搜索领域,人工智能可以更好的理解人类所提供信息的上下文和意图,就算这些信息很模糊,人工智能也能理解提供信息的人想要做什么;智能手机助手领域也一样,目前由于它们是预先编程的,所以在运作上相当有限,但如果它们变得更聪明,比如手机的主人说“我想在欧洲旅游”,智能助手就能自动分析手机主人的所有信息,分析喜好,预定所有酒店、餐馆和航班,甚至定一些与考古遗址和葡萄酒庄园有关的体验,满足手机主人的“文艺”需求。这是OpenAI和DeepMind希望在五年内开发应用的技术。
OpenAI作为后来者,奥特曼和布罗克曼一直紧紧盯着谷歌的动作,参照他们的研发方向,以及对DeepMind研究成果的应用,以此进一步细化OpenAI的目标,因为一个成功的人工智能系统必定是有用的,并且用途广泛。布罗克曼发现DeepMind有五个团队,分别应用人工智能在YouTube、搜索、健康、自然语言理解和Google X的项目上工作,比如他们努力将人工智能应用于YouTube个性化推荐视频的功能中,通过让AI分析YouTube用户喜欢观看的视频类型,从中学习,更好地为用户推荐他们喜欢的内容。这项应用如今早已成熟,无论我们打开什么类型的APP,电商或者内容平台,比如喜马拉雅,都能在各种位置看到相关推荐栏,或者干脆是根据喜好生成的信息流瀑布。
2017年,格雷格布罗克曼担心被谷歌旗下的DeepMind等对手彻底甩在身后,便带头发起了一项计划:他让OpenAI的研究员和程序员合作,集中资源开发游戏人工智能,并且选定了一个具体方向,希望能够开发出可以玩复杂在线战斗游戏DOTA2的人工智能OpenAI Five。
布罗克曼的这个计划一开始就遇到了问题,甚至险些导致OpenAI出现内部危机。因为研究员和程序员分属两个团队,他们职责相似——研究员专注于训练新的人工智能模型,而程序员则开发新的应用软件让这些人工智能模型工作,但在OpenAI的其他项目上,这两个团队之间的关系一直很紧张,一些OpenAI程序员低估了研究员贡献的重要性,研究员则把程序员视为技术人员而不是科学家。这也是当时科技公司内部普遍存在的一种状态。
OpenAI成立后的最初几年,奥特曼和马斯克几乎不去OpenAI的办公室,格雷格布罗克曼和伊利亚苏茨克维尔负责公司几乎所有日常决策,苏茨克维尔监督研究员团队,而布罗克曼不仅要管理程序员团队,还要对公司的经营管理负责。因此布罗克曼必须解决一个难题,就是如何让研究员和程序员从同样的角度出发去工作,DOTA2项目成为打破僵局、推动内部团队合作的一个绝佳契机。
为了推动这个项目,布罗克曼不停与研究员和程序员两个团队一起开会,并且拉着他们与DOTA2的母公司暴雪的开发人员进行了数小时的电话交谈,以弄清楚如何让玩游戏的软件工作,这是一个技术挑战,因为游戏和OpenAI的算法是用不同的编程语言编写的。事实证明,这个技术难关激发了两个团队的求生欲望,他们不得不合作才能闯过这个关卡。布罗克曼的目的因此达到了,两个团队在竞争中合作,逐渐消除了隔阂,而DOTA2项目的游戏人工智能开发也有了阶段成果。经过几个月的通宵工作,2017年8月,OpenAI在官网宣布,他们的游戏人工智能在国际邀请赛的主舞台上对阵数位顶尖玩家,保持不败纪录,赢得了所有三场两胜制的比赛。
Dota 2项目表明,如果有足够的计算能力,自我对弈可以将机器学习系统的性能从远低于人类水平提升到超人类水平。在一个月的时间里,OpenAI的人工智能系统从勉强与高排名玩家匹敌,到击败顶级职业玩家,并从那时起不断改进。OpenAI发现,受监督的深度学习系统只能与其训练数据一样好,但在自我对弈系统中,可用数据会随着人工智能变得更好而自动改进。他们下一步的计划是创建一个Dota 2人工智能团队,与顶级人类团队在5V5的游戏中竞争。
开发游戏人工智能的阶段成果帮助布罗克曼成为了OpenAI的生成式AI模型开发的关键人物。OpenAI的Dota 2项目成果发布不久,谷歌的研究员发表了一篇题为《注意力机制是你所需要的》的研究论文,这篇论文展示了一种名为“Transformer”的深度学习模型,可以帮助研究员们更有效地构建更大的模型,推动了各个人工智能实验室开始着手研究生成式AI模型。
OpenAI一边低头搞研发,一边暗中学习自己的竞争对手。按理说,他们似乎只需要蛰伏下来,有足够的资金支持闷头研发,保有研究员团队的稳定性,在一切顺利的情况下就可以等到拐点,实现弯道超车,惊艳所有人。然而事情通常都不会那么顺利,尤其是当人们在做一项伟大的事情时,Dota 2项目发布几个月后,OpenAI迎来了自己的低潮期。
打卡