意外后果这个概念不仅仅适用于算法所做的决策上。早在18世纪,亚当·斯密等经济学家就使用过这个术语,但直到20世纪才由美国社会学家罗伯特·默顿(RobertMerton)推广开来,他用这个术语指代人类决策带来的意料之外的副作用。文献记载了三种不同类型的意外后果:意外收益、有害结果、意外缺陷。意外收益,顾名思义,是偶然所得。著名的案例就是药物万艾可,研发这种药物的原意是降低血压,但在临床实验期间意外发现其在男性勃起功能上的副作用使其地位得到了“抬升”。尽管意外收益也和算法决策有关,但几乎没有关于它的辩论,因此本书中对此不做详细讨论。
“有害结果”指的是介入行为恰恰恶化了原本要改善的结果。一个著名例子就是发生在印度殖民地时期的所谓“眼镜蛇效应”。据传,德里的一位英国政府官员认为印度首都地区存在眼镜蛇威胁,意图解决,于是他进行悬赏,要求将死眼镜蛇交给相关部门。起初,悬赏带来了正面效果。然而好景不长,一些头脑灵活的人意识到,与其到野地里冒险去抓眼镜蛇,还不如饲养眼镜蛇上交蛇头更为容易。政府察觉这种行为后取消了悬赏。既然已经毫无价值,那些饲养者便将眼镜蛇全部放生,结果德里地区的眼镜蛇数量不降反升。[注]
“意外缺陷”指的是在预期的正面结果之外产生的未预期到的负面结果。很多场景下会产生这种结果。一个案例发生在英格兰东北部。那是一个工业城市,有记载的历史至少可以回溯到地籍簿的时代,那是威廉征服者下令进行并在1086年完成的英国地产清册。当年,该地仅有21户居民,还拥有一个古斯堪的纳维亚语的名字艾斯肯托普(Escumetorp)。在现代地图上,这个城市叫斯肯索普(Scunthorpe)。1996年,当地一位名为戴维·布莱基(David Blackie)的居民在创建美国在线(AOL)账号时,输入了这座城市的名字。他的账号注册过程被中断了,系统也未给出任何理由。AOL热线电话人员起初猜测是他们的算法察觉到了他的姓“布莱基”,将其标为带有种族主义的蔑称。但真相水落石出时大家才发现,原来是城市的名字“斯肯索普”让机器不敢直视,因为这个名字里含有那个c开头的不雅词汇[注]。
AOL尝试屏蔽冒犯性语言的努力通常都是成功的,但显然不具有冒犯性的名字被屏蔽也时有发生。如何解决?AOL告知用户暂时将“斯肯索普(Scunthorpe)”拼写为“斯康索普(Sconthorpe)”。一位发言人向当地报纸保证,技术人员正在想方设法消除这一屏蔽。在解决之前,她说“为了不引起冒犯,我们已经把该城市重新命名”,这件事真是把软件的预期效果和意外缺陷巧妙地融合在了一起。
***
2005年夏季,宾夕法尼亚大学的大二学生纳撒尼尔·斯蒂文斯,昵称“奈特”(Nathaniel “Nate” Stevens)决定放弃暑期实习机会,去帮助他的父亲打理自家的车行。他之前在车行干过,处理一些文字工作,和潜在客户聊聊天。但这次他带着一些市场营销技巧,打算处理下车行的广告事宜。当时,消费者已经越来越多地使用谷歌查找本地的汽车经销商。假设你住在康涅狄格州,想找一家丰田经销商,你就在谷歌里简单地打上“康涅狄格丰田经销商”。虽然买家们已经开始往线上跑了,本地的车行却还顽固地指望着他们从厚重的黄页中找到自家的名字。奈特知道几年之内黄页就会走上渡渡鸟和玛卡雷娜(Macarena)[注]的老路。他决定把老爸的车行推进21世纪,于是在谷歌上投放了广告,很快他在网络上发现了一个还无人触及的巨大商机。
典型的本地生意都是夫妻店,对新技术并不在行,也没有庞大的市场团队来研究如何在谷歌上投放广告。和给黄页公司开一张支票、要求登半页广告不同,在谷歌上投放广告的流程没有那么简单。谷歌会进行实时拍卖,出售搜索结果页中有限的广告位。对一家小企业来说,需要找出顾客可能会在搜索引擎输入的关键字种类,以及弄明白如何为每个种类竞价。奈特嗅到了其中的商机,创办了一家公司帮助本地的小生意主如牙医诊所经营者、园艺师、房地产经纪人,在谷歌上投放广告。一开始,他亲自为客户做些关键决策,例如顾客会输入哪些搜索条件和关键字、用多高的价格竞价等。但很快他就意识到,这样做既不划算也不利于扩大规模,也无法招聘培训更多人员为可能需要类似帮助的成百上千家小企业服务。
奈特打电话给我告知了他的困境,他想讨论下如何创建一个算法来自动处理这些决策过程。我决定尝试这样的方案:一开始先做合理猜测,然后随着某个特定搜索关键字的搜索数、点击数和销售线索数(指进一步接触该企业的潜在顾客数量)的增加,每天产生的新数据会不断提升算法的性能。举个例子,华盛顿特区的一家牙医诊所也许会考虑在上千个可能的搜索关键字中选择“华盛顿特区牙医”“特区牙齿美容”和“补牙”竞标。随着时间推移,算法会慢慢减少投向表现不佳的关键字的广告预算,转而投向效果更好的关键字。理论上,一个月之内,这个算法就能在搜索关键字和竞标方面做出比真人更好的决策了。
在测试的初始阶段,这个算法产生了一些非常奇怪甚至灾难性的建议,例如对一个关键字提出了每次点击10000美元的竞价,而人类很少会出价超过20美元。但几个迭代之后,竞价终于符合常理了,也产生了为我们的客户降低成本、带来更多顾客的益处。
我们宣布项目成功了,但其实不然。不久之后,奇怪的事情发生了,我们的客户投放广告的费用开始飙升。有一位客户之前花2000美元的广告预算可以获得50个销售线索,如今却下降了一半。但这个现象并没有发生在所有人身上。对于一些广告客户,效果下降了,对于另一些,却持续走好。我在筛查这些结果时,又发现了另一个谜题。在某个领域的市场中,我们的客户越多,我们就能得到越多的数据,但算法的性能却变得越差。举例来说,在关键字“特区牙医”的第一页查询结果里出现的十位广告客户中,六位都是我们的客户。算法带给他们的利益都下降了。但对费城仅此一家的饮食服务公司,算法还是延续着非凡的表现。
经过分析,有害结果的原因得到了揭示:华盛顿的六家牙医诊所使用的是完全一样的算法,为这些客户挑选出了完全一样的“具有高度价值的关键字”。所以每个客户为了保住自己在这些关键字下的头排位置而激进竞标,在这场出价大战中,只有谷歌得到了实实在在的好处。那是否可以说我们这个项目概念出问题了呢?幸运的是,答案是否定的。如果同样的算法和同样的底层数据为所有客户指定广告策略,那争夺有价值的关键字的区域价格战将不可避免。但在真实世界里,不同的企业有不同的擅长领域。这一家牙医诊所也许擅长牙齿美白,更愿意把这个作为他的首选关键字,而另一家也许想突出自己在拔牙方面的特长。他们服务的客户群甚至都不一定是同一批人:儿童和老人、有保险的病人和自掏腰包的病人。为了修正我们的算法,我们只需要进行一些修改,使其能考虑到每个广告客户的数据,识别出对于他们的业务具有独特价值的那些搜索条件。我们一完成修改,算法立刻就停止了为所有人追逐同一组关键字的恶性循环[注]。调优过的算法成为我们之后建立Yodle公司的基础,最终帮助了超过50000家小企业优化他们的广告投放策略。
我们的算法导致的类似有害结果通常都是意料之外的。但多亏了所有科技公司都例行进行的测试和优化,这些错误经常能被快速检测到并且及时解决。而“意外缺陷”则被证明更加难以对付。
思考下Facebook在2016年夏季遇到的问题。由人类编辑团队管理的“热门话题”板块,被控带有自由主义偏见。一位前员工揭秘说,有着保守倾向的新闻,即使再热门,也会被编辑团队压制。不仅如此,一些“新闻策展人”(Facebook对那些编辑的称呼)还被要求插入来自自由主义的新闻,即使这些新闻实际上根本不热门。这次爆料让Facebook陷入极其尴尬的境地,但他们的高级管理层迅速行动起来解决了这个问题。对于人类偏见相关的问题,显而易见的解决方案就是由算法替代人类,自动选择热门新闻,尤其当这份工作只是记录某个帖子的浏览数和分享数。毕竟,一个算法不可能被控带有政治目的。
还没有评论,快来发表第一个评论!