36、谁会在下一轮竞赛中胜出?看看这些公司的研究院

36、谁会在下一轮竞赛中胜出?看看这些公司的研究院

00:00
16:12

上周,我在微软位于西雅图的总部,花两天时间听微软各个部门的人聊了聊他们在人工智能方面的进展。

在这个过程中,我突然想到一个问题:在几年前,大家都觉得微软、雅虎、AOL、惠普等这些曾经风光的公司错过了新浪潮新机会,因此落在了后面,成为了和创新前沿不太相关的公司。但现在,微软看起来又重新成为了 Top 5 的创新竞争者。在人工智能的竞技场上, Google 和 Amazon 等公司也都非常重视来自微软的竞争。微软看起来也已赢得了不少客户的信任,例如包括 Uber 在内的一些公司已在使用微软的人脸识别工具 Face API。但 AOL、雅虎、惠普这样的公司,在人工智能的这波新浪潮中却看起来没有太多机会。

这是为什么呢?

能想到的一个理由是,微软有一个非常强大的研究院,研究院里的科学家们一直在对人工智能相关领域进行研究。我甚至记得在我刚当记者时,他们就已经在向记者们介绍他们在语音识别等方面的进展。尽管微软在过去十几年间经历了起起伏伏,但它从来都没有财务坏到需要削减研究院的地步。

但是雅虎、惠普的研究院,以及其它一些老牌的研究实验室,例如大名鼎鼎的贝尔实验室,或施乐的PARC 实验室都一直在裁员,以至于到人工智能浪潮来临时,已没剩下多少人才可用了。

一个还蛮鲜明的例子是:2012年,雅虎在纽约裁员 2000 人,其中包括研发部门的很多科学家。而微软做的事情是,立刻在纽约建立了一个研究院,将雅虎的科学家几乎全盘给接了下来。

但这种解释并不能说明接下来的一个问题:既然研究院里的黑科技很重要,那为什么当这些公司陷入衰退的时候,研究院并没有为公司找到新的颠覆性产品和商业机会,来帮他们免于走向衰落?

我想有几个解释。

第一个解释是:并不是所有研究院的管理者都能看清楚一项新技术的潜力。

最著名的一个例子来自苹果的创始人乔布斯。1991年,乔布斯走进了施乐在 Palo Alto 的 PARC 实验室,里面很多东西都让他感到兴奋,包括鼠标和图形界面。

PARC的科学家 Taylor Tesler 当时也在场,他在后来回忆当时的情形说,当时乔布斯激动万分,嚷嚷说:“你们简直坐在金矿上!你们可以改变世界,但为什么不做些什么?”。但其他人却忙着谈别的合作,只想让乔布斯安静下来,他们谁也没有看到乔布斯所看到的那种愿景。而在那之后,乔布斯将鼠标和图形界面用到了他的苹果电脑中,并且造就了一代革命性产品;而 Tesler 也在那次会面的几个月后,追随了这位更加有远见的领导者并加入了苹果。

这个事情也有后话,施乐后来也把鼠标给产品化了,但产品做得非常失败。

所以,即使有了不起的技术,产品化也依然是很难的一步。这是第二个解释。

当乔布斯看到 PARC 鼠标的原型后,他将鼠标产品化的目标定位为:体型要小,上面只有一个按键,价格不超过 50 美元;而施乐的鼠标产品却在 200 美元左右,有三个按键,体型也更大。因此,后者成了无人问津的产品。

要让技术转化为产品,不仅仅是要理解技术本身,理解技术的市场潜力,也要能洞察技术之外的东西,例如了解消费者的心理,知道大众会对什么样的产品感兴趣。

PARC 实验室总监 John Seely Brown 后来说:“当初我负责 PARC 时,觉得 99% 的工作都是关于如何创新,然后把这些创新丢给愚蠢的市场营销人员去销售就好了。现在我意识到,和研发创新一样重要的,是第一时间从市场上找寻灵感。如果我能早点想明白这一点,我的时间会花在完全不同的地方。”

除此之外,研发成果转化为产品,中间有漫长的道路,以至于人们会觉得他们已经走到了死胡同。这是第三种解释。

我在微软时,听微软研究院高级总监 Jim Pinkelman 提到了一个关于Kinect的例子,恰好证明了这一点。

他说曾经有一个问题,被称为是鸡尾酒会上的谈话问题:在鸡尾酒会上声音嘈杂,人类因为有两个耳朵,因此能有选择地分辨出你所要听到的那个声音,并将注意力集中在你所要交谈的那个人的话语上。但这一点对机器而言就非常困难。

微软的一位叫做 Ivan 的研究者在 1990 年代开始做这方面的研究。当时他制作了一排麦克风,好让这些麦克风能在不同位置拾起声音;同时他也为之写了软件,来排除掉不必要的杂音。他和德国大学的研究者一起发表了论文,但这篇论文没有通过,因为同行在评议中认为他在解决的不是一个真实的问题。这让他的研究看起来走到了死胡同,但他接着做这项研究,最终,这项研究的成果成为了 Kinect 上麦克风的基础。

第四种解释是:在有些时候,创新并不必需依赖于艰涩的基础研究,这让研究院和科学家们漫长的需要等待的科研成果被低估。

回想图形界面、鼠标、互联网、移动互联网纷纷被发明出来之后的这二十年,大量的市场空白都需要微创新和商业创新来填补。这些创新可能不需要那么多艰涩的技术,也不需要那么多科学家攻艰;需要的是聪明的程序员,或是商业嗅觉灵敏的商业模式创造者,甚至是理解消费者喜好的设计师;

看看这段时间内成长出来的上市公司和独角兽也能证明这一点,例如 Facebook、Uber、Airbnb 等等,它们都有着不错的成长性,甚至现在已成为了硅谷创新生态中的庞然大物,但它们此前都不需要自己具备基础科研能力来做支撑。


但这个时候,那些养着一大堆基础研究人员的公司处境就很尴尬:研究院中很多研发看起来要有所突破尚遥遥无期,但却在耗费不菲的成本;管理层和董事会都会问,研究院究竟给公司带来了什么。

《经济学人》杂志一度也认为公司养着一大堆基础研究科学家的方式已经过时。在2007年,这本杂志出了一篇文章,名字叫做《在尘封的实验室外》。这篇文章更加赞成科技公司将研发和自己现有的产品方向紧密结合的这种做法。它援引的一些例子颇让人玩味,例如它提到 IBM 实验室的科学家开始和公司中的咨询师一起去见客户,帮着给出解决方案;而在惠普,它的首席科学家也告诉《经济学人》,他们不再会去问那些更基本的问题。

在这种情况下,当公司运转不良营收收紧时,研究院不被重视甚至首当其冲遭到裁员,还是挺能让人理解的了。

但历史的发展就是这么有趣。之前长时间停滞的科研项目,并不意味着会永远停滞,永远无法转化为新产品、新商业和新引擎。

微软研究院很喜欢给大家看一张图,那是关于语音识别正确率的历史曲线图。这张图上,你能看到,语音识别的研发在2000年之后就进入了停滞,毫无突破。但在经过十年停滞后,由于深度学习有了突破,语音识别的正确率也因此大幅提高。这也是为什么这几年里,亚马逊的 Echo,Google Home等智能音箱在北美已进入越来越多的家庭。


除此之外,在大量微创新和商业模式创新之后,下一轮创新飞跃,也需要更为基础的研究突破。

而这波人工智能的发展,正是这样的情况。

现在,硅谷大公司都极其渴求人工智能科学家。例如 Google 抢到了斯坦福大学教授吴恩达,后来吴教授又被百度抢走了,当然现在吴教授自己又跑出来单干了;在去年, Google 又抢到了斯坦福大学的李飞飞教授。

Facebook 则抢到了纽约大学的的 Yann LeCun 教授。我们之前节目中也提到过这位在人工智能学界声名显赫的教授。他在纽约大学任教之前,曾在贝尔实验室工作,在那儿他开发了很多机器学习的方法,例如卷积神经网络,后来又加入了 AT&T 实验室。

Uber 则直接从卡耐基梅隆大学的美国国家机器人工程中心直接挖走了40多名研究员。现在 Uber 风雨飘摇,这些研究员们估计又会被其它公司给挖走。

人工智能领域特殊的地方在于,它的发展需要很多交叉领域的共同推进。即使是其中一个细分领域,也需要集众科学家之力。

Jim Pinkelman 给我举的一个例子是关于 Skype 的实时翻译。他说实时翻译过程中,让麦克风识别声音并转化成为人类的文字,这是一个单独的研究领域;从一种语言转变成为另外一种语言,这又是一个另外的领域;最后,将翻译好的文本整理成为人类能理解的语句而不仅仅是词语,这又是一个研究领域。因此在 Skype 进行实时翻译的三个步骤中,需要不同背景的研究人员来提供不同的技术。

所以现在我们也能看到,大公司们现在不仅仅是在挖来人才,也在轰轰烈烈地建立实验室。除了财大气粗的 Google 早就有 Google X 和 Google Brain 这样专注于长期研发的部门之外,很多想要在无人车和人工智能上有所突破的公司也都开始在硅谷设立研发实验室。

最为突出的一个例子是 Facebook。这家看起来本来和黑科技不沾边的公司,在2014年开始让 Yann LeCun 教授领军来建立一个专注于长期研发的人工智能实验室。除此之外,它还在去年成立了一个黑科技部门 Build 8,好来探索那些和 Facebook 现有主营业务看起来不太相关的黑科技领域,例如脑机接口。这个我们在之前的节目中也聊到过,可以点这里收听。

所以,我们也许可以下一个论断,贝尔实验室和 PARC 实验室这样的老一代实验室已经凋零,但科技大公司们会接着纷纷建立起自己的实验室。毕竟,在下一轮的创新竞争中,跑在前面的,一定是那些有大量研发人才和研究院的公司。

但研究院在多年前存在的问题到现在也一定还会存在:1、管理层是不是能有远见,意识到他们所拥有技术的前景;2、公司的管理架构是否有助于将技术产品化;3、在研发遇到阻力,迟迟无法转化收益的时候,它们是否还会坚持。

而这些新公司们应该会有和当年施乐、惠普、雅虎等不同的做法来处理这些问题。

音频和本文会有所不同,anyway,enjoy!


以上内容来自专辑
用户评论

    还没有评论,快来发表第一个评论!