【脑力·人工智能】王小川 | 人工智能的三个阶段

00:00

19:20

导师简介：王小川，搜狗CEO

我相信关于人工智能大家已经接触了很多相关的内容，包括技术、商业模式等，但是听到的内容和实际操作之间还有很大的差距。今天主要想和大家分享我在“如何衔接技术-商业”方面的思考。

一、我将人工智能分为三类：

1.识别

在视觉上，基于相对活动物体的识别已经发展到一定水平。识别的核心“人脸识别”和“语音识别”也具有很大的突破。因此，原来人所具有的感性体验现在也能够被机器所掌握。

2.判断——最具商业价值

能够协助人们进行选择或者判断。比如：阿尔法狗就是在帮助人们为棋子选取一个更好的位置。

判断被越来越多地应用到实际工作生活领域，比如：广告，未来在基金方面也有可能由机器自主进行决策购买行为。

3.创造

在学术界里面研究较多的就是创造类，比如：帮助人类合成一段文字或者语音等。谷歌发布的WaveNet就是基于语音网络使用生成算法制作而成的，相对于以前的拼接法、参数法，在声音质量上更具优势。

WaveNet采用了扩大卷积和因果卷积的方法，让感受野随着网络深度增加而成倍增加，可以对原始语音数据进行建模。（来自知乎）

以前方法集中虽多，但性能慢，每合成一秒的音频需要用时几分钟之多。

到目前为止，创造本身仍停留在学术阶段，当然如果有人能够控制无人驾驶领域就另当别论了。但是即便拥有无人驾驶技术，技术本身仍然不具商业价值，因为目的地是由用户指定的，商业利益弱。

费曼（1965年诺贝尔物理奖得主）曾说过：

“凡是我们不能创造的就是我们不能理解的”

比如：除了生孩子以外的方法我们不能创造生命。虽然创造在商业上并没有直接的用处，但是有助于我们对基础的理解。

我认为在这三个领域里，识别和创造的商业前景并不大，最具商业价值的是判断，即帮助人们进行选择或者决策。

事实上，输入法作为搜狗最大的产品并没有达到它应具有的商业价值，因为输入法作为一个工具，用户所表达的和他所需要的内容是完全一致的。比如输入“A”绝对不能显示“B”，所以输入法没有丝毫空间可以做更多的增值。

当用户对一个产品具有充分选择权，这个产品就无法体现出判断的增值。这也是搜狗基于如此之大的用户规模，在输入法方面却没有获得商业回报的原因。

与输入法不同的是——搜索引擎，它可以利用与搜索相关的推荐优势，帮助人们进行决策判断，在推荐的同时，就能够带来商业选择的价值。

二、人工智能发展的三个阶段

1.教规则

将规则教给机器，让其进行判断，这是依赖于人们的经验于最初级的人工智能产品。

电饭锅就是其中典型的例子，在其内部有一个测试温度的传感器，可以监控内部温度，如果温度达到103度，就停止加热。

最初的人脸识别技术虽然技术实现方面更加复杂，但是原理是一样的，就是告诉机器该从哪几个特征来进行判断。如何理解眼睛的距离、鼻子的高度，如何选取这些特征是传统人工智能的做法。

传统人工智能最大的瓶颈在于，不仅要懂规则，还要能够准确描述规则。比如：人脸识别技术，我们看到一个人就能够立刻知道他是谁，但是对于机器来讲，就需要工程师将这个识别技巧写成语言告知它。

但是这一点相对来说就不那么容易了，因为用语言很难去描述一个人的长相。我们把这些说不清楚的规则叫做感性，即使我知道怎么回事，但是无法用语言描述出来。

2.原始数据

在2012年，图像识别技术有了重大突破，机器的识别能力超越了人类。其基础原理在于，图像识别不再需要描述，而是输入大量原始点阵数据，当机器存储的数据量足够大，计算能力足够强的时候，就能够学会有效识别。

举个例子：

阿尔法狗就是存储了将近3000万个棋局，将每一个棋局的原始点阵数据输入进去，告诉机器人下棋的棋路和落子方法。当3000万个棋局全部输入进去以后，机器就开始学会了下围棋。

中国围棋队总教练余斌，号称在围棋界里面最会写程序的人。他认为让机器下围棋最大的难点在于机器没有大局观，但事实证明机器在大局观方面比人做的更好，因为机器存储的是整个棋盘的点阵图，而人还要琢磨某一个局部。

这个阶段突破的意义在于，计算机工程人员有机会进入更多的行业领域进行合作。

比如：医疗领域，以前做心电图分析需要技术人员能够像医生一样懂行，到底什么样的心电图代表一个人的心脏有问题，这是一种经验技巧，仅停留在医生心中，工程师要掌握这方面的知识就有些难度。

但是现在如果数据量足够多，工程师就不必费力去进行规则表达描述，只要告诉机器这样的心电图是生病的心脏，那样的心电图是健康的心脏，机器就有机会学会对心电图的识别判断。

这就是大数据下，强大的计算能力和精准的算法在日常工作和生活中带来的突破。以前需要依靠经验才能够解决的问题，现在通过数据和技术人员就能够得以实现，阿尔法狗最大的启发就是不用找规则，直接给出答案即可。

3.强化学习

有的时候我们既不知道如何向机器表达规则，也不能找出一个准确的答案，但是我们有能力去判断，机器执行后的结果是离目标更近了，还是更远了。这就是强化学习的基本意义。

一个复杂性颇高的问题，很难找出正确的答案，但是验证答案是否正确十分简单。就像几何里的定理一样，证明定理很难，但是如果别人证明以后，判断是否正确就很简单。

在这种情况下，给机器的答案就进化成了给机器一个目标。

与围棋类似的，阿尔法狗既拥有3000万个棋局作为基础，也有人为判定输赢帮助它继续学习。学习到一定程度以后，就可以安排两个机器对弈，目标就是赢取比赛，过程无论好坏，只要告诉机器棋局结果就可以了。机器根据比赛结果，自行复盘总结的这种算法称作强化学习。

这是基于我个人视角进行的分类，在行业里面可能会看到不同的分类方法。我这个视角的优势在于最容易理解技术的进步路线图，最容易分析怎样的职业容易被取代。

三、哪些工作会被取代？

对于员工来讲，他们最担心的问题是科技发展到什么程度，自己就失业了。

对于企业家来讲，他们更关心的是如何将人工智能嵌入自己公司业务的发展。

所以，如果所输入的信息是封闭、有边界、可以结构化的，且包含做决策所需的所有信息，目标也是确定的，那么这样的判断能力就可以被机器所取代。

在计算机数据里面有一个基本准绳，机器完全可以胜任，输入可以被表达，输出目标稳定且可评测的工作。除了下围棋以外，还有类似审计和数字相关的工作其实都可以被机器取代。

难以被取代的职业有画家、作家、科研人员等，就是那种创造性大、输入的问题相对开放的职业。

即便机器可以进行绘画，但仍然不能取代画家，因为机器不能真正理解“画”，“画”里面融合了画家个人的人生经历和阅历，作品里带有好的人生体验。因此，机器不能创造“画”，只能作为一种噱头供人观看。

过去人们总认为，人工智能会取代蓝领工人的工作，精英人士无所畏惧。但我觉得不一定，比如：服务员、幼儿园老师等等面对极其不确定的、开放环境的工作者，是很难被取代的。这些工作并不需要具有高深的知识，而是在与他人的交互中处于完全开放的环境，任务也是开放的。

因此，不要认为蓝领的工作容易被取代，而白领、金领的工作容易被保住。只要不带有创造性的工作，就会有被智能取代的风险。

谢谢大家！

内容来自：湖畔大学三板斧（ID：hupansanbanfu）

更多精彩，就在每周六#湖畔三板斧#

本节目版权归原作者所有，严禁翻录成任何形式，严禁在任何第三方平台传播，违者将追究法律责任。

以上内容来自专辑

主播信息

湖畔Hupan

从实践中学习

31.77万

加关注

如是科技
这个主题让TalkingData的创始人Leo来分享应当会很赞的
李正非271
总觉得湖畔黑衣人开头讲段话特别二...
不忘初心_lhc 回复 @Halleychen: 黑衣人牛大吧
jeck_zhao
所以现在越来越重视创造力
卖茶翁
说话不等于语言，是自主符号交流，小川牵强了
路诚相伴
沙发
一道_ds
湖畔大学v群yandao333
哇哦噢呃哈
围棋算法要包含表情、体温等行为分析，俗称：察言观色。
谈谈A
他声音特别好听没想到搜狗老大声音跟播音员似的干错行了
听友42650440
为什么放几分钟，就没了
13983013iwc
很好！

【脑力·人工智能】王小川 | 人工智能的三个阶段

湖畔三板斧：首次公开创业心法

湖畔Hupan

【脑力·人工智能】刘庆峰｜人工智能爆发的前夜

【人工智能超人】17大战人工智能（下）

【人工智能超人】17大战人工智能（上）

【人工智能超人】07人工智能头盔（下）

【人工智能超人】07人工智能头盔（上）

【脑力·人工智能】王小川 | 人工智能的三个阶段

湖畔三板斧：首次公开创业心法

湖畔Hupan

【脑力·人工智能】刘庆峰 ｜ 人工智能爆发的前夜

【人工智能超人】17大战人工智能（下）

【人工智能超人】17大战人工智能（上）

【人工智能超人】07人工智能头盔（下）

【人工智能超人】07人工智能头盔（上）

【脑力·人工智能】刘庆峰｜人工智能爆发的前夜