【脑力·人工智能】王小川 | 人工智能的三个阶段

【脑力·人工智能】王小川 | 人工智能的三个阶段

00:00
19:20

导师简介:王小川,搜狗CEO


我相信关于人工智能大家已经接触了很多相关的内容,包括技术、商业模式等,但是听到的内容和实际操作之间还有很大的差距。今天主要想和大家分享我在“如何衔接技术-商业”方面的思考。


一、我将人工智能分为三类:

 

1.识别

 

在视觉上,基于相对活动物体的识别已经发展到一定水平。识别的核心“人脸识别”和“语音识别”也具有很大的突破。因此,原来人所具有的感性体验现在也能够被机器所掌握。

 

2.判断——最具商业价值

 

能够协助人们进行选择或者判断。比如:阿尔法狗就是在帮助人们为棋子选取一个更好的位置。


判断被越来越多地应用到实际工作生活领域,比如:广告,未来在基金方面也有可能由机器自主进行决策购买行为。

 

3.创造

 

在学术界里面研究较多的就是创造类,比如:帮助人类合成一段文字或者语音等。谷歌发布的WaveNet就是基于语音网络使用生成算法制作而成的,相对于以前的拼接法、参数法,在声音质量上更具优势。


WaveNet采用了扩大卷积和因果卷积的方法,让感受野随着网络深度增加而成倍增加,可以对原始语音数据进行建模。(来自知乎)


以前方法集中虽多,但性能慢,每合成一秒的音频需要用时几分钟之多。


到目前为止,创造本身仍停留在学术阶段,当然如果有人能够控制无人驾驶领域就另当别论了。但是即便拥有无人驾驶技术,技术本身仍然不具商业价值,因为目的地是由用户指定的,商业利益弱。


费曼1965年诺贝尔物理奖得主曾说过:


凡是我们不能创造的就是我们不能理解的


比如:除了生孩子以外的方法我们不能创造生命。虽然创造在商业上并没有直接的用处,但是有助于我们对基础的理解。

 

我认为在这三个领域里,识别和创造的商业前景并不大,最具商业价值的是判断,即帮助人们进行选择或者决策。

 

事实上,输入法作为搜狗最大的产品并没有达到它应具有的商业价值,因为输入法作为一个工具,用户所表达的和他所需要的内容是完全一致的。比如输入“A”绝对不能显示“B”,所以输入法没有丝毫空间可以做更多的增值。

 

当用户对一个产品具有充分选择权,这个产品就无法体现出判断的增值。这也是搜狗基于如此之大的用户规模,在输入法方面却没有获得商业回报的原因。


与输入法不同的是——搜索引擎,它可以利用与搜索相关的推荐优势,帮助人们进行决策判断,在推荐的同时,就能够带来商业选择的价值。


二、人工智能发展的三个阶段

 

1.教规则

 

将规则教给机器,让其进行判断,这是依赖于人们的经验于最初级的人工智能产品。

 

电饭锅就是其中典型的例子,在其内部有一个测试温度的传感器,可以监控内部温度,如果温度达到103度,就停止加热。


最初的人脸识别技术虽然技术实现方面更加复杂,但是原理是一样的,就是告诉机器该从哪几个特征来进行判断。如何理解眼睛的距离、鼻子的高度,如何选取这些特征是传统人工智能的做法。

 

传统人工智能最大的瓶颈在于,不仅要懂规则,还要能够准确描述规则。比如:人脸识别技术,我们看到一个人就能够立刻知道他是谁,但是对于机器来讲,就需要工程师将这个识别技巧写成语言告知它。

 

但是这一点相对来说就不那么容易了,因为用语言很难去描述一个人的长相。我们把这些说不清楚的规则叫做感性,即使我知道怎么回事,但是无法用语言描述出来。

 

2.原始数据

 

在2012年,图像识别技术有了重大突破,机器的识别能力超越了人类。其基础原理在于,图像识别不再需要描述,而是输入大量原始点阵数据,当机器存储的数据量足够大,计算能力足够强的时候,就能够学会有效识别。

 

举个例子:


阿尔法狗就是存储了将近3000万个棋局,将每一个棋局的原始点阵数据输入进去,告诉机器人下棋的棋路和落子方法。当3000万个棋局全部输入进去以后,机器就开始学会了下围棋。

 

中国围棋队总教练余斌,号称在围棋界里面最会写程序的人。他认为让机器下围棋最大的难点在于机器没有大局观,但事实证明机器在大局观方面比人做的更好,因为机器存储的是整个棋盘的点阵图,而人还要琢磨某一个局部。


这个阶段突破的意义在于,计算机工程人员有机会进入更多的行业领域进行合作。


比如:医疗领域,以前做心电图分析需要技术人员能够像医生一样懂行,到底什么样的心电图代表一个人的心脏有问题,这是一种经验技巧,仅停留在医生心中,工程师要掌握这方面的知识就有些难度。

 

但是现在如果数据量足够多,工程师就不必费力去进行规则表达描述,只要告诉机器这样的心电图是生病的心脏,那样的心电图是健康的心脏,机器就有机会学会对心电图的识别判断。

 

这就是大数据下,强大的计算能力和精准的算法在日常工作和生活中带来的突破。以前需要依靠经验才能够解决的问题,现在通过数据和技术人员就能够得以实现,阿尔法狗最大的启发就是不用找规则,直接给出答案即可。

 

3.强化学习

 

有的时候我们既不知道如何向机器表达规则,也不能找出一个准确的答案,但是我们有能力去判断,机器执行后的结果是离目标更近了,还是更远了。这就是强化学习的基本意义

 

一个复杂性颇高的问题,很难找出正确的答案,但是验证答案是否正确十分简单。就像几何里的定理一样,证明定理很难,但是如果别人证明以后,判断是否正确就很简单。


在这种情况下,给机器的答案就进化成了给机器一个目标


与围棋类似的,阿尔法狗既拥有3000万个棋局作为基础,也有人为判定输赢帮助它继续学习。学习到一定程度以后,就可以安排两个机器对弈,目标就是赢取比赛,过程无论好坏,只要告诉机器棋局结果就可以了。机器根据比赛结果,自行复盘总结的这种算法称作强化学习。

 

这是基于我个人视角进行的分类,在行业里面可能会看到不同的分类方法。我这个视角的优势在于最容易理解技术的进步路线图,最容易分析怎样的职业容易被取代。


三、哪些工作会被取代?


对于员工来讲,他们最担心的问题是科技发展到什么程度,自己就失业了。


对于企业家来讲,他们更关心的是如何将人工智能嵌入自己公司业务的发展。

 

所以,如果所输入的信息是封闭、有边界、可以结构化的,且包含做决策所需的所有信息,目标也是确定的,那么这样的判断能力就可以被机器所取代

 

在计算机数据里面有一个基本准绳,机器完全可以胜任,输入可以被表达,输出目标稳定且可评测的工作。除了下围棋以外,还有类似审计和数字相关的工作其实都可以被机器取代。

 

难以被取代的职业有画家、作家、科研人员等,就是那种创造性大、输入的问题相对开放的职业。

 

即便机器可以进行绘画,但仍然不能取代画家,因为机器不能真正理解“画”,“画”里面融合了画家个人的人生经历和阅历,作品里带有好的人生体验。因此,机器不能创造“画”,只能作为一种噱头供人观看。


过去人们总认为,人工智能会取代蓝领工人的工作,精英人士无所畏惧。但我觉得不一定,比如:服务员、幼儿园老师等等面对极其不确定的、开放环境的工作者,是很难被取代的。这些工作并不需要具有高深的知识,而是在与他人的交互中处于完全开放的环境,任务也是开放的。

 

因此,不要认为蓝领的工作容易被取代,而白领、金领的工作容易被保住。只要不带有创造性的工作,就会有被智能取代的风险。

 

谢谢大家!

内容来自:湖畔大学三板斧(ID:hupansanbanfu)


更多精彩,就在每周六#湖畔三板斧#

本节目版权归原作者所有,严禁翻录成任何形式,严禁在任何第三方平台传播,违者将追究法律责任。

以上内容来自专辑
用户评论
  • 如是科技

    这个主题让TalkingData的创始人Leo来分享应当会很赞的

  • 李正非271

    总觉得湖畔黑衣人开头讲段话特别二...

    不忘初心_lhc 回复 @Halleychen: 黑衣人牛大吧

  • jeck_zhao

    所以现在越来越重视创造力

  • 卖茶翁

    说话不等于语言,是自主符号交流,小川牵强了

  • 路诚相伴

    沙发

  • 一道_ds

    湖畔大学v群yandao333

  • 哇哦噢呃哈

    围棋算法要包含表情、体温等行为分析,俗称:察言观色。

  • 谈谈A

    他声音特别好听 没想到搜狗老大声音跟播音员似的 干错行了

  • 听友42650440

    为什么放几分钟,就没了

  • 13983013iwc

    很好!