43. E5互联网的未来:「失控」的语义网和 Web3.0
 4061

试听9043. E5互联网的未来:「失控」的语义网和 Web3.0

倍速播放下载收听

00:00
08:08


购买所属专辑,收听更多内容

Web3.0有可能是一种与Web2.0完全不同的事物;它的发展路径也往往出乎我们意料。

【关键词】

语义网,元数据,Web3.0


KK 的话】

网站看起来更聪明了,这表现在它「知道」更多东西——并不是以一种有意识的方式,而是表现在程序化方式上。呈现在网络上的概念和物品将能够互相指认并了解对方——以一种它们现在还不可用的基本途径。


【正文】

你好,欢迎来到《KK 对话未来》!


昨天一条消息在朋友圈刷屏了,就是 Facebook 关掉了一个人工智能项目,因为在这个项目中,两个人工智能客服,一个叫 Alice,一个叫 Bob,发展出了自己的对话语言。


这个消息我们在上一期节目当中就提到过。不过说实话,当时我对这个消息的真实程度有些半信半疑,因为媒体比较喜欢夸大这种事情,哪怕是西方媒体。我当时查了一些消息来源,因为没有见到西方主流大媒体报道,但也没有见到否定的报道,所以并不能确认这件事情是否真实。


另外,Alice 和 Bob 这两个名字也有些随意。这就像中文中的「甲」和「乙」一样,Alice 和 Bob 就是 A 和 B,因为 Alice 的首字母是 A,Bob 的首字母是 B。


不管这个消息的真实性如何,它与我们今天的话题倒是有些相关。今天我们要讲的,是语义网,也被称为 Web3.0。


什么是语义网?


这个概念是由万维网的发明者蒂姆·伯纳斯-李爵士在1998年提出的,简单说,语义网的目的就是让机器能够自动理解、交换和处理网络上的数据。


伯纳斯-李爵士在他1999年出版的著作《编织万维网》中这样描述他对语义网的憧憬。他说:


我有个梦想,万维网能够分析它上面的所有数据——不管是内容也好,链接也好,还是人和机器之间的任何交道也好。语义网将使这一梦想成真。等它涌现出来的那一天,我们日常的交易、治理乃至生活的方方面面,都将交给可以互相交谈的机器去打理。人们鼓吹了许许多多年的『智能代理』终于可以实现了。


伯纳斯-李爵士相信,语义网会是下一代的互联网,并给它命名为 Web3.0。


为了更好地理解语义网,我们还需要理解一个概念,就是「元数据」。什么是元数据?元数据的英文是 metadata,它的定义就是「关于其他数据的数据」。举个例子,很早以前我们去图书馆查书,那个时候还没有计算机。你会看到一个大柜子,上面有很多小抽屉。拉开一个小抽屉,里面就会有很多卡片,每一张卡片上都是关于一本书的信息,比如说,这本书的作者、书名、简介,等等。这张卡片就是关于一本书的元数据。


具体到语义网上,元数据是如何实现的呢?做法其实也很简单,就是在内容当中加入一些规定的标记符;这些标记符跟 html 的标记符相类似,元数据就包含在这些标记符和它们的属性中。


听起来很简单吧?所以很多人相信,语义网从技术上来讲没有什么难点,因为已有的技术已经足以支持语义网的发展,剩下的工作就是标准化的事情。


但事实上,语义网的发展并不顺利。到2013年,全球共有400万个网站包含语义网的一些标记符。400万听起来很大,但当时全球网站的数量已经逼近了10亿,换句话说,只有大概4‰ 的网站使用了语义网的标记符。伯纳斯—李爵士在更早一些时候就察觉到了,语义网的进展并非他所期待的那样顺利。他在2006年曾表示,「这一简单的想法到今天离实现还差得很远。」


今天我们回过头来看语义网的发展,做一些马后炮式的讨论。我认为,在语义网的实现路径上,人们想得太简单了,认为在原本的万维网技术上进行完善就好,剩下的只是标准化和定义的工作。


之所以会这么想,是由于万维网技术——特别是 html ——的成功。html 本身就是一种标记语言,而且是人写给机器看的语言,同时 html 标记本身也是一种元数据,是告诉浏览器关于内容类型和呈现格式的元数据。,因为 html 的成功,人们自然就设想,如果在html 的基础上进行扩展,是否就能够让机器理解更多的?


但实际上,用户在让机器理解内容这件事情上兴趣缺缺。极少有用户会花费额外的时间精力为自己的网站添加元数据,就只是为了让其他的机器能够读懂自己的网站内容。从用户角度来说,这件事情看不到什么回报,自然就没有动力去做。


况且,元数据是关于其他数据的数据,这本身就意味着元数据只是其他数据的一个摘要,所能包含的信息其实是非常少的。如果我们真想完整地描述一个数据,那么最好的办法就是使用这个数据本身,而不是什么元数据。


再者,由于使用元数据的网站占比很小,根据网络效应的基本定理,这些网站的价值是非常小的。比如说,如果使用元数据的网站在所有网站中占4‰ 的话,那么这些网站的价值和所有网站的价值相比,就只有百万分之十几。所以,机器也好,人也好,如果想快速获取甚至是理解网站上的内容,就必须发展其他的技术,如人工智能技术。


在过去几年当中,用人工智能来理解网站内容的技术取得了很多进展,比如说,Facebook 用人工智能技术来识别和标记照片中的人物。


所以,在语义网的实现路径上,我们并不能预测,什么样的技术会带来突破,什么样的技术会成为主导。


当然,说人们对语义网的设想太简单也有些不公平。语义的背后,涉及到认知科学,涉及到有关「本体」的哲学思考。这些都是很复杂的话题,也不是我们能讨论清楚的。


不过我想强调的是,技术的发展往往出人意料。我们以为 Web2.0 是在 Web1.0 的基础上发展起来的,那么 Web3.0 似乎也可以沿着这条路径发展下去。但事实很可能是,Web3.0 是一个完全不同于 Web2.0 的事物。


而且,我们也并不能阻挡技术的发展。我们以为,机器是在按照我们的指令行事,机器只能学习我们教给他们的东西,我们可以在可能的路径上设置安全岗哨。但技术往往会另辟蹊径,从我们意想不到的地方走过去。


顺带说一段故事,就是硅谷钢铁侠埃隆·马斯克和 Facebook 的小扎童鞋之间的互怼。


埃隆·马斯克一直对人工智能保持高度警惕。他曾经试图阻止人类发展人工智能技术,但后来意识到,这是不可阻挡的,所以他转而去发展人工智能技术,因为他相信,只有人工智能才能应对人工智能可能带来的危险。而小扎同学呢,对马斯克的警告一直都不以为然。他认为马斯克的言行比较危言耸听,比较任性。


我们这里不去争论马斯克和小扎谁对谁错。也许马斯克有些危言耸听,但也许小扎童鞋,包括我们自己,对「人工智能」的了解都像马斯克说的,「知之甚少」。正如马斯克所说,「人们只有在看到机器走上大街屠杀人类时,才会作出反应。」


好,这就是今天的全部内容。谢谢收听!


评论

    还没有评论,快来发表第一个评论!

打开喜马拉雅,发表评论