穿越奇点 | 实现通用智能,人类欠缺什么?业内人士:路径已存在,但还缺三种“资源”

穿越奇点 | 实现通用智能,人类欠缺什么?业内人士:路径已存在,但还缺三种“资源”

00:00
06:13

ChatGPT的热潮还未退去,Sora又惊艳登场。从大语言模型到文生视频大模型,这一轮技术跃迁对AI行业的意义是什么?距离实现AGI奇点,又还存在哪些资源瓶颈?

近日,多位通用人工智能领域的从业者在接受记者采访时表示,聚焦于在AIGC领域,Sora最关键的突破是在较长时间窗口中,保持了生成内容的一致性;这也意味着,接下来这几年就会有某种程度的通用人工智能出现。不过,产业还需要克服来自通用模型架构、高质量数据以及能源三方面资源匮乏的挑战。

Sora带来阶跃式技术提升

是实现通用智能必要过程

将简短的文本描述输入模型,Sora很快就能转化成长达1分钟的高清视频,且视频质量更加真实立体,场景复杂、角色多元,画质卓越、连续稳定。不过,这还远不是人工智能的终点。

在月之暗面联合创始人周昕宇看来,Sora在视频生成领域实现了阶跃式的提升,但这一产品所运用的扩散模型,还不能泛化到AGI全场景的通用的模型架构。

月之暗面创始人杨植麟

据OpenAI透露,Sora是通过学习海量视频,变成了能实现视频生成、扩展的“物理世界模拟器”。而这种“大力出奇迹”的规模法则,对于通用人工智能也存在极大意义。

“Sora让大家看到了,规模效应不只在文字模态上成立,在视频模态上也成立。”周昕宇认为,Sora在较长的时间窗口内保持生成内容的一致性的能力,对于理解和模拟复杂动态场景至关重要,因为它不仅涉及到图像的逼真度,还涉及到动作和场景的连贯性。“通过扩展视频生成模型可以建立通用物理世界模拟器,这是实现通用人工智能的必要过程。”

但也有不少专家认为,在AI大模型发展的路径中,从文本到音视频等多模态是必然的趋势。这意味着在AIGC赛道上,多模态大模型的训练规律并不一定适用于大语言模型。对此,周昕宇谈到,由于建模文字效率低,Sora的扩散模型可能不是一个通用的模型架构。“也就是说,行业可能无法用 Sora 的技术来训练一个GPT-4水准的文字模型。”

不过,“可以确定的是,AI能带来实打实的生产力提升”。月之暗面创始人杨植麟认为,现在用一个软件,其实对应1000个程序员的智能;以后用的应用背后可能对应100万个人的智能,而且每天都在迭代。

通用智能将迎来大发展

在某些领域超过人类

无论何种技术,贴近产业才有未来。不过,通用人工智能要真正在全行业实现产业化,仍然需要关键“原料”的支撑。

周昕宇分析称,实现通用人工智能目前还存在三个主要瓶颈。一是缺少能将文本、图像、视频等不同模态数据,转化为统一形式的通用模型架构。“以视频为例,熵过高的数据虽然可以分别做生成和理解,但通用性和泛化性会受到影响。”

二是高质量的文本数据有限,很快会不满足于训练需求。“音视频数据虽然储量巨大,但整体数据质量不高,同时受模型架构、大小等制约,无法完全有效利用。”周昕宇预测,下一步,AI需要用巨大的算力生成“合成数据”。

三是人类还面临“能源挑战”。周昕宇这样算了一笔账,实现通用人工智能需要大量的算力,仅10万张GPU集群就需要一个大亚湾核电站的发电供应,大约相当于全中国耗电量的千分之二;而且传统机房的设计容量还不到1万张GPU,短期弥补这个差距面临很大困难。

幸运的是, ChatGPT、Sora等产品带给行业的思维冲击,已经证实了一条通往AGI奇点,得到通用智能的可行路径。“人工智能中的‘智能’,本质是通过‘无损压缩’使得数据的信息熵减少,减少信息熵需要能源,通过更大的模型、更多的数据将能源以最高的效率转化为智能;而‘通用性’来源于大量丰富的含有大量规律数据,经过‘无损压缩’得到通用智能,也是目前最可行的技术路线。 ”周昕宇预测,接下来几年就会有某种程度的通用人工智能出现,在一些任务上智能水平超过人类。

更关键的是,AI是实现很多人类畅想的未来技术的基础。“要实现元宇宙,实现AI是先决条件之一。”杨植麟表示,随着AI技术成熟,人的时间分配可能也会产生很多变化。“比如,可能把大量时间花在精神世界里面,进而会演化出一个巨大的虚拟精神空间。”

以上内容来自专辑
用户评论

    还没有评论,快来发表第一个评论!