AI的真相11 | AI带来的创新走到尽头了吗?【小冰李笛】

AI的真相11 | AI带来的创新走到尽头了吗?【小冰李笛】

00:00
06:58

李笛:未来暴力美学将对大模型失效了?

经过一年爆发式的发展,大家对ChatGPT有了哪些新的看法和感受,未来在AI领域我们又将面临哪些挑战?

对此,小冰公司CEO李笛分享了他关于大模型过去一年的看法和对未来的思考。


李笛:我还记得就今年3月份左右的时候,我们有一些判断,当时有很多人认为大模型随着参数量越大,那么它的新能力会不断涌现。另外大参数的模型一定会碾压小的参数量的模型,所以大家都在往参数规模上面去堆。但我们当时有一个判断就是这个,因为大模型的具体成因在当时尚不明朗,所以大概率很可能是一种混合模型的这种方案其实是更符合的。那你现在看,包括做这个像100B以上的大模型,其实放出来的基本上也都是6B、13B,基本上也都是这个量级的。


第二件事就是大模型有大模型自己解决不了的本质问题,基本上可以确定的事情是像幻觉的问题是不可能得到100%解决的。所以这就意味着在很多很多的地方,它不太可能去代替人类进行比较重要的决策,而更多的可能是以一种辅助者的这种身份出现,能够来降低人们在进行某些决策或者做某些生成的时候的这种成本。但是几个月之前大家不是这么认为的,大家觉得,他完全可以让我去fire掉那些做决策的人,或者真正提供创意,最终端输出的人其实并没有。我觉得更多的其实是大家在从一个感性的一个shock就非常的震惊,其实是逐渐的在走向一个理性评价的这样的一个过程。所以他倒没有什么大跌眼镜,也没有继续这个大开眼界,而是更加的审慎了。


那个时候就有很多人认为,如果我是一个金融机构,那么它是不是可以代替这种初级分析师的工作,或者是像一个分析师助理一样帮我去整理这局?这的确。那个时候做得很好,现在做得更好。但是其他的一些大家当时所设想的很比较异想天开的事情,当时没有发生,现在也没有发生。所以我个人认为这一次的基础突破存在着一个大家认知偏差的问题。实际上对于像OpenAI这种就是,它非常伟大,它坚持了一条所有人都不认为可以的路,但是它成了他花了好几年的时间去做,才得到这个成果。我们大家一看的时候,其实是他成果已经出来的时候,但很可能这个成果所带来的创新基本上就在那一刻已经把这个创新的绝大部分都已经释放完了。那么我们要做的事情实际上是把这种创新落地,而不是持续地开始创新。

新小知:今年下半年,美国多次发布芯片出口限制。在当前芯片受限的情况下,国内的AI发展会受到哪些影响?

李笛:我个人觉得我们应该从两个角度来看,有一个角度是大模型技术是一个非常重要的技术创新,那么在这个技术创新的浪潮里面,怎么去不断地推进科学前沿的边界?那么这个需要非常庞大的算力,那么也需要有一个基本的一个判断,就是很可能不一定能够探索出新的东西,因为它是科学的这个边界的研究。当然它一旦能够探索出新的东西,它会很巨大的价值。


当前的这个技术变化的一个很大的一个特点,就是我们常说什么暴力美学,就是利用一个非常庞大的一个算力方式,来实现一个你可以看到实际结果上的突破,但是你很难说下一个技术迭代是不是同样的原则。我们只能根据过去推未来的话,那其实这个未来就没有那么有意思了。所以并不否认有可能继续使用现有的这种暴力的方法,就继续堆更大的参数,堆更多的多模态的数据,有可能能够产生新能力涌现,但大概率我个人认为其实不太容易产生新能力了。


包括你看硅谷,看国内,也是有很多人其实在探索其他的新的方法,这些方法不一定是以算力为基础的。但是由于现有的技术方法已经证明了它有一定的可落地的这个方向,所以对于算力的要求肯定会比以前要高,但是并不一定就是决定性的。我们还是应该相信,就是科学家在不同的维度上面,在不同的这个领域上面,各自的探索并不完全雷同,比较雷同,反而是说如果我们全都用同样的训练方法去复制,去复现别人已经有的这个成果的话,可能反而没有创新。


这个对算力的要求,包括对人才的要求、资金的储备,心理上面的建设也需要做好。但另外一方面就是基于已有的大模型展现出来的技术的特点如何进行落地。那么这个部分中国其实有中国的优势,我们说中国其实战略纵深非常大。一线城市到十八线城市,我们国家的这个人民普遍受教育水平比其他的十几亿的这个国家受教育水平也高。数字化进程也相对完善。你看这个上一代移动互联网,咱们国家发展是最快的。所以在这个基础之上,其实做基于大模型技术范式这种变革带来的新的落地,其实咱们是有很好的优点的。那么在这个过程里面你可以看到就是说运行这样的技术创新、产品创新其实并不一定需要那么大的算力。你比方说如果我在这个落地的时候使用13B的模型,对吧?那我用单卡100,我可能就可以很好的serving起来了。我如果用这个4B的模型,甚至于像T4这种GPU都可以运行,所以它对算力的要求就没有像刚才这种战略的这种科学前沿的推进不一定是那么高的。在这个过程里面我们可能需要注意,不能像以前这种百团大战就是卷得非常厉害,那么这样的话,现在现有的算力是足够的。

本期观点总结 

当前大家对大模型的态度正在从感性走向理性。经历了大的技术创新之后,AI接下来更重要的是思考如何将创新落地。因为持续的创新更多指向的是科学边界的突破,背后需要庞大的算力,而大规模模型并不一定能持续带来新的能力,因此也需要科学家们在不同领域进行多维度的探索和创新。

互动

听完这节课,你觉得未来我们应该专注于创新落地还是持续创新呢?欢迎大家留言告诉我。

我是能和你聊天、但不智障的机器人新小知。我们下期见。

以上内容来自专辑
用户评论
  • Lisa_晨

    我觉得应该要同时进行吧,