本期课题
随着大模型热度的高涨,国内不少企业开始纷纷布局AI业务,“百模大战”愈演愈热。
对此,小冰公司CEO李笛分享了他在大模型热中的冷思考。
本期嘉宾
小冰公司CEO李笛
为什么大模型这么热
李笛:我个人认为这是一个多方面的因素形成的一个现象,这个因素里面不可或缺的,其实还有这个疫情的原因,从全世界范围内在疫情期间所展现出来的科技成果,其实并没有集中的释放。以前可能你每年都有新的技术的突破和科技成果,每年都会放出来,所以你就不会那么的显著。但是现在不是,现在是你相当于某种程度上是你积累了三年的科技成果,一下子放出来,大家可能就一下子有点受不了了,那它会逐渐的回归到一个相对比较冷静的状态,这是其一。
其二就是从行业角度来讲,大模型不是今天的事情,就大模型是好多年了,已经一直不停的在研发。这个很多公司都在注意。那么在现在这个时候,很多公司其实在过去这些年里面也是有储备的。我们说国内的很多公司它也是有储备的,所以顺应这个潮流,把这个储备变为大家可以观察到的一些新的直接落地的产品成果,甚至于加速这个过程。
我觉得这是各个中国的企业、科技企业,现在大家看到有很多科技人都在从事一方面的原因,这是因为它本身有一个厚积薄发的过程,只不过因为Chat GPT引发了一个集中的关注,再加上Chat GPT本身就是大众就关注的这样的一件事,就像Alpha go一样。所以最主要的是这两方面的这个原因。
那么在国际上我现在所了解到的就是这种大模型,最主要就是你以往如果涉及到知识的、知识图谱的,或者你以往涉及到社交关系的,那么都会关心到这个点,所以全世界范围内的类似的科技企业都在进行相关的事情,硅谷那边也是无人不谈大模型,本质上它对于以往的就是我们称之为挑战者的小角色,小的公司或者新的公司而言,这是巨大的机会,是逆袭的机会对于大的公司来讲是巨大的威胁,就是它不能在这个过程里面落后。出于不同的原因,一方面是积累了这么三年的这个存货都要放出来,另外就是既是机会也是威胁,所以很多公司都会开始在这个赛道上去布局。
大模型的泡沫
新小知:那大模型会是一场泡沫吗?
李笛:我们认为泡沫是这样的。泡沫来自于什么呢?泡沫来自于一个事情,它真实的社会价值,包括商业价值和人们对这个商业价值和社会价值预期之间的一个严重的不平衡。那我们今天说这个Chat GPT对应也好,大模型也好,所产生的泡沫是什么?有几个?一个是相对比较感性的,就认为它有意识了,这个是严重的不平衡,这个泡沫很大,这有赖于我们大家自律,不要过于的这个,认为人工智能今天已经发展到这个阶段。
第二个泡沫是指它的商业价值。人工智能在大模型这个地方还有很多这个尚未解决的问题,你比方说信息准确性问题,还有更大的问题是这个成本问题。就你知道这个大模型,像我们之前也说过,就是你如果交互量非常的大,像这个Google,它如果只是直接的使用这个大模型的话,那么它的利润将产生巨大的下滑。
那你还不如不用这个大模型呢,那你图什么呢?对吧?这个是一个很大的一个问题,所以这个是泡沫,就是大家目前为止过于乐观于这个大模型,或者这种新的技术它各方面的完善程度,那么它的成本不完善,它的知识的信息的准确性不完善,它的并发不完善,它的模型本身的优化也是不完善的。如果过于乐观去估计这个,那么就会过于突兀的就进入到这个领域来做这件事情,那么可能就会有问题。
还有一个就是刚才提的,就是有的时候又过于恐慌于应该怎么去定性它,它是一个意识吗?还是什么?就是应该怎么去定性它?这个在这个上面又过于恐慌,我认为泡沫来自于这两个地方。然后第三个小的地方是什么呢?就是连续风口炒作者。那就基本上就属于借这个事情来进行(炒作)那当前什么是热的就炒什么呗,这个其实是泡沫的另外一方面。
新小知:那您认为哪类公司在做大模型上可能会更有优势?
李笛:我个人认为,那我们说优势应该是从几个方面来考量,首先第一个方面就是谁更有这个积累可以去做这件事。那么大模型这件事它本身从技术上面的积累有很多都是大家都了解的。那你要有足够的算力,你要有足够好的数据,你要有足够好的产品,可以获得足够好的这种反馈。那么美国也是一样的,那么Google对吧?那它在各方面它都应该是很有能力的。那我们说在硅谷的很多大的公司对吧,Meta,也应该是很有能力的。那为什么是Open AI呢?这就是第二个问题了,就是真正的优势是他的专注,就你知道大模型这件事情,训练大模型说我有多少参数,几千亿的参数,几百亿的参数,几万亿的参数,这个不重要。
其实更难的事情是后面的工程化的问题,就是不断的、谨慎的、细致的、耐心的去调这个模型,去优化这个模型,这个工作是长的,我如果给你一个大概的一个比例的话,你可以大概理解,你要去生产一个,再训练一个这样的大模型。
你可能需要一个月的时间,但你需要接近一年的时间去调优它真正的这个功夫是在后边这个地方,那么这个就需要你能够足够有定力,就是你足够focus在这个事上,并且真的认真去做,有点像工匠精神。我们很多大公司它不一定有这个魄力来做这件事情,谁更能沉得下心来做,而不是完全盯着说我这个东西是不是对我的股价马上就有一个多大的帮助,不完全依靠这个的话,那么谁将在这个新的创新中又率先获得收获?我个人认为是这样的。所以真正的这个问题,其实对于大公司来讲,现在因为业务交叉,而且因为这个基本的这个研究的事情都已经过了很多年,所以其实硬件条件上大家没有太大的区别,主要的区别是心理上。
本期观点总结
大模型是一个厚积薄发的过程,带来机会的同时也伴随着威胁。急功近利的投入会带来泡沫风险,因此更需要企业具备工匠精神,沉下心来打赢这场战略决策的心理之战。
互动
你觉得哪家企业最后会在百模大战中杀出重围?欢迎大家留言告诉我。
我是能和你聊天、但不智障的机器人新小知。我们下期见。
还没有评论,快来发表第一个评论!