AI+产业10 | 我们做大模型不是为了搞军备竞赛【小米王斌】

AI+产业10 | 我们做大模型不是为了搞军备竞赛【小米王斌】

00:00
06:17

本期课题 

小米王斌:我们做大模型不是为了搞军备竞赛

8月,小米科技创始人雷军在2023年度演讲中宣布小米将“全面拥抱大模型”,接下来小米将面临哪些机会和挑战呢?

对此,小米集团AI实验室主任,自然语言处理首席科学家王斌分享了小米在大模型领域的目标和策略。



本期嘉宾 

小米集团AI实验室主任,自然语言处理首席科学家王斌


小米做大模型不是军备竞赛

王斌:我觉得就是小米在做这种投入的时候其实都想的比较清楚的,就是我们在去做的时候其实有几个方面的目的。就是首先你要看小米的定位,小米是一个应用场景非常多的一个公司。那么在这些场景里面怎么去通过这个新技术,一个是提高产品体验,一个是提高我们公司内部的运营效率,其实都有很大的帮助。所以小米是一个需求非常旺盛的一个公司。这是第一点,这个我们可能跟有一些做大模型的公司的定位不太一样,他们做完是给别人用,对吧?所以他自己内部没有过多的驱动,我们确实是内部的需求非常强,这是一个。


第二个就是说小米它就是因为有场景的驱动,所以我们在做大模型的时候就会去想场景跟这个的结合,而不是一开始就是我要去比赛,我要去做一个OpenAI,我要去做一个世界上最聪明的大模型。不是这样,就是说我们一开始的时候就是说这个东西非常有用,然后这跟我们公司怎么去结合,然后怎么去推动?所以我们确实一开始的时候有这方面的考虑。


那还有一点就是因为小米其实是技术立业,在我们公司内部就是三条铁律。第一个就是技术,所以在这个情况下,就是每当来新技术的时候,小米其实都是非常敏感的,你至少要跟上再想办法超过,所以你跟都不跟,这个肯定是有问题的。所以对于我们这个小米这个技术人员来说,这肯定是要去探索的。然后就是基于这两点,一个是我们有大量的需求驱动,另外一个就是我们对技术的向往,对技术的一个探索结合,使得这是我们的一个出发点。


所以我们在做出发点的时候其实很清楚,我们做大模型就不是搞军备竞赛,因为对于一个公司,特别是我们有大量需求的这个公司来说,我们在做任何事情都是还是有一定的目标的。不是说我先杀一个那个世界的第一,然后再去把它当成一个大的业务去对外输出,其实这不是我们做大模型的一个出发点。


所以在这种情况下我们想的是一个平衡的道路,就是考虑到这个成本和产出的这个收益的一个平衡,就是我们是当一个很务实的东西来做,所以就是说在这个方面和很多直接做大模型的那种公司有一些区别。所以我们的路线也是相对比较清楚的,我们一边在探索,一边我们又结合小米的一个场景,小米产品无外乎我们设备比较多,我们的场景比较多,那么在去做的时候,我们一开始就相信这个不是说一个通用的大模型可以cover所有的东西,所以在这个过程中可能会有这个若干小模型,可能有这个有些是跑在云端,有些就是跑在本地,怎么去结合?所以我们一开始想的就是这样一个愿景,所以我们在去做的时候就是按照这种思路去不断的去进化,不断的去推动的,就是每一步都有相对比较清晰的路标。

小米大模型的挑战

新小知:那小米作为国内相对成熟的大公司,入局大模型赛道后会面临哪些挑战呢?

王斌:第一个就是说,我们原来虽然说的是一个对话大模型,它是一个专用的大模型,现在的那个去年开始出现的大模型其实是一个通用的,就是说它跟原来的大模型的这种机理还是做了一些变化,原理上不完全一样,然后首先我们肯定要从原来的这种大模型的思路,像这种大模型的思路转变。另外就是说确实一些技术的原理,一些系统性的工作


因为你也知道现在大模型的这个出现其实是一个综合的结果,可能网上说过很多,我们有深刻的体会,它是一个既有算法又有工程,还有产品,还有设计,反正就是说它是一个最后综合出来的一个东西,就是说不完全只是靠算法就可以去达到最后的这个水平。所以在这个过程中,其实是我们也调集了各方面的团队,有做数据的,对数据非常有经验的。因为数据本身并不是说你到网上去爬一些数据,收集一些数据就行了,它有很多数据,处理数据这个相关的一些工作,这里面这个对最后的结果影响还是非常大的。


所以就是说数据、算法还有工程,包括这个你怎么把它跑起?而且网上可能是有一些开源的,但是就是都会有各种问题,然后另外就是说在跑的过程中可能就是很慢,你要想办法去提效,所以这个都需要各方面的人去综合的看,所以它是一个综合的系统工程,不是简单的一个算法就可以搞定的。那所以在这个过程中肯定是有一些挑战,第一个把这些人找到,然后又组合成这个紧密的团队,然后能够这个大家分工明确,能够共同为一个目标努力。所以这个确实是有些挑战。从团队的真正的这个各方面的人的这个储备和最后能够在一起工作,其实也经历了一定的过程。当然在真正的预训练的过程中还有很多挑战,又是各种bug,各种可能性存在。


本期观点总结

小米在大模型研发策略上更注重实际需求,以技术驱动为基础,平衡成本和产出。但同时也面临着一系列的挑战,包括技术思路转变、综合系统工程、数据处理和效率提升等问题。

互动

听完这节课,你觉得小米在大模型领域有哪些独特的优势?欢迎大家留言告诉我。

我是能和你聊天、但不智障的机器人新小知。我们下期见。

以上内容来自专辑
用户评论

    还没有评论,快来发表第一个评论!