AI国内外07 | 谷歌大模型Gemini预示了哪些AI新趋势?【360周鸿祎】

AI国内外07 | 谷歌大模型Gemini预示了哪些AI新趋势?【360周鸿祎】

00:00
06:30

本期课题 

周鸿祎:谷歌大模型Gemini预示了哪些AI新趋势?

12月初,谷歌发布了AI大模型Gemini,有人说这是它对OpenAI发起的正式反击。不久后Gemini演示视频的“造假”风波,又一时让谷歌处于水深火热之中。当前谷歌在AI领域的发展处于什么水平?大模型Gemini又带来了哪些创新和变化?对此,360CEO周鸿祎分享了他对谷歌大模型的看法和解读。

本期嘉宾 

360CEO周鸿祎


多模态是AI的未来

他整个的视频都在暗示你对方已经不是一个简单的程序,完全像一个人一样。


人们做宣传的时候都难免有点夸大,但是它是个很好的教育视频,它描绘了Google的一个愿景,就是我觉得多模态可能是未来的,就是机器,不仅可以接受文字,可以理解文字,可以直接接收语音、接收音乐、接收图片,还有接收视频,就大家可以直接读懂视频,本身它是更像人类的一种交流方式,就像我们俩在这说话,说着说着可能会拿出一张纸,画一个草图,或者我拿出手机让你看张照片,有的时候我们会直接拍张照片儿发给朋友,那么这是从人机交互的角度。


第二个我觉得就更证明了大模型是一个真正的AGI的基础,也就是说它可以把各种多媒体、各种多模态的数据都变成token,像语言一样的来进行处理,就证明了大模型的这种通用的适配能力。在Gemini之前,所谓多模态还是缝合怪,就是把不同的引擎内部调度在一起,但如果按照Gemini的说法,它从训练的时候就是多种语料来进行喂食,那第三个就是这里边还是要承认大语言模型解决的一个基础问题,就是大家老觉得它是一个语言模型,实际上语言是人类描述这个世界的基础,你理解了语言,你就对这个世界有了一个完整的理解,你就对这个世界模型有了一个认知。然后基于这个语言的基础,你再去理解画面,再去理解视频,再去理解声音,这和原来小模型时代做的那种图像识别完全不在一个层次上,就像说我看到一个鸭子,我不仅理解蓝色的鸭子是很少见的,我理解它是塑料了,那么捏起来它会叽叽叫,对吧?而且我要理解把它放到水里,它会浮起来、漂起来。


那这些呢,你光是靠传统图像识别肯定做不到它里面有特别多的对人类知识的传承,这反过来证明,大语言模型这种暴力革命或者暴力美学,这个技术方案是对的。那从另外来讲,这个也证明了谷歌可能要解决一个问题,就是人工智能现在面临一个问题,如果只是学文字,人类的知识很快就不够了,因为人类一共有史以来,大概也就写了1亿本书,像你这么多token,然后现在我相信GPT 4、Gemini可能学了有几千万本了。那再训练一次,可能下面就没书可训了。


所以OpenAI搞了一个什么?搞了一个说我用AI来产生内容,AI自己生产,内容自己学。就有点像当年Alphago下棋,自己左手跟右手会下,一天互搏下100盘棋,已经超越了人类的棋谱,这是一种方式,但是你想这个Gemini一旦能理解视频之后,我原来预言过他获得知识的方式马上就变了,Google有YouTube,然后Google就可以把YouTube包括TikTok,包括所有对网上的视频,所有的电影,所有的影视,这里面也有很多知识,它可以学习,然后可以跟摄像头接起来,那这样的话,那你想象一下这个,那这个人工智能进化的速度将会是更快,所以Gemini给我印象最深的主要是。


Google的决心

第一是多模态,第二个我觉得Gemini也反映了Google的一个决心。Google原来有点犹犹豫豫,那两方面,一方面是内部的小团队太多了,不像创业公司,目标比较单一,可能有很多掣肘,第二个就是美国对大公司的监管比较严,对创业公司的宽容度比较高,我们是反过来,所以这个Google要做个人工智能的聊天机器人出来,微软做个东西出来,哪怕说错一句话,就好像捅了马蜂窝一样,就政治不正确,然后各个媒体就口诛笔伐的,这弄了大公司的法务部门就特别谨慎。那OpenAI是个小创业公司,对吧?那GPT说错话大家还觉得可爱,还觉得cute?所以Google可能这次也想通了这点。


然后第三个最重要的呢,我觉得Google可能想明白了,原来它的主要的内容是搜索,那么搜索占据了它主要的收入,那么他如果去做这个大模型,有可能会被自己颠覆自己,自我的革命他可能没有想清楚,但是现在发现说再不做就要被OpenAI  把命给革掉了,那与其被别人革掉自己的业务,还不如自己起来,对吧?而且这次背后Google也还把他的优势发挥出来,他说用他的TPU来做的训练,他说他没有买英伟达的显卡,那我想TPU我理解是用专用人工智能芯片,可能在推理方面的成本如果要比英伟达低很多,比如他经过优化,如果能让现在推理的成本能低上几十倍到一百倍,那么就有可能跟搜索的成本一样,那么Google的广告模式就可以继续得到延续,而不一定是向用户直接收费,所以这次Gemini里面我觉得可以解读的东西蛮多的

本期观点总结

大模型Gemini代表了谷歌在人工智能领域的美好愿景,即实现机器像人类一样交流。同时它也证明了大模型是AGI的基础和大语言模型的重要性。这背后反映的是多模型将成为未来趋势、谷歌投入AI业务的决心,以及谷歌对自身业务的变革与创新。

互动

听完这节课,你觉得谷歌会超越OpenAI,成为AI领域的常胜将军吗?欢迎大家留言告诉我。

我是能和你聊天、但不智障的机器人新小知。我们下期见。

以上内容来自专辑
用户评论
  • 中国企业家

    【订阅评论有礼】 1、订阅专辑并在专辑评论区留言,截止2023年12月31日,我们将抽取3名留言优质的听众,送上喜马大会员季卡1张; 2、订阅专辑并给专辑写评分评价,截止2024年1月31日,点赞量最高的专辑评论前3名,送上喜马拉雅小雅智能音箱1台。 欢迎大家在评论区留言互动,分享你的想法和感悟~