1月17日 李飞飞、吴恩达两位AI大佬聊天,却伤了激光雷达!

1月17日 李飞飞、吴恩达两位AI大佬聊天,却伤了激光雷达!

00:00
04:53

【王煜全 要闻评论】粉丝群已经开通


欢迎加入前哨粉丝群,在这里你可以和科技投资人、创业者、各行业专业人士互动沟通,分享心得体会,也可以第一时间了解到前哨相关活动动态,结交志同道合的小伙伴。


入群方式:
微信扫码下方二维码即可入群


如果您想洽谈合作,请添加创新地图的微信:innovationmap ,并附上简介。

你好,我是王煜全,这里是王煜全要闻评论。


最近,李飞飞和吴恩达在CES做了一场对谈,引发了不少讨论。


他们参加的是1月12号CES的小组讨论,具体内容就是聊聊他们对人工智能的看法。


这两位都是人工智能领域的权威学者。李飞飞是斯坦福大学以人为本AI研究所联合主任、谷歌云前人工智能首席科学家,被誉为“人工智能教母”;吴恩达是Google Brain的创始人、斯坦福大学兼职教授。


在他们讨论的话题中,大家比较关注的是AI会不会替代人类工作。李飞飞认为需要分清楚“替代工作”和“替代任务”,因为每一项人类工作,实际上都是多个任务的集合。


比如,一个护士在8小时的工作中,可能要完成数百个任务。她认为AI Agents可以在很多“任务”中给人类提供帮助,但是,是否能够替代由复杂任务结合而成的“工作”,需要谨慎考虑。


吴恩达也认为用人工智能来完成“任务”很重要。比如,经常有企业家问他如何用AI Agents。他建议仔细思考员工在做哪些任务,然后拆分出来哪些任务是可以用人工智能来完成,再考虑这样做的回报率是多少。


实际上,只要谈到人工智能的未来,大家关注的话题都是AI替代人类,因为这让人既兴奋又不安,也就有了兴趣。


不过,李飞飞和吴恩达的这场对谈中还有另外一个话题,虽然看起来不起眼,但却会造成不小的产业影响。


吴恩达说,他看到了从“大语言模型”向“大视觉模型”的转变。不仅仅是生成图像,还有对图像进行分析,让计算机更好地理解图像的含义。


那么,这会产生什么样的产业影响呢?


AI视觉的最典型应用之一就是自动驾驶。在视觉大模型的加持下,自动驾驶的视觉方案将会进一步加快发展速度,相比之下,受伤的自然就是激光雷达了。


去年9月份,OpenAI发布了GPT-4V,不仅能够看懂图片,还能解读比赛视频,扮演电竞比赛的解说员。也就是说,GPT对图像和视频中的各种事物有了很强的理解能力。


之后,上海AI Lab、华东师大等机构的团队做了一项研究,让GPT-4V看不同驾驶场景的图像和视频。他们认为,GPT-4V在情景理解、意图识别和驾驶决策等方面,都表现出了超越现有自动驾驶系统的潜力。


图片


而且,不只是识别数据,大模型还能生成自动驾驶数据。比如,一家来自英国的自动驾驶公司Wayve就做出了尝试,他们开发了一个名叫GAIA-1的生成式AI模型,人们输入视频和文本,AI就会根据需求创建逼真的驾驶视频。


GAIA-1可以学习和理解有关驾驶的很多概念,包括汽车、行人、道路布局、交通灯、建筑物等等,能够生成很多复杂路况,对走视觉路线的自动驾驶系统非常有帮助。


值得一提的是,来自UC伯克利和约翰斯·霍普金斯大学的研究人员,提出了一种全新的建模方法,可以在不使用任何语言数据的情况下,训练大视觉模型,也就是Large Vision Model。


简单来说,就是大视觉模型只需看图训练,就能理解和处理复杂的视觉信息,不用依赖语言数据。


也就是说,大视觉模型的进程才刚刚开始,它有巨大的潜能尚待挖掘,这对自动驾驶视觉方案是个利好。


在这里需要澄清一下,我们之前更倾向于自动驾驶的激光雷达方案,因为硬件的发展遵循摩尔定律,给定一定时间,昂贵的硬件会变得便宜,会被广泛运用,但纯视觉方案的进步要靠软件,软件的性能提升是阶梯式的,高度取决于现在是否有新的技术突破,相对不可预期。


但是,基于Transformer架构的大模型展现出了前所未有的理解和生成能力,也就出现了人工智能大爆发,这在科技发展史上都属于非常罕见的事件。这也助力了纯视觉方案能力的迅速提升。


假设没有人工智能爆发,那么激光雷达就很可能胜出。但现在情况完全不同了,吴恩达提到的大语言模型转向大视觉模型,实际上相当于宣告了激光雷达的衰落。


有了强大的视觉模型,纯视觉方案会成为自动驾驶的主力,激光雷达很可能成为自动驾驶系统的冗余部件,也就是视觉方案出现问题的时候,作为一个备选安全部件。


这就意味着,激光雷达“选装”将成为主流,客户可以根据自己的喜好来选择是否需要激光雷达,就像是否需要备胎一样。


前段时间,还有车厂在宣传自己首发192线激光雷达,CES上也有不少激光雷达公司,有的说开发了512线激光雷达,有的说最远探测距离为300m。


这些确实是技术进步,但是,当激光雷达成为“备胎”的时候,就不一定追求顶级性能了,说白了就是够用就行。也就是说,未来几年激光雷达也会开始卷价格了。


不过,自动驾驶视觉模型的发展也带来一个重要的启示,人工智能大爆发将会带来翻天覆地的转变,很多旧思维、旧方法都会失效,新思维和新方法正在建立。


图片


我们已经初步构建了人工智能时代看科技、看产业、看企业的独特方法论和理论架构,我在科技特训营中做过多次讲解。欢迎感兴趣的朋友扫描课程海报中的二维码,报名听课。


以上是今天的内容,更多详细的产业分析和底层逻辑,我会在科技特训营里分享。欢迎关注全球风口微信号,报名加入!


王煜全要闻评论,我们明天见!


图片

回放地址

长按扫描二维码加入科技特训营,可观看所有直播和回放。

图片



以上内容来自专辑
用户评论
  • VicZhang871203

    那你到底能看清短期未来吗?我记得你之前一直讲激光雷达是未来。试问根据现有资讯做判断,你前沿在哪里呢?

  • 莫尔强

    语言和画面,是ai皇冠上唯二的两颗明珠。这件事,恐怕再过一百年也不会改变。