3月6日 新鲜出炉的Claude 3,号称最强大模型!王煜全说它强在…

3月6日 新鲜出炉的Claude 3,号称最强大模型!王煜全说它强在…

00:00
07:03

【王煜全 要闻评论】粉丝群已经开通


欢迎加入前哨粉丝群,在这里你可以和科技投资人、创业者、各行业专业人士互动沟通,分享心得体会,也可以第一时间了解到前哨相关活动动态,结交志同道合的小伙伴。


入群方式:
微信扫码下方二维码即可入群


如果您想洽谈合作,请添加创新地图的微信:innovationmap ,并附上简介。


要闻背景简述


3月4日,OpenAI的竞争对手Anthropic推出了新一代大模型Claude 3。分为Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus三个版本。


其中,能力最强的Opus版本在多项基准测试中得分超过GPT-4。比如,本科级别专业知识(MMLU)、研究生级别专家推理(GPQA)、基础数学(GSM8K)等。


而且,Claude 3可以处理各种视觉格式的文件,包括照片、图表、图形等等,多模态能力基本和GPT-4V相当。


以下是王煜全要闻评论。


今天曝出了一个大新闻,我们一直都觉得OpenAI是人工智能领域里的大神,其他几家很难超越。


但是今天终于有一家公司站出来说我们超越GPT-4了,这家公司叫做Anthropic。其实这家公司的创始人就是从OpenAI出来的,他们做出来的新的模型叫做Claude 3。


有人打的比方很形象,分成中杯(Claude 3 Haiku)、大杯(Claude 3 Sonnet)、超大杯(Claude 3 Opus),其中最高水平的模型(Claude 3 Opus)据说在各项指标上都超越了GPT-4。


所以我看到舆论一片喧哗,很多人就在说GPT-4终于从王座上被打下来了,当然也有人说我们等着GPT-5的反攻。


似乎大家都在看热闹,关心的是两个人在打架,到底谁赢了。但是,这不是你在边上旁观的时候,而是必须要进场了,为什么这么说?


其实原因也很简单,如果你深入细致地去看到底Claude 3比GPT-4强在哪,其实通用的问题解答能力,我看好像一个是95.4(Claude 3),一个是95.3(GPT-4),就是差了0.1个百分点,基本上没有差别。


图片


但是在很多其他领域,尤其是一些专业领域,Claude 3都胜出了。那它为什么胜出?

要注意看细节。比如,它在做全球的经济分析时,和我们一样也没有办法去拿到后台数据,也只能去浏览网页。


但是,它可以从网页的图表上,把一个点的数据逐点地取出来,据说偏差也就是5%的水平,偏差很小了。


那实际上它靠的是什么呢?靠的是读图的另一个工具来做的这件事。也就是说,它有很强的工具调用能力,不只是自己用GPT的认知水平来解决的,而是调用其他工具。


他们自己也详细讲了为什么在很多分析上面能领先。比如一个多模态的分析工具,有很多叫做Sub Agents,叫做次级的智能体,每个次级智能体对一个国家进行综合分析,这个代表中国,那个代表美国,还有代表德国、英国的等等。这些次级智能体专门为一个领域做分析,分析完了以后再汇总,再综合起来。


图片


也就是说,Claude 3之所以能胜出,并不是在绝对力量上,不是像以前一样进一步大力出奇迹了。而是在相对同等参数的水平之上,加了很多的辅助工具,所以胜出了。


而这一点其实我们要小心,它说明现在的人工智能已经不再是我们需要远观的那个所谓的黑科技了,而是我们可以真正实际使用的工具了。


为什么这么说呢?我们看工业革命的历史就能看出来,当年瓦特发明了蒸汽机以后,瓦特公司有一个著名的工程师叫默多克,他也做了贡献。


蒸汽机以前是用蒸汽推动活塞运动,而活塞只能做往复运动。但往复运动其实做不了什么事,因为推出去又回来了。


而默多克发明了一个叫曲轴连杆的装置,使得往复运动变成循环运动,就能带动车轮了。一旦能带动车轮,那火车轮船等很多应用就起来了。


所以简单说,蒸汽机本身当然是一个了不起的发明,但是蒸汽机要应用化,就是一个核心技术要能够应用化,需要很多配套的辅助技术的支持,才能使得一个应用被完整地实现。

GPT-4也在往应用化上努力,他的思路就是GPT store,它有各种的GPT,可以让你来调用。但是毕竟还是在外部的,也就是说我提供的就是“蒸汽机”,你需要“曲轴连杆”的话要单配。


现在Claude 3把“曲轴连杆”,把其他的配套技术集成到里面来了,相当于我卖的就是一个相对完整的一个工具集了。所以,Claude 3的进步并不是核心技术的进步,而是配套技术的进步。


图片


配套技术越进步就意味着离应用越近了,而我们也知道人工智能和以前历次的工业革命是一样的规律。什么规律呢?就是当技术进步出现以后,真正最大的受益者是那个应用的提供者。


每一轮技术革命就相当于是造出来坦克一样,真正地能够使技术革命效率最大化,需要有能够打出闪电战来的人。


也就是说,科技革命其实是需要在科技前沿的模式创新,就是用它去解决实际问题。


Claude 3就重点强调很多实际问题的解决,他举了很多比较好评价的指标,比如说考试水平等等。


那么,我们创业者用Claude 3这样的工具,或者用GPT-4也这样工具能做到的是什么呢?就是更多的应用。


如果我们找到现实生活当中的各种问题,用这样的齐全工具集来支撑的人工智能系统来解决问题,我们就是那个打出闪电战来的人。


现在有开源、闭源这两类大模型公司,Anthropic还是闭源的公司。但是大模型相对来说是开源的,因为就是论文,而且数据又是互联网全网数据,相对来说有一定开源性。那就意味着虽然是闭源,但是大家的差距不会那么大。


你看我们这之前一直在惊呼GPT-4真的了不起,好像GPT-4一下就和大家拉开距离了。


现在看起来真正拉开距离的原因,只不过就是他们自己用了全网数据做训练,其他这些开源数据集没有投那么多钱,没有用全网数据训练。那Claude 3也用了全网数据训练,再加上一堆辅助工具,就超越了GPT-4了。


而且它用的数据更新。我今天就上网试了一下Claude 3,就问了一个问题,你能不能给我做很多的实时分析?


它说我还做不到,我收集的数据是截至2023年8月份的。注意,这就要比GPT-4收集的数据要更新。


所以,我们现在就懂这个规律了,就是其实人工智能领域还是相对开源的,大家的差距不会拉开那么大,尤其是你一旦有一个什么新的突破,我会迅速效仿。


我们把这叫做群体加速的创新,就是你的创新会被我借鉴,我的创新会被你借鉴。那整体上来讲,创新就会呈现一个加速的势态。


图片


而GPT-4一定也会响应,可能未必叫GPT-5,但是一定也会把这些辅助工具整合进来,使得人工智能工具越来越好用。


那就剩一个问题了,就是你能不能针对人工智能这个坦克打出你的闪电战。当然要打出闪电战,核心是提问题。找到问题比解题更重要,因为人工智能可以解。


如果我们找到了一个全社会都在关注都想解决的问题,然后人工智能帮助提供了解决方法,可能你就是那个伟大的创业者,可能你就会缔造下一个BAT。


所以注意,这时候千万不要看热闹,千万不要旁观,而是要自己亲自下场了。


以上是今天的内容,更多详细的产业分析和底层逻辑,我会在科技特训营里分享。欢迎关注全球风口微信号,报名加入!


王煜全要闻评论,我们明天见!


图片

回放地址


长按扫描二维码加入科技特训营,可观看所有直播和回放。


图片

以上内容来自专辑
用户评论
  • 笑笑_dxt

    学习了,谢谢老师分享