7月31日 Meta果然厉害,最强开源大模型震撼发布!扎克伯格这次在想什么?

7月31日 Meta果然厉害,最强开源大模型震撼发布!扎克伯格这次在想什么?

00:00
05:06

【王煜全 要闻评论】粉丝群已经开通

欢迎加入前哨粉丝群,在这里你可以和科技投资人、创业者、各行业专业人士互动沟通,分享心得体会,也可以第一时间了解到前哨相关活动动态,结交志同道合的小伙伴。


入群方式:
微信扫码下方二维码即可入群


如果您想洽谈合作,请添加创新地图的微信:innovationmap ,并附上简介。


你好,我是王煜全,这里是王煜全要闻评论。


7月24日,Meta发布了迄今为止的最强开源AI模型Llama 3.1。Meta在其官方博客中放出话来:“我们正在迎来一个开源引领的新时代。”

图片


Meta真的能引领这个时代吗?


咱们先看看Llama 3.1的技术参数,这是在超过1.6万个英伟达的H100 GPU和超过15万亿个tokens的数据集上训练出来的,整体的算力成本可能高达数亿美元。Llama 3.1旗舰版拥有惊人的4050亿参数,在多项基准测试中,特别是在推理、数学任务中的表现与OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet相当。


Llama 3.1模型集成了搜索引擎API,能够从互联网检索信息;还可以调用多个工具完成任务,如执行Python代码进行计算和绘图,为开发者构建AI搜索工具等新应用铺平了道路。


虽然Llama 3.1当前还聚焦于文本处理,并未涉足多模态领域,但Meta透露未来将开发能够识别图像、视频并理解和生成语音的Llama模型,也就是说很快开源模型也可能可以具有如GPT-4o一样的多模态能力。


图片


在开源大模型领域,Meta无疑是最重要的领军企业。通过发布开源模型,Meta不仅促成了基于Llama的创新生态,推动了技术创新和模型质量的提升,还帮助公司确立了行业标准,支撑了公司的长远战略规划。


扎克伯格还有更大的愿景,他希望通过开源推动AI技术的普及和均衡发展,加速AI技术在全球范围内的应用,提升人类的生产力、创造力和生活质量,避免权力过度集中于少数公司之手,让更多人共享AI带来的红利。


值得一提的事,扎克伯格认为,美国的强大之本在于去中心化的开放式创新。封闭模式虽然能在短期内保护创新成果,取得领先优势,但长期来看会限制整个生态系统的活力,使初创公司、大学和小企业错失参与创新的机会。他主张建立一个强大的开放生态系统,以强化美国在AI领域的全球领先地位。


另一方面,作为闭源大模型公司的代表,OpenAI的CEO山姆·奥特曼则认为,AI技术的快速发展已经使其成为关键的国家安全问题,美国必须防止被其他国家(尤其是中国和俄罗斯)超越,他呼吁要明确出口管制与外资投资规则。


可见以奥特曼为代表的一部分科技企业家正逐渐从过去的“不问政治”转向积极参与政治讨论。这也将对全球科技创新产生深远影响,我们将在后续的要闻评论中对这一问题进行深入剖析。


确实,面对国际竞争态势,美国政府和国会一直在推进AI大模型的限制政策。如今年5月份众议院通过了《加强海外关键出口国家框架法案》(简称ENFORCE法案),旨在强化对AI模型的出口管制。


图片


但我们认为,开源模型的出口限制恐怕难以真正落地。


例如这次Llama 3.1就可以直接在Meta的官方网站或在Hugging Face上自由下载,传统手段难以对其进行限制。尽管可采取限制IP访问、实名注册等措施,但仍然难以从根本上阻止中国公司获取模型文件。


当然,未来美国政府可以完全禁止大模型的开源。但这种极端手段无疑是杀敌八百、自损一千,长期看,必然会削弱各国顶尖人才的交流,进而阻碍美国自身AI技术的创新。


图片


所以,这次Llama 3.1不仅缩短了开源与闭源的技术差距,还向全球开发者自由开放下载,并为开发者提供了前所未有的灵活性和创新空间。对中国开发者而言无疑是巨大福音,也意味着应用开发者们应该要加速入场了。


为了能充分促进Llama 3.1创新生态的发展,Meta为开发者们提供了详尽的微调指南和工具,同时简化了API调用流程,并且赋予了开发者更多的数据控制权。


因此,开发者可以优化模型结构和调整参数配置,利用自身的数据集对Llama模型进行训练,根据自身的需求和应用场景定制和优化模型,并保证了敏感信息的安全。这种灵活性无疑将激发更多创新潜能,开发者终于有机会站在巨人的肩膀上,加速自己的AI创新之路。


未来Llama的运行成本还将不断降低,开发者不用担心API被封等风险,相比于OpenAI等闭源模型,将更有可能构建一个长期稳定的产业生态,大量的AI应用企业将因此而真正崛起。


此外,需要强调的是,在AI硬件与行动智能爆发的前夜,Llama的小模型可能成为重要助力之一。


这次Meta通过“先大后小”的策略,也就是先构建庞大的知识库,再从中精炼出高效实用的精华版本,得到了Llama 3.1的70B与8B版本,其性能在同量级模型中竞争力很强,可以应对大多数的应用场景。


这预示着开源模型将可能成为AI硬件的基础设施。开发者可以微调Llama 3.1的小模型,并能轻松将其部署于手机、MR头显等移动设备,从而实现个人助理、医生助手等个性化的智能服务,拓展更多AI技术的应用场景。


我们认为,以Llama为代表的开源大模型,不仅可以跟闭源大模型相抗衡,更为中国的AI应用开发者提供了前所未有的创业机会。而且以行动智能为基础的AI服务新浪潮已经开启,并将在未来的两到三年内大爆发。如果你也希望能在这场科技浪潮中有所作为,欢迎加入科技特训营,先人一步、看清未来。


以上就是今天的内容,更多详细的产业分析和底层逻辑,我会在科技特训营里分享,欢迎关注全球风口微信号,报名加入。


王煜全要闻评论,我们明天见。


图片

↓长按图片扫描报名,先人一步,看清未来

图片

以上内容来自专辑
用户评论
  • 在随机中奋进

    科技无国界