OpenAI与苹果的小模型大战:技术创新与开源精神的较量

OpenAI与苹果的小模型大战:技术创新与开源精神的较量

00:00
03:15

近期,苹果和OpenAI分别推出了强势的小模型DCLM和GPT-4o mini。这两大模型的推出,无疑将引发AI领域的新一轮竞争。究竟谁能在这场“小模型”之战中脱颖而出,成为行业的新领军者呢?先出场的是OpenAI的GPT-4o mini小模型。

据OpenAI官方宣布,GPT-4o Mini的输入价格仅为每百万Tokens 15美分,输出价格为每百万Tokens 60美分,相比之前的GPT-3.5 Turbo,价格降低了60%以上!这一价格的大幅下降,无疑将使得AI技术的应用更加广泛,为开发者提供了更多的可能性。OpenAI的山姆·奥特曼在推特上表示:“通往智能的成本,便宜到不值得计量!”

在性能方面,GPT-4o Mini支持128K上下文输入以及16K输出,得分显著超过了GPT-3.5-Turbo、Claude-3-Haiku和Gemini-1.5-Flash。

紧接着出场的苹果公司的DCLM-7B模型,则以全开源的姿态,引领了小模型的新纪元。

Vaishaal Shankar,苹果机器学习团队的一员,将DCLM模型描述为“真正开源的最佳模型”。开源范围不仅包括了模型权重,还包括了训练代码和预训练数据集,这在业界是极为罕见的。苹果的这一开源举措得到了广泛的好评。与大部分科技巨头相比,苹果的大方开源不仅提供了一个强大的研究工具,更重要的是,它为开源社区的发展注入了新的活力。Vaishaal Shankar表示后续将继续开源模型中间检查点和优化器状态,这无疑将进一步推动AI研究的深入发展。

在性能上,DCLM模型在MMLU基准上的5-shot准确率达到了64%,与Llama-3-8B的66%相媲美,而所需的计算量仅为Llama-3-8的六分之一。这一成就不仅展示了苹果在小模型领域的技术实力,更展示了高质量数据集在提升模型性能中的关键作用。在这场小模型之战中,OpenAI和苹果各展所长。OpenAI的GPT-4o Mini以其高性能和低成本,为开发者提供了一个经济高效的AI解决方案,而苹果的DCLM-7B模型则以全开源的姿态,向整个AI社区展示了如何通过设计高质量数据集来提升模型性能的典范。这场竞赛不仅是技术的较量,更是对未来AI发展方向的一次探索。随着更多的研究和开发聚焦于小模型,我们有理由相信,小模型将在AI技术的未来发展中扮演越来越重要的角色。无论是OpenAI的性价比战略,还是苹果的开源精神,都将对AI技术的发展产生深远的影响。



以上内容来自专辑
用户评论

    还没有评论,快来发表第一个评论!