OpenAI与苹果的小模型大战：技术创新与开源精神的较量

00:00

03:15

近期，苹果和OpenAI分别推出了强势的小模型DCLM和GPT-4o mini。这两大模型的推出，无疑将引发AI领域的新一轮竞争。究竟谁能在这场“小模型”之战中脱颖而出，成为行业的新领军者呢？先出场的是OpenAI的GPT-4o mini小模型。

据OpenAI官方宣布，GPT-4o Mini的输入价格仅为每百万Tokens 15美分，输出价格为每百万Tokens 60美分，相比之前的GPT-3.5 Turbo，价格降低了60%以上！这一价格的大幅下降，无疑将使得AI技术的应用更加广泛，为开发者提供了更多的可能性。OpenAI的山姆·奥特曼在推特上表示：“通往智能的成本，便宜到不值得计量！”

在性能方面，GPT-4o Mini支持128K上下文输入以及16K输出，得分显著超过了GPT-3.5-Turbo、Claude-3-Haiku和Gemini-1.5-Flash。

紧接着出场的苹果公司的DCLM-7B模型，则以全开源的姿态，引领了小模型的新纪元。

Vaishaal Shankar，苹果机器学习团队的一员，将DCLM模型描述为“真正开源的最佳模型”。开源范围不仅包括了模型权重，还包括了训练代码和预训练数据集，这在业界是极为罕见的。苹果的这一开源举措得到了广泛的好评。与大部分科技巨头相比，苹果的大方开源不仅提供了一个强大的研究工具，更重要的是，它为开源社区的发展注入了新的活力。Vaishaal Shankar表示后续将继续开源模型中间检查点和优化器状态，这无疑将进一步推动AI研究的深入发展。

在性能上，DCLM模型在MMLU基准上的5-shot准确率达到了64%，与Llama-3-8B的66%相媲美，而所需的计算量仅为Llama-3-8的六分之一。这一成就不仅展示了苹果在小模型领域的技术实力，更展示了高质量数据集在提升模型性能中的关键作用。在这场小模型之战中，OpenAI和苹果各展所长。OpenAI的GPT-4o Mini以其高性能和低成本，为开发者提供了一个经济高效的AI解决方案，而苹果的DCLM-7B模型则以全开源的姿态，向整个AI社区展示了如何通过设计高质量数据集来提升模型性能的典范。这场竞赛不仅是技术的较量，更是对未来AI发展方向的一次探索。随着更多的研究和开发聚焦于小模型，我们有理由相信，小模型将在AI技术的未来发展中扮演越来越重要的角色。无论是OpenAI的性价比战略，还是苹果的开源精神，都将对AI技术的发展产生深远的影响。

以上内容来自专辑

主播信息

喜耳听世界

关注世界大事的打工人

876

加关注

还没有评论，快来发表第一个评论！

OpenAI与苹果的小模型大战：技术创新与开源精神的较量

大眼观世界 | 欧美一手商业科技资讯解读

喜耳听世界

手握开源模型、与OpenAI互撕，马斯克AI之路怎么走

手握开源模型、与OpenAI互撕，马斯克AI之路怎么走

重磅爆料！苹果与OpenAI达成合作

ChatGPT入驻iPhone？苹果被曝接近与OpenAI达成协议

OpenAi禁用我国倒逼国内AI大模型