百川智能发布Baichuan 2开源大模型

百川智能发布Baichuan 2开源大模型

00:00
01:03

9月6日,百川智能召开大模型发布会,百川智能宣布正式开源微调后的Baichuan 2-7B、Baichuan 2-13B、Baichuan 2-13B-Chat与其4bit量化版本,并且均为免费可商用。

百川智能此次还开源了模型训练的Check Point,并宣布将发布Baichuan 2技术报告,详细介绍Baichuan 2的训练细节,帮助大模型学术机构、开发者和企业用户更深入地了解其训练过程。

据介绍,Baichuan 2-7B-Base 和 Baichuan 2-13B-Base,均基于2.6万亿高质量多语言数据进行训练,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。其中,Baichuan 2-13B-Base相比上一代13B模型,数学能力提升49%,代码能力提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。

以上内容来自专辑
用户评论

    还没有评论,快来发表第一个评论!