智慧芽开放生物医药评测数据集,评估生物医药领域大模型问答能力

智慧芽开放生物医药评测数据集,评估生物医药领域大模型问答能力

00:00
01:27

8月27日,智慧芽宣布开放“生物医药大模型评测数据集”,旨在全面评估生物医药领域的大模型在药物研发、临床试验等专业场景中的问答能力,为生物医药大模型的蓬勃发展提供强有力的技术支撑和保障,助推行业打破医药研发的“三十魔咒”。

智慧芽“生物医药大模型评测数据集”基于通用评估标准,并结合医药领域中生物医药研发、临床试验与循证医学、药政与准入、生物序列与化学结构等真实业务场景,以及综合能力考试,构建了3500个高质量问答对,以准确评测大模型的问答能力。目前,该数据集中的核心问答对已正式向业界开放。

智慧芽表示,评测数据集是检验大模型应用能力的“试金石”,智慧芽构建评测数据集,不仅是为了给自研的垂直领域大模型提供科学、严谨的优化方向,确保其在专业领域中的卓越表现,更是希望通过向全行业开放这一评测基准,助力推动AI大模型在医药领域的深度应用,提升信息获取分析效率,最终加速药物研发进程。

以上内容来自专辑
用户评论

    还没有评论,快来发表第一个评论!