▢胡欣红
6月24日,在极客公园最新发布的高考新课标Ⅰ卷大模型评测报告中,GPT-4o以562分排名文科总分第一。国内产品中,字节跳动旗下的豆包拔得头筹,成绩是542.5分。本次大模型高考评测与河南省考卷完全相同,河南高考录取分数线显示,文科本科一批录取分数线为521分,豆包等三款国产AI成功冲上一本线。
人工智能参加高考,其实已经不是什么新鲜事儿。早在2017年,一款名为“AI-MATHS”的高考机器人,就在全封闭环境中、有监考老师和公证员的情况下,和全国文科高考生同场竞技。这位特殊“考生”挑战了北京卷文科数学和全国二卷文科数学,得分为105分和100分,虽然离110分的目标还有差距,但已经碾压了许多患有“数学恐惧症”的考生。
时隔7年,包括GPT-4o、豆包、文心一言4.0、百小应等在内的近十款大模型再度一起同台竞技,三款国产AI成功一举冲上一本线,再度引发舆论热议。
AI参加高考,并不是为了“好玩”。很多经历过高考“洗礼”的过来人,都不无感慨地表示高三是一生中最博学的时候,甚至达到了自己智力水平的巅峰。虽然有些调侃和夸大的色彩,但高考确实在一定程度上“检验”了个体的综合素养。既然名为“人工智能”,能否配得上这个名称,参加高考无疑成了最具说服力的方式之一。
于是,随着人工智能的突破性进展,在围棋、自动驾驶等领域一展身手后,便盯上了挑战高考这个“新赛道”,意在通过高考对学习和知识运用能力检验,一较高下。不出意外,GPT-4o凭借强劲的实力夺得魁首,而国产AI豆包的表现同样可圈可点,不仅超过文科一本线20分,而且还取得历史、化学两项单科第一。
值得一提的是,豆包的作文在匿名阅卷中获得阅卷老师的好评:文章中显出的对就业结构、伦理方面的担心,展现出豆包已经具有不错的思想深度和思辨能力。在立住“问题”后,豆包随即用反问句自然过渡,引出三个排比段提出解决问题的方法——保持“问题意识”。其中用发展的眼光分析问题,结合现实生活揭示问题产生的根源和危害的部分颇为亮点,并且整体上“结构严谨,层层推进,语句流畅,认识全面”。
豆包技术能力之所以明显领先于国内其他大模型,其实并不意外。根据智源研究院 FlagEval 大模型评测平台6月最新榜单,豆包大模型在主观评测和客观评测的综合成绩均排名前二,知识运用和数学能力单项得分排名客观评测第一、主观评测前三。
科学技术是第一生产力。随着数字经济时代的到来,基于人工智能、5G技术、物联网等领域的科技创新,已成为提升国家综合国力和核心竞争力的关键。我们必须看到,技术进步不是一场百米冲刺,而是漫长的长跑。ChatGPT的诞生,就是世界顶尖科学家经年累月研发的结果。十年磨一剑,才有了一朝横空出世的“惊艳”。
生成式对话产品的出现,意味着人类对自身的突破,也为未来科技发展破了题。当下,生成式AI赛道已成未来人工智能化发展的方向,如同多年前的AlphaGo,ChatGPT已经成为人工智能发展史上的一个符号,从这个意义上说,它不可被复制,只能被超越。
科技是国家强盛之基,创新是民族进步之魂。正是基于对科技的高度重视,一年前中共中央、国务院发布了《党和国家机构改革方案》,把科技作为重要内容,备受外界瞩目。与时俱进,才能领先一步。此举体现了中央对科技发展战略性、方向性、全局性重大问题的高度重视,由此释放出来的制度优势、政策红利,也必将极大促进科技领域的创新创造。期待以豆包等为代表的国产AI,能借助这股东风取得更大的突破,让世人“刮目相看”。
还没有评论,快来发表第一个评论!