促进数实融合,推动产业落地!2023人工智能大模型基准测试科创发展大会暨中西部数字经济大会在成都举行

促进数实融合,推动产业落地!2023人工智能大模型基准测试科创发展大会暨中西部数字经济大会在成都举行

00:00
14:30

12月28日,以“大模型·大未来”为主题的“2023人工智能大模型基准测试科创发展大会暨中西部数字经济大会”在成都市高新区成功举办。

大会由成都传媒集团主办,成都商报社承办,红星新闻、红星资本局、四川省大数据发展联盟、四川省人工智能学会协办,驰星创投战略合作。来自中国科学院、清华大学、北京大学、天津大学、澳门大学等的专家学者,中国信通院人工智能研究中心、中国软件评测中心等权威机构,以及80余家人工智能大模型领域的头部企业,齐聚一堂,共同探讨大模型时代下数实融合的新业态、新模式、新路径。

本次大会不仅邀请到多位行业大咖、专家学者分享经验和前沿思考,还取得了三项重大成果:搭建OpenEval平台、成立大模型应用创新协同中心、发布《2023人工智能大模型基准测试白皮书》。

12月28日,“人工智能大模型的产品创新与应用创新”路演活动也成功在成都市同步举办,6家大模型团队参加项目路演活动,并展示了大模型不同的落地场景,揭示了大模型在千行百业中的多元化创新趋势,另有中商青投、新微资本、靖亚资本、点亮伯恩、鼎详资本、伽利略资本等资方也将受邀参加该活动。本次路演为成都企业打通了产业端和资本端沟通合作的路径。

三大成果在会上发布

共同助力大模型向好发展

成都传媒集团董事长,成都传媒产业集团党委书记、董事长母涛在大会开幕致辞中表示,前沿技术需要转化为产品或应用,才能发挥其价值。希望此次大会能成为中国数字经济领域沟通交流的媒介、桥梁和纽带,成为国内大模型领域创新发展的策源地。

“2023人工智能大模型基准测试科创发展大会暨中西部数字经济大会”是大模型行业的盛会,不仅汇聚了头部企业、专家学者和权威机构,还凝聚了行业集体智慧,并形成三大成果。

成果①:OpenEval平台助推中文大模型能力与安全协同发展

在正式举办前,此次大会邀请到中国信息通信研究院人工智能研究中心、中国软件评测中心两大权威研究机构,以及来自各大高校的专家学者组成大模型基准评测专家委员会,对国内大模型进行多元化评测。

其中,大模型基准评测专家委员会的成员包括中国信息通信研究院人工智能研究中心魏凯、中国软件评测中心梁斌、天津大学智能与计算学部熊德意、郑州大学计算机与人工智能学院昝红英、上海交通大学约翰·霍普克罗夫特计算机科学中心林洲汉、香港中文大学数据科学学院王本友、香港科技大学计算机系何俊贤、澳门大学科技学院黄辉。

在对大模型进行评测前,专委会成员专门为大模型评测研制开发了自动测试平台,并取名为“OpenEval”,意为开放评测以及对大模型发展无穷无尽的展望。

作为本次大会的成果,OpenEval平台致力于成为中文大模型评估多维度、全面、开放的评测平台,探索前沿模型评测方法,建立大模型评测标准与协议,建设高质量大模型评测基准数据,综合评估大模型知识、能力、对齐及安全级别,发布详细评测报告,助推中文大模型能力与安全协同发展。

目前,OpenEval平台从四大维度出发,包括知识能力、价值对齐、安全可控和专业领域,每一个维度下又分多个子维度,且收录了若干数据集。

在大会结束后,OpenEval平台将持续运营,并不断地更新评测数据、创新大模型评测方法、组织线上与线下评测活动,第三方评测机构和企业等均可通过该平台申请和组织新型评测任务。

成果②:《2023人工智能大模型基准测试白皮书》为行业构建全景视图

基于前述的评测结果,OpenEval平台、中国软件评测中心、天津大学自然语言处理实验室、郑州大学自然语言处理实验室、红星新闻和长三角数据要素流通服务平台在此次大会上联合发布《2023人工智能大模型基准测试白皮书》。

天津大学智能与计算学部教授、天津大学“语言智能与技术”中外联合研究中心主任熊德意告诉红星资本局,《白皮书》的发布标志着对国内开源和闭源大模型首次大范围综合评测圆满完成。

《白皮书》指出,在过去的一年中,中文大模型在学科知识和数学推理等方面的能力有了显著地提升,这展现了大模型在学科知识掌握、处理复杂问题和推理方面的潜力。

“基于前述评测结果,《白皮书》深度洞察了国内大模型的发展态势,度量了中文大模型能力边界,探明了潜在的安全风险点,建构了中文大模型能力与安全全景图,为国内大模型未来技术与产业发展提出了明确建议和方向。”熊德意对红星资本局说。

同时,《白皮书》复盘了2023年全世界人工智能的发展概况,以专业视角解析大模型在应用领域面临的机遇与挑战,为行业构建全景视图,探索人工智能领域专业技术的进步及突破。

《白皮书》还提出建议称,大模型提供方在追求知识和能力提升的同时,应关注价值对齐。随着大模型能力的不断进化,这一问题的重要性将日益凸显。

成果③:成立大模型应用创新协同中心

在此次大会上,成都传媒集团总编辑,成都传媒产业集团党委委员、董事李刚和多名专家学者以及企业家代表共同宣布:大模型应用创新协同中心正式成立。

该中心将通过创新联合体形式建立大模型产业社群,协同引导大模型企业与实体产业进行交流互动;组建大模型创新服务体系,通过资本对接、成长跟踪和业务交流等多种形式,助力大模型企业成长;搭建数据资产服务基座,打通数据要素流通和数据资产价值化。

目前,首批参与该中心的成员有:天津大学自然语言处理实验室、红星新闻、驰星创投、元禾辰坤、左手医生、联合数据、360集团、科大讯飞、云从科技、达观数据、极睿科技、晓多科技、中科闻歌、得理科技、上海财经大学金融大模型实验室团队、香港中文大学数据科学学院、澳门大学科技学院、郑州大学计算机与人工智能学院以及预见创研。

大模型应用创新协同中心致力于汇聚业内高校、科研机构、相关企业,共同推动大模型在各垂直领域的深度应用与创新,促进产业升级和经济发展,包括但不限于趋势研究、技术 交流、跨界合作、成果孵化等工作任务。

行业大咖、专家学者齐聚一堂

共论大模型及人工智能产业的发展

在此次大会上,行业大咖、专家学者以及多位院士围绕“大模型行业的发展”“大模型行业的未来”两大主题分享了各自在不同细分领域的前沿思考。

发展中国家科学院院士、中国科学院虚拟经济与数据科学研究中心主任、国务院参事石勇,欧洲科学院外籍院士、清华大学人工智能研究院常务副院长孙茂松,中国科学院软件研究所二级研究员、时空数据管理与数据科学研究中心主任、俄罗斯工程院外籍院士丁治明三位院士站在不同的角度分别带来了主题演讲。

另外,北京大学数据空间技术与系统研究中心副主任、北京大学软件研究所副所长刘譞哲,中国信息通信研究院人工智能研究中心平台部高级业务主管李荪,澳门大学科技学院副教授、澳门大学自然语言处理与中葡机器翻译实验室主任黄辉也发表了精彩演讲。

值得一提的是,李荪在演讲环节预发布了中国信通院即将推出的《大模型基准测试实践指南》。

同时,代表产、学、研、资的四位嘉宾——元禾辰坤高级合伙人王吉鹏,四川省大数据发展联盟秘书长秦强子,公安部首席科学家、电子科技大学教授、博士生导师李建平和考拉悠然科技有限公司首席架构师谢治宇以《大模型赋能经济发展的机遇与挑战》为题,在驰星创投创始合伙人郭浩然的主持下展开圆桌讨论。

此次大会不止于分享行业经验和前沿思考内容,还旨在搭建起政府部门、专家学者、创业公司与大型企业、投资机构在人工智能领域的沟通交流平台。

此次大会的成果丰硕、亮点纷呈,也为大模型及人工智能产业未来的发展提供了经验案例和有效路径,有助于加速各种应用落地,从而赋能千行百业,加速传统产业的转型升级,促进数字经济和实体经济深度融合。

国内大模型百花齐放

首次分赛道评测通用+垂直大模型优秀案例

事实上,随着以“ChatGPT”为代表的大模型快速发展,全球“人工智能”技术竞技的帷幕也被掀开,这引发了新一轮人工智能应用热潮。

据不完全统计,国内现已有一百余个人工智能大模型陆续公开发布,外界对各家大模型的发展、能力、成长空间以及市场潜力始终保持着高度关注。

为了摸底大模型行业的发展,此次大会邀请到中国信息通信研究院人工智能研究中心、中国软件评测中心两大权威研究机构,以及来自各大高校的专家学者组成大模型基准评测专家委员会,对国内大模型进行多元化评测,为大模型未来的发展把脉问诊、指引方向。

专委会成员——郑州大学计算机与人工智能学院的教授、博导昝红英告诉红星资本局,“评测标准可以助力我们在大模型赛道上弯道超车。研究、应用大模型需要依靠这个标准,就像高考的指挥棒落在哪里,全国教育就会往哪个方向追赶。”

记者了解到,在此次大会召开前,专委会创新性地把大模型分为“通用大模型”和“垂直大模型”两个赛道。针对通用大模型,聚焦知识能力和价值对齐两大维度、六则细项进行测评,而对于垂直大模型领域则采取主观评价的方式,更加侧重商用价值变现的可行性。

在此次大会上,共5家大模型分别在“通用大模型”的6个评选细项均表现突出,它们展现了大模型能更广泛、更深入地改变人们生活的可能性;另有13家大模型被评选为“垂直大模型”优秀案例,它们让外界看到大模型落地各行各业的潜力。

整体来看,此次评测以“权威”和“学术”为基色调,建立了一个公平、公正、多视角的标准,展现了大模型的多样性,能促进大模型在未来有序发展,营造出了良好的行业生态。

附:

垂直大模型创新应用优秀案例名单:

一等奖:达观数据、晓多科技、中科闻歌

二等奖:极睿科技、考拉悠然、摸象科技、微盟、左手医生

三等奖:北京交通大学交通大模型团队、得理科技、赛灵力科技、上海财经大学金融大模型实验室团队、盛世君联

以上内容来自专辑
用户评论

    还没有评论,快来发表第一个评论!