“酒尽寒宵烛,凄清感旧游。乡心随水远,别恨逐年稠。生计愁中悟,归期梦里谋。何当脱尘鞅,一笑拂吴钩。”
9月21日,在2024北京文化论坛文化产业投资人大会主题演讲中,清华大学人工智能研究院常务副院长孙茂松展示了其团队多年前研制的九歌写作律诗的能力。他认为,经过自监督学习,人工智能已能将诗歌的押韵、平仄、对仗等规律基本“写到位”,并且随意给定一个主题,能生成一批质量还不错的古诗“任选”,对诗歌写作者来说,这“提供了相当大的创新空间”。
大会期间,他接受新京报贝壳财经记者专访时表示,人工智能技术和文化创意产业结合正当其时,要顺势而为,趁势而上。“目前的人工智能技术能力很强大,但也存在深刻不足,其特点决定了它是最适合应用于文化创意产业的。”
他还透露,他所领导的团队同时在兼顾基座大模型和垂类模型的研究。
人工智能更适合应用于文化产业:超越80%的普通人“没问题”
在主题演讲和采访过程中,孙茂松多次呼吁文化创意产业要抓住人工智能这一技术手段。为什么当前是文化产业应用人工智能技术的最佳时机?
孙茂松解释称,得益于近几年国内基座大模型能力的提升,人工智能在理解和生成文本、图像、视频、声音等与文化较为贴近的要素上,比两年前的能力有了很大提高。“虽然这些能力仍不够完善,但超越80%普通人,我觉得是没问题的。本质上它是一套全新的技术工具,可用于赋能文化创意领域。”
由于人工智能大模型目前存在幻觉和前后一致性差等问题,他判断目前的人工智能离工业部门大规模实质性运用“还有相当距离”,但由于已经能为文化产品提供了一定的想象力和可能性,利用人工智能技术可以有效进行文化创意,能有效改变创作环境,“实际上提供了一个比原来更好的技术手段”。
他建议,有意从事这一领域的团队应尽早布局并积极投入。“虽然说万事开头难,但如果能够把握住‘开头’,就会占尽先机,得到边际效益最大化之利。”
同时他强调,虽然人工智能应用在文化产品上比较“顺手”,但这并不意味着效果“唾手可得”。“想要干好这件事还是很有挑战性的,需要付出艰苦的综合努力”,例如还需要解决典型应用场景、与用户的深度语义互动等问题,“这些都不简单”。
“百模大战”后的杀手级应用哪里找?找对场景比降低成本更重要
经历“百模大战”后,国内大模型正努力在许多行业落地,医疗、金融、文旅、教育等垂类领域都曾被看好,那么什么赛道才能产生人工智能时代的杀手级应用?在孙茂松看来,要判断哪些赛道更有前景不能一概而论。
他将大模型应用到具体行业或领域的过程分为三步:首先需要了解是不是在解决行业痛点问题,继而还需要摸透痛点问题的性质所在,最后才是根据其性质去研判并实际解决痛点问题。另外,他提出,某些行业痛点问题可能并非“人工智能擅长的”,在这种情况下也不能“强人所难”。“应找到人工智能技术所擅长的应用领域,针对该领域的业务特点和实际需求去设计、完善大模型赋能的相关技术,而这需要各个行业自己去摸索。”
对当前的大模型应用而言,找到正确场景与降低成本哪个更重要?孙茂松认为,答案是前者。“只要找对场景,让用户真的感到有用,成本通常不是问题,过几年就降下来了。现在应该关切的是,是否找对了重要的应用场景。目前很多大模型应用都还停留在‘概念车’的‘演示’阶段,尚未做到真正‘有用’。”
什么对我国人工智能最重要?我们在算力方面与美国比还是有明显差距
近年来,通用人工智能一直被各大论坛津津乐道,但孙茂松认为,目前的大模型乃至具身智能距离真正的通用人工智能还有很长的路要走。他以现场的人形机器人举例,工业机器人高效可靠,多属于自动化范畴,而人形机器人必须具备一定的自主能力,总体上尚处于“概念车”的研制阶段,“现在即使花100万买一个人形机器人回家,也难以完成比较自如的‘在厨房炒菜’的任务,因为厨房环境实际上是复杂、多变的,厨具、灶具、食材种类及其摆放位置等都会给机器人造成严重的困扰,其求解过程不仅仅包含对语音和文本的理解,还需要对所处开放环境进行实时感知并与其反馈互动。”
数据、技术和算力对国内大模型产业来说哪个属于卡脖子的地方?在国内语境下,孙茂松表示,算力比数据更能称作“卡脖子的地方”。“要发展基座大模型,我们在算力方面与美国相比还是有较大差距。”
数据方面,他认为,中国并不缺少大数据,“我们拥有的数据资源丰富程度在世界上是数一数二的,但多‘金屋藏娇’,分割存放于各个单位中,尚没有实现大范围真正意义上的互联互通”。
他还表示,国内对此还没有形成有效的解决机制。“数据也不是无偿拿出来的,要有一套能够让大家愿意拿出来的机制,在模型使用数据训练后,各方利益都能得到照顾”。他建议,国家有关部门应尽快解决这一问题。
还没有评论,快来发表第一个评论!