据媒体报道,OpenAI、Google 和 Anthropic 等科技公司的最新大模型训练表现均不及预期。在通往 AGI 的路上, scaling law 是否已经见顶成为大家讨论的话题。在算力和数据遭遇瓶颈的当下,如何让大模型的效率更高,用最少的算力和参数实现模型的提升成为亟待解决的问题。
就在 11 月,来自国内的人工智能企业彩云科技发布了他们的他们自研的 DCFormer 架构及基于该架构的通用大模型。除了自研大模型,彩云科技还有三款自己的 AI 应用 -- 彩云天气、彩云小译和彩云小梦 -- 并且实现了商业化。
为什么一家创业公司要选择研发自己的底层大模型?人工智能时代需要怎样的应用? AI 产品的商业化要怎么做?我们今天的嘉宾是彩云科技的创始人袁行远,在虎嗅 F&M 创新节的活动现场与他一起讨论了这些大家都很好奇的问题。
本期人物
丁教 Diane,「声动活泼」联合创始人、「科技早知道」主播
袁行远, 彩云科技创始人, CEO
主要话题
[01:42] 彩云不是一家只做应用公司,还是一家做模型的公司
[04:33] 搞清 transformer 黑盒子的运行机制,实现 1.7 ~ 2 倍的模型效率提升
[09:57] 缺钱、缺数据、缺算力,创业公司靠什么做出优质的大模型?
[12:42] Scaling law 见顶? 除了卷数据和算力,还有一条路是模型优化
[17:49] 从 AI 翻译到彩云小梦,生成式 AI 非常适合故事创作
[22:39] 算力等价原理:人类大脑创作「三体」需要十年, AI 创作伟大的作品也需要同样的算力和时间
[26:44] 消费性不够,留存率不足,现阶段 AI 造梦师只能让 bubble 持续半小时
[32:07] 未来的 AI 创作:随时进入任意时空和宇宙,生命得到极大延展
幕后制作
监制:Yaxian
后期:Jack
运营:George
设计:饭团
商务合作
声动活泼商务合作咨询(https://eg76rdcl6g.feishu.cn/share/base/shrcnXTIc2pXMpAjDLiNVsXN3zc)
支持我们,加入新一年的播客创新
2021 年我们发起了「声动胡同会员计划」,这是一个纯支持项目,支持「声动活泼」在播客内容上不断探索和创新。回顾 2023 年,得益于这些支持,「声动活泼」的每档节目都不断突破,不仅荣登苹果中国的年度热门节目榜单,还在 CPA 和喜马拉雅等平台都榜上有名。2024 年全新付费节目「不止金钱」现已上线,欢迎收听。
加入我们
声动活泼正在招聘全职「节目监制」,查看详细讯息请 点击链接(https://eg76rdcl6g.feishu.cn/docx/XO6bd12aGoI4j0xmAMoc4vS7nBh。)。如果你已准备好简历,欢迎发送至 hr@shengfm.cn, 标题请用:姓名+岗位名称。
关于声动活泼
「用声音碰撞世界」,声动活泼致力于为人们提供源源不断的思考养料。
我们还有这些播客:声动早咖啡、声东击西、吃喝玩乐了不起、反潮流俱乐部、泡腾 VC、商业WHY酱、跳进兔子洞 、不止金钱
欢迎在即刻、微博等社交媒体上与我们互动,搜索 声动活泼 即可找到我们。期待你给我们写邮件,邮箱地址是:ting@sheng.fm
欢迎扫码添加声小音,在节目之外和我们保持联系。
感冒了声音好有磁性
更新了了,哈哈哈
真是阿狗阿猫都来分AI的蛋糕了。
Poegtam 回复 @Poegtam: 一个做天气app的硬来蹭热点,说要优化大模型底层,哈哈哈,这话你自己信吗? 趁着GPT 5.0没出来,使劲忽悠赶紧再弄点投资人的钱吧。