嘉宾|志杰,阿里云通义听悟产品&研发负责人,前微软亚洲研究院语音团队主管研究员
主播 | 刘飞,产品经理,袋泡原叶茶「三五杯」联合创始人
本期邀请了阿里云通义听悟产品&研发负责人志杰。志杰从本科毕业后一直与语音技术和 AI 技术结缘,在中科大的语音实验室、微软亚洲研究院和阿里云等机构从事相关研究工作。
这是第一次从大厂业内从业者的视角聊了聊做 AI 产品的体会。志杰分享了云上语音 AI 产品在各种场景中的应用,也强调了语音作为人与人之间最基础的交流方式的重要性。我们还探讨了人机语音交互的现状和未来发展方向,以及语音识别、语音转文字和多人语音交流等技术挑战,志杰很坦诚了分享了他的整体态度:理性乐观。
在「通义听悟」查看本期文字稿:
https://tingwu.aliyun.com/doc/share/d6647e9b8bf94e0b8437ebd6a2408c13#/
内容索引
00:35Part1 通义听悟的由来
算法到产品还是产品到算法
应用研究就是解锁场景
人机语音交互到人人语音交流
麦克风与你的距离越来越远,可查的东西却越来越多
技术和产品需要良好的正循环,反之闭门造车、没有壁垒
18:18Part2 AI技术的真正兑现
高技术产生高价值
重点不是卷过你的同行,而是发现价值的蛋糕
现在的大模型可以替代原来N多个小模型做的任务
38:00Part3 通义听悟里程碑及愿景
聚焦,做减法
围绕消费场景里的用户场景和使用场景,来做产品服务
通过模型服务产生价值
交互体系:下面有模型层,模型服务层,上面有大模型to B产品
从工具到助手
47:27Part4 做产品的真正的功力在于创新
实验结果不是靠人的努力来改变的,它是一个自然而然的日常的过程
真正的研究在于创新的速率
人的成见是根深蒂固的,特别在大模型上面
57:12Part5 大模型的应用场景及未来趋势
整个大模型应用的发展阶段,其实还在选题
AI助理是人们对AI的愿景
一定程度上AI更了解你,可能是可以发生的了
01:03:36Part6 技术推动人类社会发展的力量:乐观的前景与挑战
应用层:精度和成本
今天的小模型也是十年前的大模型,今天的大模型也会变成未来的小模型
经济活动本身就是在不断的提高效率的过程,即劳动生产率
技术的发展会给人类带来更大的福祉和新的工作机会
聚焦到价值,其他交给时间
人类的创造力是无中生有,是不可替代的
制作人:严格
片头:Where Are You Going (Live) - 海龟先生
片尾:人间指南 - 岛屿心情
相关
欢迎在评论区留言交流。如果喜欢《三五环》,也恳请能在苹果 Podcast 、网易云音乐、Spotify 或喜马拉雅留下你的宝贵好评。感谢!
商务合作&嘉宾自荐,请加微信: wocaishiliufei
封面图片由 Midjourney 生成,版权所有©️三五环
是啊,就很装!听了特别扭
额,不太习惯中文里夹在英文