EP 53. AI Agent会取代程序员吗？与硅谷顶尖研究员聊聊软件开发与agent的未来

00:00

02:46:45

今年上半年 AI 领域最大的热点，除了 OpenAI 的 Sora 之外，当然就是——AI程序员！与 Github Copilot 的代码补全不同，AI Agent 公司 Cognition Labs 和其产品 Devin，宣称世界上第一位“AI 软件工程师”，拥有全栈技能，通过一个指令就能完成整个开发过程。可以端到端构建和部署程序。成立不到半年，估值就高达 20 亿美金！相应的，从Princeton SWE-agent, 到开源项目OpenDevin 这些直接竞争者，到Replit, Augment 等独角兽玩家，都纷纷进入这个领域。这是新的泡沫，还是不远的未来？

Hello World, who is OnBoard!?

这一期我们邀请的三位来自硅谷的嘉宾，在这个领域都太有发言权了！有著名的软件开发云平台独角兽 Replit 的 AI 产品核心成员，有 Agent 领域数个奠基之作的顶尖研究员，还有 ex-Google Deepmind, 现任明星 AI 编程辅助独角兽公司 Augment 的早期核心研究员。

借着小酒，我们长达两个多小时的对话，畅聊了你最关心的话题：

AI 会取代工程师吗？

AI取代了一部分软件开发需求之后，会如何重塑软件开发？

Devin 是否能代表 AI Agent 应用开发的方向？

Agent 产品未来还会迎来怎样的提升？基础大模型的边界在哪里？

最后，生成式 AI 对个人职业和社会会产生怎样的深远影响？

这或许是市面上你能听到的对于这个话题最深入的讨论（之一？！）——还有，结尾有来自 Princeton 高材生的彩蛋！

Enjoy！

嘉宾介绍：

李珎：Replit AI 团队负责 AI Coding agent，ex- startup 创始人, ex- Googler。Replit 成立于 2016 年，是一个基于浏览器的 IDE，允许用户在多种编程语言中编写、运行和分享代码。2023 年$97.4M 的 B 轮，投资人包括 A16Z，Khosla Ventures、Coatue 等，估值 $1.16B

姚顺雨：普林斯顿大学博士，清华大学获学士。他在Agent 领域发表了一系列非常有影响力的论文：从有奠基意义的 ReAct，Tree of Thoughts, 到成为行业标准的基于 GitHub 的代码能力评估数据集 SWE-Bench，到首个开源AI 程序开发 agent 项目 SWE-agent，是绝对的天才研究员！

赵宇哲：Augment 任 AI 研究员，曾在Google Brain（现Google Deepmind）任 Staff Research Engineer，主要研究方向是语言模型预训练，指令训练，神经检索和检索增强语言模型。Augment 成立于 2022 年，是一家为提供企业级全栈式 AI 编程助手的初创公司，由硅谷著名老牌风投 Sutter Hill Ventures 孵化（Snowflake也诞生于此），并在最新一轮获得由Index Ventures、Lightspeed Venture Partners 和 Google 前 CEO Eric Schmidt 等领投的 2.5 亿美金融资，估值接近 10 亿美金。

OnBoard! 主持

Monica：美元VC投资人，前 AWS 硅谷团队+ AI 创业公司打工人，公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻：莫妮卡同学

高宁：前美元 VC 投资人，Global SaaS 社区及服务组织 Linkloud 联创，公众号我思锅我在 (ID: thinkxcloud) 主理人。| 即刻：High寧

我们都聊了什么

03:30 三位嘉宾背景、如何进入AI领域以及最近常用的AI产品。

20:26 Replit是如何设计AI产品的，背后逻辑是什么？

28:58 Replit需要训练Coding专属模型的原因是什么？

34:04 训练代码或数学等专属模型的目的是什么？

37:50 现在Coding模型跟基础大模型的能力相比有什么差异？

40:51 Coding模型的训练方法对基础大模型的训练还有什么启发？

45:26 为什么Replit当初选择构建自己的IDE，以及对后来AI功能设计的影响在哪里？

51:01 为什么Augment选择以插件的形态服务专业程序员，以及难点在哪里？

55:27 为什么RAG能更好理解企业级Codebase的需求？

58:13 使用RAG的过程中最有挑战的地方在哪里，以及如何保证准确率？

63:38 Augment如何将服务企业的产品标准化？

67:04 为什么短时间内具有更长Context的大模型仍无法替代RAG？

69:57 为什么没有针对Coding能力好的Benchmark，以及SWE-Bench诞生的背景？

73:48 什么是SWE-Agent，以及Agent解决了什么问题？

78:50 为什么SWE-Agent或Devin相比RAG的准确率有很大提升？

81:33 SWE-Agent跟Devin的差异在哪里？

83:12 往后这类Coding agent的准确率提升会在哪里？

86:50 回顾Agent领域的发展，其中有哪些重要里程碑？

93:01 是否有必要训练针对Agent的大模型？

98:37 Replit是如何探索Coding agent的？

102:03 对Devin印象最深刻的是什么，还有什么是不知道的？

105:43 Devin现在的用户画像可能是谁？

109:45 为什么Coding agent能力提升不仅在大模型上，还需在产品化上？

116:46 顺雨最新一篇解决奥数问题的研究对Coding模型有什么启发？

120:31 现在基础大模型的能力提升还在哪里，还有哪些是我们不知道的？

122:15 大模型是否具备System 2的慢思考能力，以及我们如何实现？

127:13 关于Multi-agent，Replit在做怎样的探索？

131:13 如何定义Multi-agent系统，什么情况下需要？

135:08 要实现Multi-agent环境，具体会面临什么挑战？

137:31 展望未来，AI编程究竟会如何重塑软件开发流程？

145:45 基于语言模型的Agent带来的社会影响有哪些，人类真的会被替代吗？

158:56 最后，快问快答：今年研究的小目标、业余爱好和短期内AI最期待的事件？

165:14 彩蛋！来自顺雨的一段RAP，欢迎来到“宇宙中心”！

欢迎我们的微信公众号，了解更多中美软件、AI与创业投资的干货内容！

M小姐研习录 (ID: MissMStudy)

我思锅我在（ID: Thinkxcloud）

欢迎在评论区留下你的思考，与听友们互动。喜欢 OnBoard! 的话，也可以点击打赏，请我们喝一杯咖啡！如果你用 Apple Podcasts 收听，也请给我们一个五星好评，这对我们非常重要。

OnBoard! 终于成立听友群啦！新年新气象，加入Onboard听友群，结识到高质量的听友们，我们还会组织线下主题聚会，开放实时旁听播客录制，嘉宾互动等新的尝试。添加任意一位小助手微信，onboard666, 或者 Nine_tunes, 发送你的姓名、公司和职位，小助手会拉你进群。期待你来！

以上内容来自专辑

EP 54. 深度对谈顶尖AI开源项目：大模型开源生态, Agent 与中国力量
502519:06
EP 53. AI Agent会取代程序员吗？与硅谷顶尖研究员聊聊软件开发与agent的未来
34246:45
EP 52. 一线亲历者对谈：生成式AI这一年，中美市场的异同、机会与未来
27006:18
EP 51. 全英文对话Inworld, 微软Xbox: AI与游戏的未来
16920:06
EP 50. 中美头部AI应用实战分享：如何从0到1，机会、挑战和长期壁垒（下）
18513:58
EP 49. 中美头部AI应用实战分享：如何从0到1，机会、挑战和长期壁垒（上）
28751:17
EP 48. 对话Lepton创始人贾扬清：AI需要怎样的基础设施，模型与应用的未来
28126:47
EP 47.【特别串台】对话AI聊天深度用户：打破刻板印象，TA不只是纸片人伴侣
23110:03
EP 46. 深度解读 OpenAI Sora（下）：一线投资人与创业者眼里的AI应用新格局
29211:35
EP 45. 深度解读 OpenAI Sora（上）：技术创新与局限，多模态融合的未来
55054:27

主播信息

莫妮卡同学啊

4211

加关注

姚念康
和硅谷101比，你们的内容更加深入，挺好😊，但是你们的录音质量和他们比差得挺远。
姚念康
噪音太大

EP 53. AI Agent会取代程序员吗？与硅谷顶尖研究员聊聊软件开发与agent的未来

OnBoard!

莫妮卡同学啊

GPT-4是什么？会取代程序员吗？

聊聊未来的疫情与防控

35岁的程序员，注定被取代吗？

No.423 人工智能会取代程序员么？

全球首位AI程序员诞生，人类程序员会失业吗？