4月6日谷歌用ChatGPT训练AI，新时代的版权风暴更复杂了！

00:00

05:10

【王煜全要闻评论】粉丝群已经开通

欢迎加入前哨粉丝群，在这里你可以和科技投资人、创业者、各行业专业人士互动沟通，分享心得体会，也可以第一时间了解到前哨相关活动动态，结交志同道合的小伙伴。

入群方式：
微信扫码下方二维码即可入群

如果您想洽谈合作，请添加创新地图的微信：innovationmap ，并附上简介。

你好，我是王煜全，这里是王煜全要闻评论。

我最近注意到，AI大模型不但冲击了我们对意识、认知这些概念的理解，也引发了一系列的「版权风暴」，对劳动生产、资源分配也会产生深远的影响。

正好今晚的科技特训营直播，我会和大家好好分析AI技术引发的改变，现在就为大家预热一下，谈谈我的一些观察。

最近一两年，关于AI的各种版权起诉已经不少了，斯坦福大学的最新研究做了非常详细的统计：2012年以来，关于AI的争议数量增加了26倍；2022年提交给人工智能伦理会议FAccT的论文同比翻了一番，如果和2018年比，增加了10倍。

具体的案例大家在新闻里也看到过不少了：微软和OpenAI 2022年因为使用GitHub的数据训练AI，遭遇集体诉讼；AI绘画软件成为画家们围攻的焦点，之前我也和大家聊过。

今年3月，拥有《华尔街日报》等知名媒体的美国新闻集团，也宣布将通过法律程序起诉OpenAI、微软和谷歌，要求对方为使用自己的文字数据支付赔偿。

这些都是互联网诞生之后，每一次技术变革中非常常见的「数据版权争议」，最近谷歌使用ChatGPT训练自家AI模型Bard的消息，则为我们展示了AI时代的新矛盾。

这事最早是3月底，The Information追踪谷歌AI工程师雅各布·德夫林（Jacob Devlin）的离职消息时挖出来的。

这位AI大牛加入OpenAI，一个很重要的原因是，他发现谷歌AI团队正在使用ChatGPT的数据训练Bard。方法也不复杂，有个叫ShareGPT的网站，用户可以在网站上发布自己与ChatGPT的对话，既有用户的提示词，也有ChatGPT生成的回答，甚至还有用户对回答的评价，可以说这都是OpenAI和用户已经做好标注的数据集。

雅各布和谷歌高层反映了这一情况，他认为这样做既违反了OpenAI的服务条款，「禁止使用ChatGPT输出的数据....开发与OpenAI竞争的模型」，同时他也认为，这样做只会让Bard变成ChatGPT的仿制品。

这条新闻爆出后，谷歌做了模糊的回应，只说最新部署的Bard并没有使用ChatGPT训练，至于具体有没使用就只他们自己知道了。

不过无论真假，这确实为我们打开了一个新的视角，AI生产的数据所有权究竟在谁手里？我们和新技术之间的关系又该如何划定？

AI虽然还被看作一种工具，但不可否认它确实已经成为某种程度的生产主体，由它制作的作品究竟该如何划定归属权，站在不同的视角必然会有非常多的矛盾观点。

站在普通用户的角度看，我使用AI做出来的东西当然应该属于我，这就和我用锄头种地，种出来的东西我有资格拿去卖钱一样。

但是，今天锄头学会了别人优秀的经验，自己就能干活，站在经验贡献者的角度，这其中有自己的功劳，要分一杯羹也很正常。

站在开发者的角度，经验、知识一直都存在，是自己投入人力物力开发了AI大模型，让隐藏的知识能被使用起来，成果中当然也有自己的功劳，加上数据的特殊性，要求版权保护似乎也说得过去。

对于前两个问题，今天已经有了阶段性的答案，美国版权局今年2月就撤销了漫画《黎明曙光》（Zarya of the Dawn）的部分版权，原因就是其中一部分内容是AI绘制而成。

美国版权局给出的理由是，这部漫画作者的身份仍然受版权保护，但AI创作部分不能享受同样的待遇，因为只有人类创作的图像才能享受版权，换句话说你提供了创意，可以成为这本书的作者，但AI绘画的内容没有版权主体。

这个逻辑当然成立，但随着AI技术不断扩散，每个人都能用上AI的时候，怎么确定一幅画是不是人画的呢？这必然会是一个被不断探讨，持续引发争议的地方，而争议的焦点也会随着AI技术融入人类生活不断改变。

这方面谷歌自己可能也深有体会，2005年谷歌的搜索引擎因为爬取了法新社的新闻遭到起诉，他们一边向谷歌索赔，一边要求法院禁止谷歌网站展示法新社的新闻。

这个要求，在今天流量时代看起来可能有点不可思议，但对于主要靠版权费赚钱的出版商，用传统视野看新技术变革，有这种想法也很正常，所以才有了后面的反转。

到了2019年，法新社又起诉了一次谷歌，要求谷歌使用他们的新闻后，要支付广告分成，这次谷歌直接回复法新社，分成没门儿，要么继续免费展示你的内容，要么把你从搜索引擎上撤掉，于是双方陷入了焦灼，直到2021年因为监管出面，才最终达成妥协。

其实仔细想想，我们就会发现，这一切争端背后，是新技术变革改变了「人与信息」「人与生产」的关系，由此引发了一系列的所属权的争议。

文字印刷时代，科学家和作家们为首创和原创争得不可开交，牛顿和莱布尼茨的微积分之争，达尔文和华莱士的进化论公平竞赛，都是案例。

互联网时代，一次又一次的版权争论，我们也看到音乐出版商从起诉互联网企业使用MP3传输音乐，到今天自己发行数字音乐产品，经历了180度的转变。

AI时代，又会有哪些新的变化？新技术又会如何驱动社会变革发生呢？今晚8点的特训营直播，我再继续和大家深入聊一聊！

以上是今天的内容，更多详细的产业分析和底层逻辑，我会在科技特训营里分享。欢迎关注全球⻛口微信号，报名加入!

王煜全要闻评论，我们明天见!

以上内容来自专辑

主播信息

王煜全创新地图

海银资本创始合伙人、全球知名企业增长咨询公司Frost&Sullivan中国区首席顾问，科技创新布道者、产业协调人。

3.09万

加关注

莫尔强
和人类一样，满嘴跑火车也是当下GPT的一个毛病。若追问它“你刚刚说的依据是什么？”它就开始捣糨糊。
莫尔强
可以引用我的论文，但必须把我的论文，规规矩矩地列明在你的参考文献列表里，否则就是“学术不端”。必须承担法律责任。
张静_ja
有意思

4月6日谷歌用ChatGPT训练AI，新时代的版权风暴更复杂了！

王煜全 | 科技要闻评论

王煜全创新地图

数据“投喂”大模型训练 AI时代如何划定版权边界

数据“投喂”大模型训练 AI时代如何划定版权边界

话说民国230-时代风暴

谷歌因违规收集训练数据领2.5亿欧元罚单，数据版权问题再引争议

重生野性时代 254集谷歌

4月6日 谷歌用ChatGPT训练AI，新时代的版权风暴更复杂了！

王煜全 | 科技要闻评论

王煜全创新地图

数据“投喂”大模型训练 AI时代如何划定版权边界

数据“投喂”大模型训练 AI时代如何划定版权边界

话说民国230-时代风暴

谷歌因违规收集训练数据领2.5亿欧元罚单，数据版权问题再引争议

重生野性时代 254集 谷歌

4月6日谷歌用ChatGPT训练AI，新时代的版权风暴更复杂了！

重生野性时代 254集谷歌