4月6日 谷歌用ChatGPT训练AI,新时代的版权风暴更复杂了!

4月6日 谷歌用ChatGPT训练AI,新时代的版权风暴更复杂了!

00:00
05:10

【王煜全 要闻评论】粉丝群已经开通


欢迎加入前哨粉丝群,在这里你可以和科技投资人、创业者、各行业专业人士互动沟通,分享心得体会,也可以第一时间了解到前哨相关活动动态,结交志同道合的小伙伴。


入群方式:
微信扫码下方二维码即可入群

如果您想洽谈合作,请添加创新地图的微信:innovationmap ,并附上简介。


你好,我是王煜全,这里是王煜全要闻评论。


我最近注意到,AI大模型不但冲击了我们对意识、认知这些概念的理解,也引发了一系列的「版权风暴」,对劳动生产、资源分配也会产生深远的影响。


正好今晚的科技特训营直播,我会和大家好好分析AI技术引发的改变,现在就为大家预热一下,谈谈我的一些观察。


图片


最近一两年,关于AI的各种版权起诉已经不少了,斯坦福大学的最新研究做了非常详细的统计:2012年以来,关于AI的争议数量增加了26倍;2022年提交给人工智能伦理会议FAccT的论文同比翻了一番,如果和2018年比,增加了10倍。


具体的案例大家在新闻里也看到过不少了:微软和OpenAI 2022年因为使用GitHub的数据训练AI,遭遇集体诉讼;AI绘画软件成为画家们围攻的焦点,之前我也和大家聊过。


今年3月,拥有《华尔街日报》等知名媒体的美国新闻集团,也宣布将通过法律程序起诉OpenAI、微软和谷歌,要求对方为使用自己的文字数据支付赔偿。


这些都是互联网诞生之后,每一次技术变革中非常常见的「数据版权争议」,最近谷歌使用ChatGPT训练自家AI模型Bard的消息,则为我们展示了AI时代的新矛盾。


这事最早是3月底,The Information追踪谷歌AI工程师雅各布·德夫林(Jacob Devlin)的离职消息时挖出来的。


这位AI大牛加入OpenAI,一个很重要的原因是,他发现谷歌AI团队正在使用ChatGPT的数据训练Bard。方法也不复杂,有个叫ShareGPT的网站,用户可以在网站上发布自己与ChatGPT的对话,既有用户的提示词,也有ChatGPT生成的回答,甚至还有用户对回答的评价,可以说这都是OpenAI和用户已经做好标注的数据集。


雅各布和谷歌高层反映了这一情况,他认为这样做既违反了OpenAI的服务条款,「禁止使用ChatGPT输出的数据....开发与OpenAI竞争的模型」,同时他也认为,这样做只会让Bard变成ChatGPT的仿制品。


这条新闻爆出后,谷歌做了模糊的回应,只说最新部署的Bard并没有使用ChatGPT训练,至于具体有没使用就只他们自己知道了。


不过无论真假,这确实为我们打开了一个新的视角,AI生产的数据所有权究竟在谁手里?我们和新技术之间的关系又该如何划定?




AI虽然还被看作一种工具,但不可否认它确实已经成为某种程度的生产主体,由它制作的作品究竟该如何划定归属权,站在不同的视角必然会有非常多的矛盾观点。


站在普通用户的角度看,我使用AI做出来的东西当然应该属于我,这就和我用锄头种地,种出来的东西我有资格拿去卖钱一样。


但是,今天锄头学会了别人优秀的经验,自己就能干活,站在经验贡献者的角度,这其中有自己的功劳,要分一杯羹也很正常。


站在开发者的角度,经验、知识一直都存在,是自己投入人力物力开发了AI大模型,让隐藏的知识能被使用起来,成果中当然也有自己的功劳,加上数据的特殊性,要求版权保护似乎也说得过去。


对于前两个问题,今天已经有了阶段性的答案,美国版权局今年2月就撤销了漫画《黎明曙光》(Zarya of the Dawn)的部分版权,原因就是其中一部分内容是AI绘制而成。


美国版权局给出的理由是,这部漫画作者的身份仍然受版权保护,但AI创作部分不能享受同样的待遇,因为只有人类创作的图像才能享受版权,换句话说你提供了创意,可以成为这本书的作者,但AI绘画的内容没有版权主体。


这个逻辑当然成立,但随着AI技术不断扩散,每个人都能用上AI的时候,怎么确定一幅画是不是人画的呢?这必然会是一个被不断探讨,持续引发争议的地方,而争议的焦点也会随着AI技术融入人类生活不断改变。


这方面谷歌自己可能也深有体会,2005年谷歌的搜索引擎因为爬取了法新社的新闻遭到起诉,他们一边向谷歌索赔,一边要求法院禁止谷歌网站展示法新社的新闻。


这个要求,在今天流量时代看起来可能有点不可思议,但对于主要靠版权费赚钱的出版商,用传统视野看新技术变革,有这种想法也很正常,所以才有了后面的反转。


到了2019年,法新社又起诉了一次谷歌,要求谷歌使用他们的新闻后,要支付广告分成,这次谷歌直接回复法新社,分成没门儿,要么继续免费展示你的内容,要么把你从搜索引擎上撤掉,于是双方陷入了焦灼,直到2021年因为监管出面,才最终达成妥协。


其实仔细想想,我们就会发现,这一切争端背后,是新技术变革改变了「人与信息」「人与生产」的关系,由此引发了一系列的所属权的争议。


图片


文字印刷时代,科学家和作家们为首创和原创争得不可开交,牛顿和莱布尼茨的微积分之争,达尔文和华莱士的进化论公平竞赛,都是案例。


互联网时代,一次又一次的版权争论,我们也看到音乐出版商从起诉互联网企业使用MP3传输音乐,到今天自己发行数字音乐产品,经历了180度的转变。


AI时代,又会有哪些新的变化?新技术又会如何驱动社会变革发生呢?今晚8点的特训营直播,我再继续和大家深入聊一聊!


以上是今天的内容,更多详细的产业分析和底层逻辑,我会在科技特训营里分享。欢迎关注全球⻛口微信号,报名加入!


王煜全要闻评论,我们明天见!


以上内容来自专辑
用户评论
  • 莫尔强

    和人类一样,满嘴跑火车也是当下GPT的一个毛病。若追问它“你刚刚说的依据是什么?”它就开始捣糨糊。

  • 莫尔强

    可以引用我的论文,但必须把我的论文,规规矩矩地列明在你的参考文献列表里,否则就是“学术不端”。必须承担法律责任。

  • 张静_ja

    有意思