根据纽约时报据称,OpenAI 掠夺了其出版物和在线档案,以喂养和训练 ChatGPT 所依赖的大语言模型 (LLM)。这家著名的新闻出版商估计,有数百万篇文章在未经其授权的情况下被使用。这就是 OpenAI 遭到正式投诉的原因,“数十亿美元的损失»。
OpenAI 不反汇编。在一篇博客文章中,该公司针对任何掠夺行为进行了辩护,并谈到了“引用权”(“合理使用”)。,一个允许在某些条件下使用受版权保护的作品的概念。美国的“合理使用”也比法国的做法更加灵活。
ChatGPT 反流
这一原则使得OpenAI能够训练其AI模型,得到了大量组织和公司的支持,无论是在美国还是在欧盟,都支持OpenAI。该公司还回忆说,它已经建立了一个系统,允许出版商禁止 OpenAI 吞并他们的内容。这现在于 2023 年 8 月通过。
《美国日报》还批评ChatGPT“反刍”其内容,却没有进行起码的修改。纯粹简单复制的指控肯定得到了 OpenAI 的证实,但这将是一个错误“稀有的» 该公司力求消除这种情况。 “因此,我们采取了措施来限制非自愿记忆并防止模型结果出现反流。“,她保证道。
然而,OpenAI 对此表示遗憾现在拒绝提供这些著名的反流的例子。更糟糕的是,该公司声称该日报会故意操纵请求,“通常包括文章的长摘录”,推动 ChatGPT 反刍相同的副本。 “即使使用这样的提示,我们的模型通常也不会按照《纽约时报》暗示的方式行事,这表明他们要么指示模型反刍,要么从多次尝试中选择示例», 赛隆 OpenAI。
两家公司多次会面讨论这个话题,最后一次是在 12 月 19 日。 OpenAI 曾提议时代实时显示 ChatGPT 属性 - 换句话说,该机器人将提供相应文章的链接,就像它深入 Bing 时的情况一样。但没有任何结果,投诉于 12 月底提交。
我们将看看这个故事如何在幕后和支票簿上结束! OpenAI 还将向美国出版商和媒体提供数百万美元,以(追溯?)访问他们的文章。
来源 : 开放人工智能