从 6 月 26 日开始,生成式人工智能“实验”元将能够依赖发布在Facebook等等Instagram。这些大量的额外数据将被添加到大量的文本和图像中,从而使该小组的大型语言模型 (LLM) 的训练成为可能。 Meta 使用来自公共在线和许可内容的数据,但始终需要更多数据。
如何拒绝使用您的出版物?
这很好,Facebook等Instagram在全球拥有数十亿用户,他们每天发布大量内容。因此,默认情况下,从 6 月 26 日开始,这些出版物、照片和标题将用于 Meta LLM 培训。该公司已开始通过链接到解释的通知警告用户;我们在这方面找到了他们页。
«在欧洲和英国,我们依靠合法利益基础收集和处理这些公共和许可数据源中包含的任何个人信息,以及 Meta 的产品和服务收集的任何信息,以便开发和改进 AI元»。
这里无需征求同意,因此默认情况下,在 Facebook 和 Instagram 上发布的所有出版物都会被招募来训练 Meta 的人工智能。幸运的是,可以选择不参加这个收获计划……但这不会像点击按钮那么容易。
此处提供表格地址(在尚未宣布收集的地区,例如法国,它尚未出现)。特别是,有必要说明收集过程如何造成问题……英国 Instagram 用户杰里米·基思 (Jeremy Keith) 能够测试员程序并从 Meta 处获得了对其反对意见的考虑。
然而,该组织在电子邮件中澄清,它保留将信息用于“发展和改进» 儿子 IA,«即使您反对或不使用我们的产品和服务»! Meta 在其描述其法学硕士如何运作的页面上解释说我们没有太多选择:
«即使您不使用我们的产品和服务或没有帐户,我们仍可能处理有关您的信息,以在 Meta 上开发和改进人工智能。当您出现在我们的一位用户在我们的产品或服务上共享的图像中时,或者当有人在他们在我们的产品和服务上共享的出版物或标题中提及有关您的信息时,尤其如此»。
监管机构将如何评估这一情况还有待观察。特别是在欧盟,《通用数据保护条例》(GDPR) 收紧了与“合法利益”相关的所有规则,允许公司在未经同意的情况下收集数据。
这个同意的问题,或者更确切地说,同意的缺失,正变得越来越紧迫。 Reddit 尚未要求任何用户提供帐户将他们的讨论“卖给”生成人工智能运营商——当 Gemini 认真对待 Reddit 会员发布的一个笑话时,谷歌也被风格愚弄了。与 Meta 不同的是,人工智能无法拒绝收集和处理您的数据。
来源 : 杂志