Meta 毫不犹豫地收集 Facebook 和 Instagram 上共享的出版物来为其生成式人工智能提供动力。然而,为了保护用户的隐私,该组织禁止访问包含过多个人信息的私人消息和数据集。
日前,Meta 借 Connect 大会之机宣布大量与生成人工智能相关的新功能。这个加利福尼亚组织希望人工智能能够为其元宇宙注入新的生命,首先揭开了它的面纱。元人工智能,一个类似于 ChatGPT 的聊天机器人。这个对话机器人应该会在不久的将来集成到 Facebook Messenger、WhatsApp 和 Instagram 中。
毫不奇怪,Meta 特别依赖于其社交网络上可用的数据训练聊天机器人背后的语言模型,骆驼2。与之相伴的是 Emu,一种能够生成图像的人工智能,如 Adobe Firefly 或 Midjourney。与所有生成式人工智能一样,Meta 的模型需要大量数据才能运行并生成响应和图像。
遵循与 Meta 相同的逻辑,亚马逊也利用客户与 Alexa 的对话来为其人工智能提供支持。这项政策多年来一直有效,允许该公司收集用户的所有语音请求,以供 Alexa 教师模型使用。 Meta 的做法并不令人意外。
元设置限制
在接受路透社同事的询问时,Meta 负责全球事务和传播的副总裁尼克·克莱格 (Nick Clegg) 指出,仅公开出版物在Facebook等Instagram被收集来训练人工智能。该官员表示,这些数据包括文本和图像。
幸运的是,私人讯息与家人和朋友的交流并没有被 Meta 所吸引。同样,Messenger、WhatsApp 或 Instagram 上的私人聊天也被排除在数据语料库之外。无论如何,在消息服务上交换的消息都是完全加密的。显然,Meta 无法访问消息内容。
“我们试图排除个人信息占主导地位的数据集”尼克·克莱格解释说,他指出,推动人工智能发展的大部分数据都是可供公众访问的。
此外,Meta 解释说,已经照顾到过滤私人数据其人工智能模型吸收的公共信息体。事实上,就像所有开发人工智能模型的巨头一样,这家加州集团实际上利用了其平台之外的数据。
不要碰 LinkedIn
例如,门洛帕克巨头没有触及微软专业社交网络Linkedin上可见的数据。 Meta 认为该网站上存在太多敏感数据,这代表隐私风险以及对私人生活的尊重。在那里我们可以找到有关互联网用户的专业背景及其技能的信息。这是恶意个人手中的潜在危险数据。
最后,Meta 授予自己使用聊天机器人与用户的未来交互来改进模型的权利。与 OpenAI、Google 等公司一样,Meta 将使用查询来提高聊天机器人的精确度。
Opera One - AI 驱动的网络浏览器
作者:歌剧
来源 : 路透社