生成AI革命的核心的大型语言(LLM)是数据chasms,而训练它们的一切都很好。为了自己的LLM,苹果从出版商那里购买了许可证,但是制造商还使用Applebot机器人在网络上收集了很多数据。
Applebot收获
Applebot是制造商几年前在网络上推出的索引机器人,以改善Siri和Spotlight的搜索结果。它也用于收集用于培训公司AI模型的数据。这意味着从“打开Web”的内容中可以找到由由不同函数生成的内容苹果智能。
不想免费工作的出版商苹果有可能性拒绝Applebot抢劫其内容,但对于到目前为止收集的所有内容来说,为时已晚。该信息已通过此确认文章从苹果博客专用于自动学习以及小组领导者。
AI Apple的大老板John Giannandrea也是解释在关键后会议上:”我们从我们在网络研究中的投资开始,然后从公共网络数据开始»。仅安慰:为扩散模型(生成图像),”Apple创建了大量数据»。
换句话说,除非您是一个有力的出版商,否则苹果的AI将使用从未授权开发其内容的网站的数据。受到华盛顿邮报关于AI为新闻发布者提供的机会,蒂姆·库克(Tim Cook)解释说,许可证是“聪明的想法而且没有理由拒绝此类许可证。您仍然必须有机会要求它。
当然,苹果不是第一家收获公共网络训练其AI模型的公司。除非网站明确拒绝它,否则每个人都这样做并继续这样做。但这在必要时确认了小型出版商和独立网站形式,有时是卫冕的身体,即AI的框架。
来源 : 宏