Facebook宣布开发一种新的计算机视觉模型,名为Seer(自我监督)。 SEER已在10亿个公共(非欧盟)Instagram图像上进行了预先培训,并且能够在数据零件之间进行推断,这与大多数从预先标记的数据集中学习的简历模型不同,冒险节拍。
“与其他研究领域一样,自我监督的学习对计算机视觉的未来有着不可思议的影响。消除对人类注释的需求,使计算机视觉社区能够与更大,更多样化的数据集一起工作,从随机的公众图像中学习,并可能减轻一些偏见,从而使图像有限地进行构建。像医学成像一样,没有任何劳动来进行标签,可以更快地创建和部署模型,从而更快,更准确地回应快速发展的情况Facebook在博客文章中写道。
据信,自学是远离机器学习和人类水平智能的关键。它可以改善语音和对象识别以及其他AI应用。一系列与数据集收集和注释还困扰着生物识别的开发,特别是在面部识别方面。
Instagram的服务条款允许公司使用几乎任何方式上传到它的数据,但是OneZero注意,避免欧洲用户的图像可能是试图避免GDPR掉下来的。
图像不像单词那样结合语义概念,因此设计一个能够做出这些推论的模型需要Facebook研究人员使用卷积网络(Convnet),该网络足够大,可以从图像中学习所有视觉概念。由于数据集不使用标签,因此Facebook计划每90天自动使用新图像自动填充它。
Seer的开发包括使用几个建筑组成部分;一种称为SWAV的超快速算法以及Regnets(Convnet);能够在不损害运行时间或准确性的情况下扩展数十亿个参数。根据Facebook的说法,该模型的表现优于最先进的最先进的自我监督系统。
Facebook软件工程师Priya Goyal说,Instagram的数据政策中说明了使用个人的Instagram图片进行研究,因此人们没有机会选择退出此数据使用。但是,Goyal提到Facebook不打算由于潜在的偏见而共享图像或Seer模型本身,进一步介绍了研究论文。
Facebook涉及有关多项诉讼收集和使用个人的生物识别数据,据称是未能通知用户收集数据并获得明确的同意。
文章主题
人工智能|生物识别技术|计算机视觉|数据保护|数据集|Facebook|面部识别|Instagram|对象识别|语音识别|训练