Facebook启动了一个新的人工智能系统,以更好地了解通常在其平台上发布的模因并确定令人反感的模因。
根据博客文章,Facebook强调了该系统的需求,因为它的平台被包含各种形式的文本的照片淹没,无论是在模因中的图像上覆盖还是在餐厅菜单的照片中镶嵌。
Facebook是不知所措每天分享的照片量很大,理解图像中的文字给社交媒体公司带来了一个巨大的问题。 Facebook已经具有传统的光学特征识别(OCR)系统,它使其能够识别字符,但无法理解相关图像的上下文。
为了解决这个问题,Facebook创建并部署了一个名为Rosetta的大型机器学习系统。 AI有能力每天和实时从Facebook和Instagram上的图像和视频帧中提取文本。然后,该系统将其输入到经过训练和设计的文本识别模型中,以便一起了解文本和图像的上下文。
系统如何从图像中提取文本
Facebook通过检测和识别在图像上进行文本提取。在检测中,该平台检测可能包含文本的矩形区域,而识别涉及卷积神经网络(CNN),该卷积神经网络(CNN)有助于识别和抄录该地区的单词。
该平台还采用了基于更快的R-CNN的系统以进行文本检测。更快的R-CNN是一个最先进的对象检测网络,同时执行检测和识别,这将使Facebook能够更好地理解模因中的文本并确定它们是否令人反感。
根据Facebook,从图像中提取的文本用于改善质量和相关性的照片搜索,同时自动查明哪些内容违反该平台的仇恨言论政策以不同的语言。该系统还将通过提供更多个性化的内容来帮助改善用户的新闻提要。
罗塞塔(Rosetta)被不同的Facebook产品广泛使用
目前,Facebook透露,Rosetta已经在其平台和Instagram中的各种产品和程序广泛使用。 Facebook承认,如果面临着在平台中共享的图像和视频涌入的艰苦奋斗,但创建了一个AI系统是一个好的开始。
Facebook补充说,从图像和视频中提取文本对公司来说是一个令人兴奋的挑战,因为人们正在寻找更多通过社交媒体平台以不同形式和语言共享内容的方法。