随着计算机科学家Anshumali Shrivastava领导的赖斯大学研究人员在社交媒体上传播了如此多的错误信息,开发了一种使用机器学习(ML)的方法,以防止在线上传播错误信息。
这新方法由Shrivastava及其团队开发的2020年神经信息处理系统会议(Neurips 2020)在线举行。他们改进了5史历史的Bloom过滤技术,用于扫描社交媒体帮助社交媒体网络公司阻止假新闻在其平台上传播。
Shrivastava和Dai使用一些Twitter数据解释了他们的过滤方法。根据Twitter的说法,每天发送大约5亿条推文,通常在用户按发送后仅一秒钟就发布了推文。但是,考虑到一秒钟的延迟,Twitter期间,Twitter每秒收到约10,000条推文,相当于每毫秒六个推文。
Shrivastava告诉免费媒体日记。
研究人员指出,在发送标记的推文进行另一项手动审查并通常将错误标记的真实推文降至最低时,假阳性率低也很重要。
Shrivastava说:“如果您的假阳性速率低至0.1%,即使那样,您也会错误地标记每秒10条推文,每天超过800,000个,以进行手动审查。”
尽管Twitter并未透露它如何过滤推文,但研究人员认为,社交媒体巨头使用了Bloom Filter,该过滤器于1970年开发。Bloom过滤器可以找到与数据库相匹配的所有代码,但也会产生一些误报结果。
Shrivastava指出,研究人员一直在使用机器学习提出各种方法,以提高Bloom过滤器的效率。
这归技术时代拥有
由CJ Robles撰写