AI社区谈论道德规范,但怀疑论者对其步行感兴趣。至少对于机器视觉研究人员而言,展示负责任的行为有改善的余地。
一篇文章出版普林斯顿大学IT政策中心本月发出了一个有争议的(尽管有影响力)的视频数据集,该视频数据集于2019年6月被删除,但仍在继续。
至少有135篇研究论文使用了有关数据集,即杜克大学的产品,杜克MTMC(多目标,多摄像机),因为它是撤回2019年5月。
普林斯顿博客文章使用Duke MTMC集来说明人们容易访问已撤回的粗略视觉数据集的更广泛的问题。
在批评之后,微软撤回了MS-Celeb的方式也可以找到它,但据报道,它可以在学术洪流中找到,根据普林斯顿邮报的合着者之一Arvind Narayanan。
Narayanan写道,MS-CELEB数据集是MS1M-iBUG,MS1M-ARCFACE和MS1M-RETINAFEACE的一部分,所有这些数据集都在开放和可用。
同时,Duke数据是2014年的监视视频。根据面部识别博客Megapixels的说法,数据集最常用于开发人员重新识别,视频跟踪和低分辨率的面部识别系统。
(Megapixels的2016年撤销事件已详细介绍,并且值得一读)
目前尚不清楚数据集中捕获的2,000名杜克大学学生中有多少人知道他们会出现在已成为MTMC的多相机录像中。还有其他原因仍然存在争议。
生物识别技术供应商工作的研究人员感觉网和Senstime使用了杜克MTMC数据集,并在2018年写了有关他们的重新识别实验的文章。据称,供应商有助于中国政府镇压Uighur穆斯林。众所周知,数十家中国公司及其军事公司在中国使用了该算法。
普林斯顿的IT政策中心文章指出,当今的视频数据集由其他研究人员复制,并在新数据集中进行了一些修改。其中一些所谓的派生数据集本身已被撤回,但不是全部。
该中心说:“在一起的数据的可用性以及研究人员和审稿人允许使用的意愿,使MTMC仅对道德问题的响应进行了删除。”
该中心的文章呼吁更具道德决策相关的研究和发展。还需要一种方法来防止派生的集合用于不道德研究。作者应该考虑解决此问题的许可。