机器视觉中的研究伦理需要一些关注

2020-10-30

AI社区谈论道德规范，但怀疑论者对其步行感兴趣。至少对于机器视觉研究人员而言，展示负责任的行为有改善的余地。

一篇文章出版普林斯顿大学IT政策中心本月发出了一个有争议的（尽管有影响力）的视频数据集，该视频数据集于2019年6月被删除，但仍在继续。

至少有135篇研究论文使用了有关数据集，即杜克大学的产品，杜克MTMC（多目标，多摄像机），因为它是撤回2019年5月。

普林斯顿博客文章使用Duke MTMC集来说明人们容易访问已撤回的粗略视觉数据集的更广泛的问题。

在批评之后，微软撤回了MS-Celeb的方式也可以找到它，但据报道，它可以在学术洪流中找到，根据普林斯顿邮报的合着者之一Arvind Narayanan。

Narayanan写道，MS-CELEB数据集是MS1M-iBUG，MS1M-ARCFACE和MS1M-RETINAFEACE的一部分，所有这些数据集都在开放和可用。

同时，Duke数据是2014年的监视视频。根据面部识别博客Megapixels的说法，数据集最常用于开发人员重新识别，视频跟踪和低分辨率的面部识别系统。

（Megapixels的2016年撤销事件已详细介绍，并且值得一读）

目前尚不清楚数据集中捕获的2,000名杜克大学学生中有多少人知道他们会出现在已成为MTMC的多相机录像中。还有其他原因仍然存在争议。

生物识别技术供应商工作的研究人员感觉网和Senstime使用了杜克MTMC数据集，并在2018年写了有关他们的重新识别实验的文章。据称，供应商有助于中国政府镇压Uighur穆斯林。众所周知，数十家中国公司及其军事公司在中国使用了该算法。

普林斯顿的IT政策中心文章指出，当今的视频数据集由其他研究人员复制，并在新数据集中进行了一些修改。其中一些所谓的派生数据集本身已被撤回，但不是全部。

该中心说：“在一起的数据的可用性以及研究人员和审稿人允许使用的意愿，使MTMC仅对道德问题的响应进行了删除。”

该中心的文章呼吁更具道德决策相关的研究和发展。还需要一种方法来防止派生的集合用于不道德研究。作者应该考虑解决此问题的许可。

文章主题