一家软件公司声称已经组装了一个500,000票的数据集,该数据集说,它不仅是“合法清洁”并且适用于生物识别技术,而且是有史以来最大的收藏品。
标准增强方法可以将总数提高到200万。无聊,迄今为止,这集中在合成介质上。
真实人的高分辨率,原始照片带有生物识别版本,使其可以用于AI培训。
训练有素的专业人士在绿色屏幕背景的工作室中拍摄了照片。机器学习专业人员坐在会议上,以帮助捕获最适合机器学习的图像。同意和捕获过程在Youtube 视频。
这是一个人咬人的故事,因为机器学习行业又被一个数据集SNAFU烧毁了,随后又被证明了偏见。
尽管Vaisual的数据集,但趋势可能是仍在走向 合成的主题。就是说,Vaisual最终可能表明,可以在不将公司倒闭的情况下收集真实人的培训数据库(具有其优势)。
文章主题
人工智能|生物识别数据|生物识别技术|数据集|伦理|面部照片|机器学习|研发|无聊