语音学已经开发了一种语音识别模型,它说,它提高了理解通常在自然语言处理(NLP)系统(例如非洲裔美国人和儿童)中挑战的群体的准确性。
根据公司公告,新的自主语音识别软件应用了最新的深度学习技术,并介绍了Specuctmatics的突破性自我监督模型。
该公司指的是斯坦福大学的“语音识别中的种族差异”研究,显示的非洲裔美国人使用Google和Amazon模型的总体准确率低于70%,并表示其新软件为非裔美国人的声音提供了82.8%的整体准确性。言语说法,这种差异相当于减少45%的误差,平均每句话约三个单词。
根据言语的方式,根据语音培训,缺乏上述算法培训的手动标记或标记数据导致语音识别的准确性缺乏司空见惯。该公司表示,它通过培训其从互联网上的大量未标记数据(例如播客和社交媒体内容)培训其算法来完全避免了问题。语音商品收集了110万小时的音频,以替换30,000小时的数据集。
语言学说,根据开源的共同语音项目,其技术在理解儿童的声音方面的准确性为91.8%,而Google的技术为83.4%,Deepgram为82.3%。
“我们的使命是传递下一代机器学习能力,并提供更具包容性和可访问的语音技术,” Speetmatics首席执行官评论说。凯蒂·威格达尔(Katy Wigdahl)。 “今天的公告是实现这一任务的巨大一步。
“我们对解决AI偏见的关注导致了语音识别行业的这一巨大飞跃,并且连锁反应将导致多种不同情况的变化。想想我们在社交媒体上看到的不正确字幕,法院听证会,单词被误导性和电子性平台在整个过程中都陷入困境。
2021年初的语音学报告强调了语音生物识别技术对获得最大价值的重要性语音应用程序。