語音學已經開發了一種語音識別模型,它說,它提高了理解通常在自然語言處理(NLP)系統(例如非洲裔美國人和兒童)中挑戰的群體的準確性。
根據公司公告,新的自主語音識別軟件應用了最新的深度學習技術,並介紹了Specuctmatics的突破性自我監督模型。
該公司指的是斯坦福大學的“語音識別中的種族差異”研究,顯示的非洲裔美國人使用Google和Amazon模型的總體準確率低於70%,並表示其新軟件為非裔美國人的聲音提供了82.8%的整體準確性。言語說法,這種差異相當於減少45%的誤差,平均每句話約三個單詞。
根據言語的方式,根據語音培訓,缺乏上述算法培訓的手動標記或標記數據導致語音識別的準確性缺乏司空見慣。該公司表示,它通過培訓其從互聯網上的大量未標記數據(例如播客和社交媒體內容)培訓其算法來完全避免了問題。語音商品收集了110萬小時的音頻,以替換30,000小時的數據集。
語言學說,根據開源的共同語音項目,其技術在理解兒童的聲音方面的準確性為91.8%,而Google的技術為83.4%,Deepgram為82.3%。
“我們的使命是傳遞下一代機器學習能力,並提供更具包容性和可訪問的語音技術,” Speckmatics首席執行官評論說。凱蒂·威格達爾(Katy Wigdahl)。 “今天的公告是實現這一任務的巨大一步。
“我們對解決AI偏見的關注導致了語音識別行業的這一巨大飛躍,並且連鎖反應將導致多種不同情況的變化。想想我們在社交媒體上看到的不正確字幕,法院聽證會,單詞被誤導性和電子性平台在整個過程中都陷入困境。
2021年初的語音學報告強調了語音生物識別技術對獲得最大價值的重要性語音應用程序。