arkx很好已經與感官將其聲音和麵對生物識別工具納入ARKX的Aerto Avery Words無觸摸語音解決方案中。
現在,Biometrics Collaboration現在將使ARKX客戶能夠訪問“始終聆聽”和自然語言的無觸摸控制功能,包括支持20多種語言的支持,一個預設的喚醒單詞庫以及創建自定義語言的能力。
ARKX首席執行官Eric Bauswell解釋說:“品牌越來越想為客戶創造自己的品牌語音體驗。”
他補充說:“使用感官,我們集成了一系列強大的高級功能,使OEM能夠破壞'足夠好'的現狀,以便為客戶提供尖端的語音識別性能。”
從技術角度來看,每個單詞的Ultra Portfolio由音頻前端(AFE)語音處理模塊,集成的語音模塊(SOM +音頻板W/AFE)和Amazon Voice Service(AVS)開發套件組成。
先進的音頻和語音技術支持人類對人類和人與人之間的語音識別。
Biometrics公司Sensory的首席執行官Todd Mozer評論說:“語音採用量繼續迅速增長,品牌一直在探索簡化便捷語音UX的過程中的方法。”
典型的部署包括消費電子,家用電器,機器人技術,汽車,可穿戴設備,玩具和物聯網(物聯網)。
Mozer總結說:“與ARKX Labs合作為行業提供了一個旋轉的解決方案,可以將高級語音識別功能集成到其產品中,以使OEM品牌特定的喚醒單詞和其他有吸引力的高級功能集。”
夥伴關係是在感官之後數週發布Beta版本其新的人工智能(AI-)AS-A-Service平台。
STC報告了強大的NIST SRE21結果
語音技術中心美國國家標準技術研究所在生物識別揚聲器識別測試中宣布了強勁的表現。
對於NIST 2021揚聲器識別挑戰(SRE),對語音識別算法的表現評估了對話性電話演講,視頻和視頻的音頻,而STC結合了在後一種情況下使用面部和語音生物識別的STC來識別揚聲器。
1月26日的更新排行榜在最小工作點(MIN_C)為0.074,實際操作點(ACT_C)為0.079,以2.48%的誤差率(EER)列出STC第二。
STC表示,它是成功合併變壓器和WAV2VEC機器學習模型的最早生物識別提供商之一。變壓器模型通常用於計算機視覺和自然語言處理,而WAV2VEC是常見的語音識別模型類型。根據公告,他們的組合可以最大程度地減少說話者認可的錯誤。
語音技術中心首席執行官Dmitriy Dyrmovskiy說:“語音分析提供了對客戶滿意度和對話質量的見解。” “此外,高質量的演講者的認可對於全國生物特徵系統至關重要。NISTSRE21是2021年的第五次競賽,在這裡,言語技術的解決方案是由國際專家的陪審團獲得了很高的分數。語音技術的陪審團很高。在國際比賽中,對於我們的個人成就而言,我們在全球範圍內都在國際比賽中認識到一項競爭者,這是全球範圍的探討,這是全球範圍的探討。通過正確展示我們在全球市場上的核心競爭力來達到一個新的水平。”
言語釋放語音識別報告
2022年語音報告涵蓋了與語音生物識別技術有關的各種主題,包括1950年代直到大流行的語音技術歷史。
該文檔包括來自行業專家,產品專家和機器學習工程師的見解,特別關注AI偏見和語音技術的未來。
根據該報告,到2024年,估計有84億個設備將使用語音助手,並且在2021年至2026年之間,語音到文本API市場可能以19.2%的複合年增長率(CAGR)增長。
在關鍵數據發現中,語音學據稱,說話者診斷的準確性提高(根據說話者身份將輸入音頻流劃分為均質段的過程)是未來三年中最需要的功能,並且將近80%被調查的人認為數據隱私和安全性被視為非常高的優先級。
就AI偏見而言,該報告在方言和口音中發現了主要問題,根據被調查的人,這些問題佔案件的50%以上。
報告寫道:“如果我們將培訓模型接觸到不同的聲音,那麼它應該熟悉它們。儘管這不是治療方法,但暴露對於減少AI偏見至關重要。”
此外,語音方法還說,儘管數據並不是解決AI偏見的唯一方法,但這是一個重要因素。
“這就是為什麼自我監督學習的原因(已經證明了可以訓練的數據量取得成功)是提高自動語音識別準確性(ASR)的重要因素。”
並根據文件自我監督的學習不僅是對AI偏見的解決方案,而且是語音識別的未來。
“隨著我們的未來,我們可以清楚地看到更多的數據要訓練,整個行業中有更大的變化的機會 - 可以聽到越來越多的聲音和語言,” Speckmatics的準確性負責人約翰·休斯(John Hughes)寫道。
這語音報告2022在語音網站上公開可用。