IBM計劃在今年秋天提供超過一百萬張圖像的世界上最大的面部屬性和身份培訓,以幫助改善人工智能面部識別系統的培訓,並減少算法的偏見。
IBM在一個數據集中說的數據集博客文章是當前可用的最大的五倍,將用屬性和身份信息註釋,並使用Flickr Geo-Tag從不同國家 /地區繪製的圖像,並用主動學習工具減輕樣本選擇偏見。雖然當前可用的數據集包含屬性,例如髮色或標籤,以識別多個圖像是同一個人的屬性,但IBM的新集合將兩者都包括在內。在種族,性別和年齡之間,具有36,000個面部圖像平均分佈的數據集也將被專門發布,以幫助識別和解決偏見。
“隨著人工智能的採用的增加,防止偏見進入AI系統的問題正在增加判斷,直覺和專業知識。高級創新的能力,例如AI,不僅在於它們的增強能力,而不是替換,人為製定的能力。因此,對於使用AI的任何組織,包括識別能力或視頻分析能力,包括與IT的bbias and It compias and It It It compias and It It compias compias and It It compias and It It compias and It compias and It compias and It It compias compias and It It compias compias and It compias compias and It It compias,並涉及其依賴的偏見。如何解決它。”
據《郵報》報導,IBM今年早些時候表明,其面部分析的Watson視覺識別服務的錯誤率降低了近十倍。
IBM是面部識別提供者之一錯誤率的主要差異今年早些時候不同人口的人之間。
微軟是另一位帶有算法的面部識別提供者在同一測試中證明了偏見,剛剛宣布了一個面部識別算法的能力顯著改善認識到膚色深色的人的性別,因為它試圖解決同一問題。