深度學習的面部表徵使當前的面部識別系統能夠成功。
儘管面部識別系統表示能夠編碼個人的身份,但是最近的作品表明其中存儲了很多信息。
由歐洲生物識別協會(EAB)由Fraunhofer IGD的研究科學家PhilippTerhörst領導,週二檢查了這些問題。
演講表明,嵌入了多少軟生物特徵屬性中,這些屬性通常與面對驗證性能。
該活動分為三個部分,每個部分都回答了一個不同的問題。
面部模板中存儲了哪些信息?
根據Terhörst的說法,存儲在面部生物特徵模板中的主要信息包括人口統計學,圖像特徵和社會特徵。
Fraunhofer IGD科學家進行的研究分析了兩個面部模板,涉及113個屬性,並得出結論,可以很容易地預測其中74個屬性,尤其是非任務。
FaceNet(2015)模板中存儲的信息:Creditterhörst等
Terhörst通過訓練大量的屬性分類器(MAC)來共同預測多個屬性,例如面部形狀,鬍鬚類型,以及個人是否戴口紅。
實驗期間測試的生物特徵算法是LFW和Celeba。 Terhörst的團隊分析了13,000張來自5000多人的圖像,並從LFW中分析了多達73個屬性註釋。 Celeba測試考慮了一萬名名人和40個二進制屬性的200,000張圖像。
存儲在Arcface(2019)模板中的信息:信用:Terhörst等
測試是通過面部和街道嵌入進行的,並表明頭姿勢和社會特徵是最容易預測的。
面部幾何形狀,鼻子和圖像質量等也可以預測,而皮膚,口腔和環境是最難預測的特徵。
它與面部識別中的公平性有何關係?
為了評估這些偏見,Terhörst開始分析軟性測量屬性對面部識別算法的性能的影響,尤其是Arcface和FaceNet。
為此,科學家的團隊使用了一個名為Maad-Face的數據庫,其中包含大量的面部圖像,其中包含多個和高質量的屬性註釋。
其中包括每個屬性的六個正/陰性對照組,這些組是通過從數據庫中隨機選擇樣本而創建的。這些合成組的樣品數量與它們的正/負相對物相同。
Terhörst解釋說:“例如,如果我們有一萬個帶有眼鏡的樣本圖像,而沒有九萬的樣品圖像,則對於正面對照組而言,我們只會尋找隨機選擇的一萬個樣品,而對於隨機選擇的負面對照組而言,我們只會尋找一萬一。”
通過對照組分析兩種面部識別算法的結果表明,在人口統計學方面,中年,老年人,白人和男人的識別準確率比年輕,亞洲,黑人和女性更高。
當涉及與可見性相關的屬性時,完全可見的額頭,降低髮際線,禿頭,不耐眼鏡的個體比額頭,劉海,眼鏡和波浪形的頭髮更高的精度率更高。
帽子,耳環,口紅和眼鏡等臨時屬性也降低了面部識別算法的精確度,而拱形的眉毛,大或尖頭的鼻子,濃密的鼻子,濃密的眉毛,雙下巴和高che骨負責更高的精度。
這兩種算法在微笑的面孔和嘴巴上的得分也更好,而不是個人的非中性表情。根據Terhörst的說法,這可能是由於數據庫中的大量圖像來自微笑的名人。
其他偏見考慮了用戶的頭髮和眼睛顏色的顏色,以及是否有鬍鬚。
如何減輕面部識別的偏見?
在面部模板中了解編碼的信息可能有助於開發偏置降低解決方案Terhörst解釋說,進入網絡研討會的第三部分。
但是,根據科學家的說法,以前在該領域的作品需要事先使用與偏見有關的屬性的標籤,並且只能減輕特定的偏見。
據報導,這些動作也已知可以降低面部識別算法的整體性能,並在整合到現有系統中的目前困難。
傳統系統的可能替代方法是公平得分歸一化(FNS)。 Terhörst解釋說,該技術可以在未標記的數據上運行,並有效地減輕了未知來源的偏見。
據稱,FN還可以大大提高面部識別系統的性能,並可以輕鬆地集成到現有系統中。
FNS的工作原理。圖片來源:Terhörst等人
Terhörst隨後通過聽眾的問題結束了這一事件。
網絡研討會是EAB虛擬活動系列的一部分生物識別系統中的人口公平。註冊仍然可用於3月15日至30日的活動給EAB成員和非會員,為會員帶來折扣。
文章主題
演算法|弧形|生物識別數據|生物識別識別|生物識別模板|生物識別技術|生物識別研究|數據集|人口公平|EAB|歐洲生物識別協會|面部|面部識別|訓練