Facebook宣布開發一種新的計算機視覺模型,名為Seer(自我監督)。 SEER已在10億個公共(非歐盟)Instagram圖像上進行了預先培訓,並且能夠在數據零件之間進行推斷,這與大多數從預先標記的數據集中學習的簡歷模型不同,冒險節拍。
“與其他研究領域一樣,自我監督的學習對計算機視覺的未來有著不可思議的影響。消除對人類註釋的需求,使計算機視覺社區能夠與更大,更多樣化的數據集一起工作,從隨機的公眾圖像中學習,並可能減輕一些偏見,從而使圖像有限地進行構建。像醫學成像一樣,沒有任何勞動來進行標籤,可以更快地創建和部署模型,從而更快,更準確地回應快速發展的情況Facebook在博客文章中寫道。
據信,自學是遠離機器學習和人類水平智能的關鍵。它可以改善語音和對象識別以及其他AI應用。一系列與數據集收集和註釋還困擾著生物識別的開發,特別是在面部識別方面。
Instagram的服務條款允許公司使用幾乎任何方式上傳到它的數據,但是OneZero注意,避免歐洲用戶的圖像可能是試圖避免GDPR掉下來的。
圖像不像單詞那樣結合語義概念,因此設計一個能夠做出這些推論的模型需要Facebook研究人員使用卷積網絡(Convnet),該網絡足夠大,可以從圖像中學習所有視覺概念。由於數據集不使用標籤,因此Facebook計劃每90天自動使用新圖像自動填充它。
Seer的開發包括使用幾個建築組成部分;一種稱為SWAV的超快速算法以及Regnets(Convnet);能夠在不損害運行時間或準確性的情況下擴展數十億個參數。根據Facebook的說法,該模型的表現優於最先進的最先進的自我監督系統。
Facebook軟件工程師Priya Goyal說,Instagram的數據政策中說明了使用個人的Instagram圖片進行研究,因此人們沒有機會選擇退出此數據使用。但是,Goyal提到Facebook不打算由於潛在的偏見而共享圖像或Seer模型本身,進一步介紹了研究論文。
Facebook涉及有關多項訴訟收集和使用個人的生物識別數據,據稱是未能通知用戶收集數據並獲得明確的同意。
文章主題
人工智慧|生物識別技術|計算機視覺|數據保護|數據集|Facebook|面部識別|Instagram|對象識別|語音識別|訓練