NSFW圖像和視頻都圍繞著網絡,但是沒有人很幼稚,無法認為人類用戶負責標記工作不友好的內容。
Yahoo確保其神經網絡精通檢測和分類內容,這些內容具有一些(更多)額外的裸露,因此用戶不必花一個小時來向HR解釋他們在“該”頁面上所做的事情。
雅虎工程師Jay Mahadeokar和Gerry Pesavento認為現在該是開發人員的時候了要得到免費訪問機器學習源代碼,該源代碼可以從LOLCATS中刪除NSFW。
應該提到的是,雅虎的算法只是解決方案的一部分。事實是,從無辜的圖像中告訴NSFW是一項真正艱鉅的任務,至少在編程軟件以正確地進行操作時。人類可以輕鬆地做到這一點,但是他們的觀點和敏感性很難嵌入一行。
在雅虎部署算法之前,機器的時間艱難地講述了色情圖像的裸繪畫,但是由於科技公司的貢獻,他們現在能夠展示文藝復興時期的藝術而不會引起人們的注意。
神經網絡是對圖像進行分類的理想工具,這是過去幾年由標準和醫學可視化研究證明的。這個想法是,神經網絡利用了一個充滿特定圖像的大型數據庫,這有助於其算法學習如何發現相似的圖像。對於狗來說,它們檢測到尾巴和鼻子,對於汽車,他們識別車輪和烤架。對於NSFW圖像,圖案是相同的,可能具有更少的烤架和更多的尾巴。
結果是一個系統,可以過濾大量圖像,並以從0到1、0的比例得分,而無染原罪,1對於使水手臉紅的東西1。
拋光圖像識別機制的效用遠遠超出了簡單的審查制度和使事情保持專業的範圍。色情圖像在互聯網上有一個良好的位置,但是在處理大型數據集時,將其放在一邊也同樣重要。
其他公司(例如Apple和Google)已經在製作自己的圖像分類算法,其中一些公司很好地適合作為移動環境中的分類工具。
此類系統也可以部署進行電子郵件檢查,任何曾經被朋友惡作劇的人在工作電子郵件中發送厚臉皮照片的人都知道這意味著什麼。
想要給算法的開發人員旋轉下載它來自Github,Yahoo博客文章提供了其他詳細信息。
不過,要記住的一件事是:編碼人員將必須使用自己的Smut數據庫。