查看下面的照片並嘗試準確確定它的拍攝地點 - 您有 20 秒的時間,並且該文件不包含任何 GPS 數據(答案在文章末尾)。在缺乏易於識別的元素(例如艾菲爾鐵塔)的情況下,承認這項任務是艱鉅的。

PlaNet 則不然,Google 推出的影像地理定位辨識項目技術評論。儘管尚未真正可靠,但該研究計劃已經比人類更有效率。他學得很快。
學習閱讀照片
由致力於視覺的電腦程式專家領導,托比亞斯‧韋安德,PlaNet 程式是深度學習軟體,這意味著它不只是執行任務,它還會隨著時間的推移而學習並不斷改進。
為了讓 PlaNet 學習東西,我們必須給它圖像來學習。噢,一根稻草:專門用於這項任務的地理定位圖像資料庫包含不少於 1.26 億張照片。 Weyand 先生的團隊將資料庫分為第一部分,其中包含 9,100 萬張照片用於訓練,其餘部分用於比較其分析結果。
大陸級別的成功率接近 50%
Google 團隊將地球劃分為 26,000 個區域,其大小根據鏡頭的密度而變化(城市區域較小),PlaNet 開始發揮作用。他還面臨來自 Flickr 的 230 萬張帶有地理標籤的圖片。結果相當有希望:PlaNet 的大陸尺度影像定位精度已達到 48% - 嘗試區分佈吉納法索道路的紅土和澳洲灌木叢的紅土!
很年輕就已經比我們優秀了
下一步是與人類,10位精心挑選的旅行者的對抗。
儘管該節目還很年輕,但它在與人類進行的50 輪GeoGuess 遊戲中贏得了28 場,同時事實證明它更加精確:當人類的平均地理定位精度為2,320 公里時,PlaNet 的平均定位精度是人類的兩倍,僅1131 公里。你也可以玩「那是哪裡?」的遊戲。前往專案頁面geoguessr.com。
很快就會出現在智慧型手機上?
如果它只能在超級電腦上運行,那麼 PlaNet 就只是一個像其他程式一樣的研究程式。但據其設計者稱,該軟體僅佔用 377 MB RAM,因此可以在智慧型手機上運行!
如果它不能更精確地說明永久存取資料庫的需要或所需的處理器能力,那麼在未來幾年中,您的智慧型手機在分析資料方面可能會變得比您更聰明、更相關。這既令人興奮又令人恐懼。
哦,我差點忘了:文章開頭的照片是在印度北部喜馬拉雅地區拉達克州的森吉拉山口拍攝的。不確定 PlaNet 是否已為這些地區做好準備…