查看下面的照片并尝试准确确定它的拍摄地点 - 您有 20 秒的时间,并且该文件不包含任何 GPS 数据(答案在文章末尾)。在缺乏易于识别的元素(例如埃菲尔铁塔)的情况下,承认这项任务是艰巨的。

PlaNet 则不然,Google 推出的图像地理定位识别项目技术评论。尽管尚未真正可靠,但该研究计划已经比人类更有效率。他学得很快。
学习阅读照片
由致力于视觉的计算机程序专家领导,托比亚斯·韦安德,PlaNet 程序是深度学习软件,这意味着它不只是执行任务,它还会随着时间的推移而学习并不断改进。
为了让 PlaNet 学习东西,我们必须给它图像来学习。噢,一根稻草:专门用于这项任务的地理定位图像数据库包含不少于 1.26 亿张照片。 Weyand 先生的团队将该数据库分为第一部分,其中包含 9100 万张照片用于训练,其余部分用于比较其分析结果。
大陆级别的成功率接近 50%
Google 团队将地球划分为 26,000 个区域,其大小根据镜头的密度而变化(城市区域较小),PlaNet 开始发挥作用。他还面临着来自 Flickr 的 230 万张带有地理标签的图片。结果相当有希望:PlaNet 的大陆尺度图像定位精度已经达到 48% - 尝试区分布基纳法索道路的红土和澳大利亚灌木丛的红土!
很年轻就已经比我们优秀了
下一步是与人类,10名精心挑选的旅行者的对抗。
尽管该程序还很年轻,但它在与人类进行的 50 轮 GeoGuess 游戏中赢得了 28 场,同时事实证明它更加精确:当人类的平均地理定位精度为 2,320 公里时,PlaNet 的平均定位精度是人类的两倍,仅为 1131 公里。你也可以玩“那是哪里?”的游戏。转到项目页面geoguessr.com。
很快就会出现在智能手机上?
如果它只能在超级计算机上运行,那么 PlaNet 就只是一个像其他程序一样的研究程序。但据其设计者称,该软件仅占用 377 MB RAM,因此可以在智能手机上运行!
如果它不能更精确地说明永久访问数据库的需要或所需的处理器能力,那么在未来几年中,您的智能手机在分析数据方面可能会变得比您更智能、更相关。图像。这既令人兴奋又令人恐惧。
哦,我差点忘了:文章开头的照片是在印度北部喜马拉雅地区拉达克州的森吉拉山口拍摄的。不确定 PlaNet 是否已为这些地区做好准备……