作者: Will Douglas Heaven 编译: 深潮 TechFlow 深潮导读: Niantic 把 Pokémon Go 玩家拍下的 300 亿张城市照片变成了一门新生意。它的 AI 子公司 Niantic Spatial 用这些数据训练了一套视觉定位系统,能把定位精度做到厘米级,远超 GPS 在城市峡谷中作者: Will Douglas Heaven 编译: 深潮 TechFlow 深潮导读: Niantic 把 Pokémon Go 玩家拍下的 300 亿张城市照片变成了一门新生意。它的 AI 子公司 Niantic Spatial 用这些数据训练了一套视觉定位系统,能把定位精度做到厘米级,远超 GPS 在城市峡谷中

Pokémon Go 的 300 亿张照片,正在教送餐机器人认路

2026/03/12 03:18
阅读时长 13 分钟
如需对本内容提供反馈或相关疑问,请通过邮箱 crypto.news@mexc.com 联系我们。
从抓皮卡丘到送披萨,这可能是众包数据最意外的商业化路径之一。

作者: Will Douglas Heaven

编译: 深潮 TechFlow

深潮导读: Niantic 把 Pokémon Go 玩家拍下的 300 亿张城市照片变成了一门新生意。它的 AI 子公司 Niantic Spatial 用这些数据训练了一套视觉定位系统,能把定位精度做到厘米级,远超 GPS 在城市峡谷中的表现。第一个大客户是送餐机器人公司 Coco Robotics。从抓皮卡丘到送披萨,这可能是众包数据最意外的商业化路径之一。

全文如下:

Pokémon Go 是全球第一款现象级 AR 游戏。2016 年由 Google 子公司 Niantic 发布,这款在宝可梦 IP 基础上叠加增强现实玩法的游戏迅速席卷全球。从芝加哥到奥斯陆到江之岛,玩家们涌上街头,期盼能抓到一只胖丁、杰尼龟,或者(运气爆棚的话)一只超稀有的伽勒尔闪电鸟——它们悬浮在现实世界之上,就差一点点够不到。

简单说,这意味着海量的人拿着手机对着海量的建筑物拍照。「五亿人在 60 天内装了这个 App」,Niantic Spatial 的 CTO Brian McClendon 说。Niantic Spatial 是 Niantic 去年 5 月拆分出来的 AI 公司。据游戏公司 Scopely(同期从 Niantic 手中收购了 Pokémon Go)的数据,这款游戏在 2024 年仍有超过 1 亿活跃玩家,距发布已经过去了 8 年。

现在,Niantic Spatial 正在利用这座无与伦比的众包数据宝库——来自全球数亿 Pokémon Go 玩家手机的城市地标照片,附带超精确的位置标记——来构建一种世界模型(World Model)。这是当前的热门技术方向,目标是把 LLM 的智能锚定在真实世界环境中。

该公司最新的产品是一个模型:只需要几张建筑物或其他地标的快照,就能把你在地图上的位置精确到几厘米之内。他们想用它帮助机器人在 GPS 不可靠的地方实现更精准的导航。

作为技术的第一次大规模验证,Niantic Spatial 刚刚与 Coco Robotics 达成合作。Coco 是一家在美国和欧洲多个城市部署最后一公里送餐机器人的创业公司。「大家都觉得 AR 是未来,AR 眼镜就要来了」,McClendon 说,「结果机器人先成了用户。」

从皮卡丘到送披萨

Coco Robotics 在洛杉矶、芝加哥、泽西城、迈阿密和赫尔辛基部署了大约 1000 台行李箱大小的机器人,能装下最多 8 个超大披萨或 4 袋杂货。据 CEO Zach Rash 介绍,这些机器人迄今完成了超过 50 万次配送,在各种天气条件下累计行驶了数百万英里。

但要和人类骑手竞争,Coco 的机器人(在人行道上以大约每小时 5 英里的速度行驶)必须足够可靠。「我们最好的工作方式,就是在告诉你的那个时间准时到达」,Rash 说。这意味着不能迷路。

Coco 面临的问题是没法依赖 GPS。在城市里,无线电信号在建筑物之间反弹、互相干扰,GPS 信号很弱。「我们在很多有高层建筑、地下通道和高架桥的密集区域做配送,这些地方 GPS 基本上从来不好使」,Rash 说。

「城市峡谷是 GPS 在全世界表现最差的地方」,McClendon 说。「你看手机上那个蓝点,经常会漂 50 米,直接把你放到另一个街区、另一个方向、马路的另一边。」这就是 Niantic Spatial 要解决的问题。

过去几年,Niantic Spatial 一直在整理 Pokémon Go 和 Ingress(Niantic 2013 年发布的上一款手机 AR 游戏)玩家产生的数据,构建一套视觉定位系统(Visual Positioning System)——通过你看到的东西来判断你在哪里。「让皮卡丘真实地在街上跑来跑去,和让 Coco 的机器人安全精确地穿过城市,本质上是同一个问题」,Niantic Spatial CEO John Hanke 说。

「视觉定位不是什么新技术」,数字地图和地理空间分析公司 ESRI 的 Konrad Wenzel 说,「但很明显,外面的摄像头越多,它就越好用。」

Niantic Spatial 用城市环境中拍摄的 300 亿张图片训练了模型。这些图片尤其密集地聚集在「热点」周围——Niantic 游戏中鼓励玩家前往的重要地点,比如宝可梦对战道馆。「我们在全世界有超过 100 万个地点,能精确定位你的位置」,McClendon 说,「我们知道你站在哪里,精度在几厘米以内。更重要的是,我们知道你在看哪个方向。」

结果就是,对于这 100 万个地点中的每一个,Niantic Spatial 都拥有数千张在差不多同一位置、但不同角度、不同时段、不同天气条件下拍摄的照片。每张照片都附带详细的元数据:手机当时在空间中的精确位置、朝向、姿态、是否在移动、速度和方向等等。

公司用这个数据集训练模型,让它通过「看到的东西」来精确预测自己的位置——即使在那 100 万个热点之外、图像和位置数据相对稀缺的地方也能工作。

除了 GPS,Coco 的机器人(装有 4 个摄像头)现在还会用这个模型来判断自己在哪、要去哪。机器人的摄像头安装在臀部高度,同时朝向所有方向,视角和 Pokémon Go 玩家有些不同,但 Rash 说数据适配并不复杂。

竞争对手也在用视觉定位系统。比如 2014 年在爱沙尼亚成立的机器人配送公司 Starship Technologies,称其机器人用传感器构建周围环境的 3D 地图,标注建筑边缘和路灯位置。

但 Rash 赌的是 Niantic Spatial 的技术能给 Coco 带来优势。他认为这能让机器人精确停在餐厅外正确的取餐位置,不挡任何人的路,而且停在客户家门口而不是差几步远——过去这种情况时有发生。

机器人的寒武纪大爆发

Niantic Spatial 开始做视觉定位系统时,目标是用在增强现实上,Hanke 说。「如果你戴着 AR 眼镜,希望虚拟世界锁定在你看的方向上,就需要某种方法来实现。但现在我们正在见证机器人领域的寒武纪大爆发。」

有些机器人需要和人类共享空间,比如建筑工地和人行道。「如果机器人要以不打扰人类的方式融入这些环境,它们就必须拥有和人类类似的空间理解能力」,Hanke 说。「当机器人被推搡、碰撞之后,我们能帮它精确地找回自己在哪。」

与 Coco Robotics 的合作只是起点。Hanke 说 Niantic Spatial 正在搭建的,是他所说的「活地图」(Living Map)的第一批组件:一个超高精度的虚拟世界模拟,随着现实世界的变化而变化。随着 Coco 和其他公司的机器人在世界各地行驶,它们将提供新的地图数据来源,让数字世界的副本越来越精细。

在 Hanke 和 McClendon 看来,地图不仅在变得更精细,而且越来越多地被机器使用。这改变了地图的用途。地图长期以来帮助人类定位自己。从 2D 到 3D 再到 4D(想想数字孪生这样的实时模拟),基本原理没变:地图上的点对应空间或时间中的点。

但面向机器的地图可能需要变得更像导游手册,充满人类认为理所当然的信息。Niantic Spatial 和 ESRI 这样的公司想给地图加上描述,告诉机器它实际看到的是什么,每个物体都标注一系列属性。「这个时代的任务是为机器构建有用的世界描述」,Hanke 说。「我们拥有的数据,在理解世界的连接组织如何运作方面,是一个很好的起点。」

现在世界模型非常火,Niantic Spatial 很清楚这一点。LLM 看起来什么都懂,但在解读和与日常环境互动时几乎没有常识。世界模型就是要解决这个问题。一些公司,比如 Google DeepMind 和 World Labs,正在开发能即时生成虚拟幻想世界的模型,然后用它们作为 AI 代理的训练场。

Niantic Spatial 说他们从不同的角度切入这个问题。把地图做得足够极致,你最终会捕捉到一切,McClendon 说:「我们还没到那一步,但我们想到达那里。我现在非常专注于尝试重建真实世界。」

市场机遇
COCO BSC 图标
COCO BSC实时价格 (COCO)
$0.18317
$0.18317$0.18317
+2.47%
USD
COCO BSC (COCO) 实时价格图表
免责声明: 本网站转载的文章均来源于公开平台,仅供参考。这些文章不代表 MEXC 的观点或意见。所有版权归原作者所有。如果您认为任何转载文章侵犯了第三方权利,请联系 crypto.news@mexc.com 以便将其删除。MEXC 不对转载文章的及时性、准确性或完整性作出任何陈述或保证,并且不对基于此类内容所采取的任何行动或决定承担责任。转载材料仅供参考,不构成任何商业、金融、法律和/或税务决策的建议、认可或依据。