让我们投入10万亿美元发展改善现实世界的AI,而不只是优化广告

0561news 5 0

让我们投入10万亿美元发展改善现实世界的AI,而不只是优化广告

  作者:是地理空间 AI 公司 Niantic Spatial 创始人兼 CEO,在科技与地图交叉领域深耕 25 年,主导开发了《宝可梦 GO》、谷歌地图、谷歌地球及 Keyhole 地球查看器等产品。

  四年前,元宇宙概念正流行时,我曾发文称它是一场反乌托邦噩梦。我当时主张,与其沉浸虚拟世界,我们更应多与身边的现实世界联结。

  时间会证明元宇宙最终能否成真,但 2024 和 2025 年,全球商务与休闲旅行、线下活动参与度均已超过疫情前水平,这很明显说明:人类本就不该活在头显设备里。

  转眼到今天,有人正试图打造这样一个世界:内容越来越不来自朋友,甚至不来自人类网红,而是直接由 AI 模型生成 —— 一种经过工程化制造的像素与波形,只为抓住你的注意力,直到下一条广告出现。

  短短几年前,先进 AI 刚崭露头角时,人们对未来充满热情:一个人类繁荣的未来,医疗、材料、制造、机器人技术的突破性进步将让世界变得更好,提升地球上所有人的生活质量。

  我认为现在有理由问一句:我们真的在朝这个方向走吗?我们对 AI 的巨额投资中,有多少会真正用于改善人类生存状况,又有多少会被用来制造更精巧的娱乐与分心手段?

  为什么这件事现在至关重要

  我们都清楚,大语言模型已成为科技史上更具颠覆性的创新之一,我们正进入一个意义重大的时代。它正在颠覆科技市场的方方面面:从初创公司到老牌企业,从芯片到软件、数据中心,甚至发电行业。

  自 OpenAI 成立、现代 AI 产业崛起以来,全球已投入约 1 万亿美元,且这一数字还在每天增长,其中很大一部分正流向基础设施:芯片、服务器、数据中心和电力,为未来大规模高利润应用做准备。分析师认为,到 2030 年,AI 总投资可能达到10 万亿美元。即便与同期预计超过 150 万亿美元的全球 GDP 相比,这也是一笔天文数字。

  或许更重要的是,建设这些基础设施正在消耗大量自然资源,包括石油、天然气和宝贵的淡水。外界越来越要求证明投资回报,而随着这些巨额杠杆投资不断累积,这种压力只会越来越大。

  这些回报将从哪里来?是否存在一条路径,既能产生所需的经济回报,又能真正为人类建设更美好的未来?

  答案之一,就在现实世界里

  线上商品与服务约占全球经济的20%。当然,AI 会让线上广告、社交 *** 、游戏变得更优质、更赚钱,也会优化软件工程、 *** 、营销、法律、医疗等白领工作。

  但全球经济另外 80% 在这个范畴之外,就在现实世界里:能源、农业、制造业、建筑、交通与物流等行业。换句话说,是那些开采、提炼、种植、组装、合成、运输 “实物” 的活动 —— 这些东西为我们供暖、遮风挡雨、提供食物,支撑人类的基本生活。这些才是人类最核心的需求,而不是聊天机器人。

  要证明 AI 领域的巨额投入合理,就必须相信:AI 不仅能改造线上 20% 的经济,更能改造线下 80% 的经济。如果我们能让 AI 在这部分经济中释放力量 —— 并假设我们能妥善处理人类与机器协同工作的转型(这并非小事)—— 那么我们就真的有望迎来一个全人类生活水平共同提升的未来。这才值得为 AI 投入数万亿美元,更值得消耗电力、水资源等宝贵资源。

  问题在于,AI 在很多层面上被困在屏幕里。它对互联网海量文本提炼出的概念了如指掌,却对数据中心门外的世界一无所知,更不用说工厂车间、农田、建筑工地、炼油厂和我们生活的城市。要让 AI 在这片庞大的经济领域释放力量,我们必须给 AI关于世界的知识、与世界交互的能力、以及能在物理世界行动的载体。它需要一颗适应现实世界的 “大脑”,和一副能在现实中移动的 “身体”。

  只有大语言模型和世界模型还不够

  这正是当下的机遇。这也是为什么 AI 行业对所谓物理 AI、世界模型、空间智能充满期待。这也是英伟达黄仁勋对人形机器人如此兴奋的原因,他称其为 “下一个数万亿美元级产业”。我们可以让 AI 适应物理世界,提升生产力,完成真实而有意义的工作 —— 往往是人类不愿做或危险的工作。

  只靠大语言模型不足以实现这一愿景。物理 AI 模型(通过视频等数据训练以控制机器人动作)、世界模型(试图模拟环境如何运行与演变,常生成场景的合成 3D 模拟)、空间模型(捕捉并重建物理世界),都将在实现这一愿景中扮演角色。

  在物理 AI 领域,模拟与迁移学习的突破正让机器人实现流畅动作,以操控现实世界物体的新技能惊艳众人。世界模型则让模拟训练更简单、更真实,创造出无限多样的合成训练环境。

  这些都是必要的进步,但还不足以让 AI 完全走进现实世界。

  构建大型地理空间模型

  在 Niantic Spatial,我们专注于最后一块缺失的拼图:空间智能。要让 AI 对现实世界的问题进行推理、规划和行动,它必须先 “认识” 世界。但 AI 缺乏人类狩猎采集者天然具备的直觉性空间理解能力,而它们训练所用的文本数据,也几乎无法让它连贯、准确地掌握物理世界的结构、形态、内容与拓扑关系。

  过去几年,我们一直在构建一个大型地理空间模型,它就像一张活的、会呼吸的世界地图,一张为机器人和 AI 原生设计的地图。

  不同于我以往开发的产品,这张地图不是为人而建,而是为机器而建—— 帮助机器人导航与任务规划,帮助 AI 完成需要基于现实数据的任务与问答。这张地图可以帮机器人规划穿过城市迷宫的最安全路线,在崎岖地形中将物资运送到偏远目的地,或在工地、工厂内移动并在不同地点作业。这类地图还能帮助 AI 智能体解决复杂现实问题,比如计算郊区火灾风险,或优化城市以提升生活质量。

  我们在为人类构建地图(谷歌地图、地球、本地、街景)的所有经验之上继续前进,同时在一个以AI 理解为核心目标的世界里重新想象它。正如谷歌地图成为 Web 2.0 的关键基石,我们希望让 Niantic 地理空间模型成为未来 AI 的基石之一,与 Physical Intelligence、Skild AI、Flexion Robotics 等公司的物理 AI 模型,以及 World Labs、General Intuition、英伟达等公司的世界模型协同工作。这一切都在形成一个蓬勃发展的生态系统,其中还包括波士顿动力、Agility Robotics、Apptronik 等机器人公司,以及一大批为制造、农业、医疗等行业打造专用移动机器人的企业。

  我们接下来的方向

  这是一个令人兴奋的领域,多项创新同步推进。未来两个月,我们将发布新版模型,能够以人类可交互的方式重建现实,并让机器以毫米级精度“看见” 与导航。未来版本还将加入更深层次理解、规划与解决问题所需的语义信息。

  AI 确实拥有巨大潜力。但能否把这笔巨额投资引向真正改善现实的技术,而不只是娱乐与分心工具,取决于我们每一个人。我相信,这才是值得我们所有人为之兴奋的事。