人工智能领域前沿赛道上,世界模型的开源窗口正在被快速打开。蚂蚁集团旗下灵波科技(以下简称“蚂蚁灵波”)连续三日开源高精度空间感知模型LingBot-Depth、具身大模型LingBot-VLA与世界模型LingBot-World后,谷歌在1月30日(北京时间)开源了体验平台Project Genie,美国 Google AI Ultra 的订阅用户可以试用Google Genie 3——一个能够生成多样化交互环境的通用世界模型。两大巨头的动作不仅代表着技术的突破,更标志着世界模型赛道进入了一个全新的发展阶段。
1月29日,蚂蚁灵波开源LingBot-World,这是业界首个可对标Google Genie 3的开源世界模型。LingBot-World支持高保真、高动态的视频生成,可实现近10分钟连续稳定无损生成,并具备将端到端交互延迟控制在1秒内的能力,能做到约16FPS的生成吞吐。用户不仅可通过键盘或鼠标操控角色与视角,还能以文本指令触发天气、风格等环境变化,且在镜头最长移动60秒返回后,目标物体仍能保持物体结构和外观的一致性。
更关键的是,LingBot-World支持Zero-shot泛化,仅需一张真实照片或游戏截图,即可生成可交互视频流,无需额外训练或数据采集。在视频质量、动态程度、长时一致性、交互能力等关键指标上,LingBot-World均媲美Google Genie 3,旨在为具身智能、自动驾驶及游戏开发提供高保真、高动态、可实时操控的“数字演练场”。
1月30日,谷歌向Google AI Ultra订阅用户开放了Google Genie 3的体验入口,允许用户直接在线体验其世界模型能力。消息一出,海外社区反响热烈,相关话题全天占据X(原Twitter)热门榜单首位,Reddit多个AI子社区将其列为Top 1热帖。
这两项独立项目的“默契”举动,共同印证了世界模型发展范式的转变。过去,此类技术多为科技巨头内部研发,如今,蚂蚁灵波选择将LingBot-World模型权重与推理代码全面开源,谷歌则提供世界模型的公共体验平台,意味着开发者和研究者首次能以较低门槛接触前沿世界模型能力。
作为德国头部财经网站之一,AdHocNews评价称:“蚂蚁集团发布了名为 LingBot-World 的高质量机器人 AI 模拟环境。这家中国金融科技公司完善了一套完整的开源工具包,用于物理 AI 系统的开发。这也是在全球机器人领域主导权争夺战中的一项战略性举措。”
“这对整个行业都是变革,”一位行业专家表示,“此前这类训练环境通常是专有的,成本昂贵。现在,每位开发者都能接触到工业标准技术。”
值得注意的是,LingBot-World并非孤立成果,只是蚂蚁灵波具身智能开源策略的一环。
1月27日,这家蚂蚁旗下的具身智能公司已开源具身大模型LingBot-VLA,支持跨本体、跨任务泛化,在上海交通大学的GM-100具身评测中,刷新真机评测的成功率纪录。1月28日,蚂蚁灵波空间感知模型LingBot-Depth开源,主攻透明反光物抓取难题,并联合奥比中光打造了新一代深度相机。
三天三模型,蚂蚁灵波构建起从“看清楚”到“做明白”再到“想象世界”的完整技术链条。随着LingBot-World与Google Genie 3相继开放,世界模型正从实验室走向广阔应用场景——无论是具身智能体的低成本仿真训练,游戏、影视中的可控内容生成,还是自动驾驶的虚拟测试,都将因开放生态而加速迭代。一个由开源驱动、多方共建的世界模型新阶段,已然开启。