返回 hu86科技

SIMA 2:3D 世界的智能新物种

2025-11-20

一、SIMA 2:3D 世界的智能新物种

DeepMind 于 2025 年 11 月 13 日正式发布 SIMA 2(Scalable Instructable Multiworld Agent,可扩展的可指令多世界智能体),这是一个能在虚拟 3D 世界中自主游戏、推理并持续学习的通用 AI 智能体,被官方称为 “为虚拟 3D 世界打造的最强大 AI 代理”。deepmind.google

二、核心能力:从指令执行者到智能伙伴

1️⃣ 超越指令跟随的思考能力

2️⃣ 多模态交互:全方位感知世界

3️⃣ 强大的泛化与适应能力

4️⃣ 革命性的自我改进机制

三、技术核心:Gemini 赋能的 “思维 – 感知 – 行动” 架构

🌟 三层 “Gemini-SIMA Fusion” 架构 🌟

层级 核心组件 功能说明
决策中枢 Gemini 大语言模型 (Pro 1.5/2.5 Flash-lite) 高级理解、任务规划、语言交互、逻辑推理
视觉 – 动作层 视觉 – 动作 Transformer 模型 仅通过像素输入理解 3D 环境,输出键盘鼠标精确操作
思维令牌桥梁 连接层 实现语言、视觉、动作三流合一,使抽象思维能指导具体行动
核心创新:通过 “思维令牌”(Thought Tokens) 将 Gemini 的抽象推理与底层动作执行无缝连接,使 AI 能在保持高级思考的同时完成精确操作

四、性能飞跃:接近人类水平的 3D 世界能力

🔥 关键性能数据 🔥

最新文章

柔性显示技术突破,可折叠手机进入“无缝时代”

数码

 

阅读16311

量子计算原型机“九章三号”问世,算力突破亿亿亿倍

科技

 

阅读12404

AI数字人走进千行百业,虚拟与现实融合加速落地

科技

 

阅读11526

全球首座高温气冷堆核电站商运,核电进入安全高效新时代

综合

 

阅读12379

1.6nm芯片量产落地,半导体产业迈入后摩尔时代

数码

 

阅读12139