李飞飞创业公司 World Labs 发布实时生成式世界模型 RTFM



由斯坦福大学教授李飞飞联合创办的初创公司 World Labs 近日推出了全新的实时生成式世界模型 RTFM(Real-Time Frame Model),宣称该模型具备实时运行、持续演化以及保持3D一致性的能力,其突出优势在于仅需一块H100 GPU即可流畅运行。
RTFM 采用自回归扩散Transformer架构,通过对海量视频数据进行端到端训练,无需依赖显式的3D建模流程,便能生成多视角的2D图像,并自然模拟出反射、阴影等复杂物理现象。该模型支持从少量稀疏照片中重建真实场景,结合空间记忆机制与上下文调度技术,有效维持场景的长期一致性与时空连贯性。
核心优势
- 仅需单颗H100 GPU即可实现交互式画面的实时渲染,帧率稳定,显著降低计算开销——例如生成一小时4K视频所需处理的token量超过一亿,远优于传统方法。
- 模型设计围绕高效性、可扩展性与持久性三大理念构建,未来可通过增加算力进一步拓展模型规模。
李飞飞团队指出,后续将重点提升RTFM在动态场景建模和用户交互方面的能力,更大参数量版本的模型有望带来更强大的表现力与应用潜力。
模型官网:https://www.php.cn/link/99f4a5fef7b45624924eb900758be690
下一篇 >>
网友留言(0 条)