报告题目:
高效世界模型及自主导航
摘要:
世界模型通过“想象”生成数据,显著提升了样本效率并降低了训练成本,是实现智能体高效自主决策的关键途径。本报告介绍了我们在世界模型方面的四个初步成果。提出基于Transformer架构的世界模型STORM,在Atari
100k基准上取得SOTA性能,训练时间和资源消耗显著低于经典DreamerV3算法。DyMoDreamer
通过引入动态调制机制,提升模型对环境变化的敏感性,在Atari
100k与DMControl等多个基准中均取得SOTA性能。这些成果展示了世界模型强化学习的核心优势与应用潜力,并为智能体在复杂环境中的高效决策提供了新的思路。MAD将世界模型从纯“想象”扩展为显式空间建模,能够同时学习占据/可见性地图与时序表征,从而在视觉导航中获得更强的空间推理与泛化能力,并在复杂场景中相较于传统模块化与视觉端到端导航方法,显著提升成功率、飞行速度和任务迁移性能。
个人简历:
王钢,北京理工大学自动化学院教授,国家级领军人才。主要研究无人系统数据驱动控制和世界模型学习。主持(完成)国家重点研发计划、国家自然科学基金联合重点木、面上等项目,在IEEE
TIT/TAC/TSP等汇刊发表期刊论文70篇,NeurIPS/ICLR/ICRA/IROS等国际会议发表论文70篇。获中国自动化学会自然科学一等奖(排1)、IEEE/CAA
Journal of Automatica
Sinica钱学森论文奖、ICCA最佳论文奖、IEEE信号处理学会“优秀编委奖”、中国工程院院刊《信息与电子工程前沿(英文版)》“最佳论文奖”、欧洲信号处理会议“最佳学生论文奖”等。现任IEEE
Control Systems Magazine、IEEE Trans. Signal and Information
Processing over Networks、IEEE Open Journal of Control
Systems等期刊编委,以及中国自动化学会控制理论专业委员会委员、中国自动化学会具身智能专委会副主任委员等。