申请试用
HOT
登录
注册
 
World Models

World Models

Jane
/
发布于
/
4162
人观看
我们探索建立流行的强化学习环境的生成神经网络模型。我们的世界模型可以以无人监督的方式快速训练,以学习环境的压缩空间和时间表示。通过使用从世界模型中提取的特征作为代理的输入,我们可以训练一个非常紧凑和简单的策略,可以解决所需的任务。我们甚至可以完全根据其世界模型产生的幻觉梦想训练我们的代理人,并将此政策转回实际环境。
12 点赞
3 收藏
14下载
相关文档
确认
3秒后跳转登录页面
去登陆