基于物理知识
嵌入网络的强化学习

物理知识嵌入神经网络指将物理知识通过节点、结构、Loss损失函数等方式嵌入神经网络,构建具有物理可解释性,数据知识双驱动的算法模型。
物理知识嵌入的神经网络在小样本学习、长时程预测预报等方面具有优势,如天气、海洋流场、脑动力学、血流动力学等复杂系统的预测预报。

基于常微分方程的部分可观测无模型强化学习

将常微分方程(ODE)引入部分可观测(POMDP)的强化学习环境中,理论证明了该设计的合理性。通过ODE进行隐空间状态的编码,在部分可观测MuJoCo环境上得到性能的提升,同时验证了ODE具有不规则时间序列学习的能力。

Zhao XL, Zhang DZ, Han LY, Zhang TL*, Xu B. ODE-based Recurrent Model-free Reinforcement Learning for POMDPs, NeurIPS 2023.

联系我们
联系人:张铁林                 邮箱:zhangtielin@ion.ac.cn
电话:021-54922526        邮编:200031
地址:上海市岳阳路319号8号楼607 (中国科学院脑科学与智能技术卓越创新中心)
版权信息
本网站所发布展示的内容 版权归原作者所有,任何商业用途均需联系作者。如未经授权用作他处,作者将保留追究侵权者法律责任的权利。

鲁ICP备2024061698号-1

TOP