基于物理知识
嵌入网络的强化学习
物理知识嵌入神经网络指将物理知识通过节点、结构、Loss损失函数等方式嵌入神经网络,构建具有物理可解释性,数据知识双驱动的算法模型。
物理知识嵌入的神经网络在小样本学习、长时程预测预报等方面具有优势,如天气、海洋流场、脑动力学、血流动力学等复杂系统的预测预报。
基于常微分方程的部分可观测无模型强化学习
将常微分方程(ODE)引入部分可观测(POMDP)的强化学习环境中,理论证明了该设计的合理性。通过ODE进行隐空间状态的编码,在部分可观测MuJoCo环境上得到性能的提升,同时验证了ODE具有不规则时间序列学习的能力。
Zhao XL, Zhang DZ, Han LY, Zhang TL*, Xu B. ODE-based Recurrent Model-free Reinforcement Learning for POMDPs, NeurIPS 2023.