EN CN

基于物理知识
嵌入网络的强化学习

物理知识嵌入神经网络指将物理知识通过节点、结构、Loss损失函数等方式嵌入神经网络,构建具有物理可解释性,数据知识双驱动的算法模型。
物理知识嵌入的神经网络在小样本学习、长时程预测预报等方面具有优势,如天气、海洋流场、脑动力学、血流动力学等复杂系统的预测预报。

基于常微分方程的部分可观测无模型强化学习

将常微分方程(ODE)引入部分可观测(POMDP)的强化学习环境中,理论证明了该设计的合理性。通过ODE进行隐空间状态的编码,在部分可观测MuJoCo环境上得到性能的提升,同时验证了ODE具有不规则时间序列学习的能力。

Zhao XL, Zhang DZ, Han LY, Zhang TL*, Xu B. ODE-based Recurrent Model-free Reinforcement Learning for POMDPs, NeurIPS 2023.

About Us
Contact:Dr. Tielin Zhang                 Email:zhangtielin@ion.ac.cn
TEL:021-54922305                         Postal Code:200031
ADD:No. 607, Building No. 8, No. 319 Yueyang Road, Shanghai (Center for Excellence in Brain Science and Intelligent Technology, Chinese Academy of Sciences)
Copyright Information
The copyright of the content published and displayed on this website belongs to the original author, and any commercial use needs to contact the author. If unauthorized use is made elsewhere, the author reserves the right to pursue legal liability against the infringer.

鲁ICP备2024061698号-1

TOP