类脑认知计算与脑机融合智能研究组

基于物理知识
嵌入网络的强化学习

物理知识嵌入神经网络指将物理知识通过节点、结构、Loss损失函数等方式嵌入神经网络，构建具有物理可解释性，数据知识双驱动的算法模型。
物理知识嵌入的神经网络在小样本学习、长时程预测预报等方面具有优势，如天气、海洋流场、脑动力学、血流动力学等复杂系统的预测预报。

基于常微分方程的部分可观测无模型强化学习

将常微分方程（ODE）引入部分可观测（POMDP）的强化学习环境中，理论证明了该设计的合理性。通过ODE进行隐空间状态的编码，在部分可观测MuJoCo环境上得到性能的提升，同时验证了ODE具有不规则时间序列学习的能力。

Zhao XL, Zhang DZ, Han LY, Zhang TL*, Xu B. ODE-based Recurrent Model-free Reinforcement Learning for POMDPs, NeurIPS 2023.

联系我们

联系人：张铁林邮箱：zhangtielin@ion.ac.cn

电话：021-54922305 邮编：200031
地址：上海市岳阳路319号8号楼607 (中国科学院脑科学与智能技术卓越创新中心)

版权信息

本网站所发布展示的内容版权归原作者所有，任何商业用途均需联系作者。如未经授权用作他处，作者将保留追究侵权者法律责任的权利。

鲁ICP备2024061698号-1

TOP