伟德线上平台、所2023年系列學術活動（第053場）：郭尚岐助理研究員清華大學精密儀器系

發表于： 2023-05-17 點擊：

報告題目：基于因果推理的強化學習算法

報告人：郭尚岐清華大學精密儀器系助理研究員

所在單位：清華大學精密儀器系

報告時間：2023年5月22日星期一 10：00-11:00

報告地點：數學樓第二報告廳

校内聯系人：孫維鵬 sunwp@jlu.edu.cn

報告摘要：在面對實際複雜問題時，強化學習通常面臨部分觀測的問題。為此，目前研究通常将曆史觀測序列引入到強化學習算法中，然而這導緻狀态空間随着曆史長度增加而指數級增大。因果學習可以挖掘曆史觀測中的重要觀測狀态，講曆史序列進行壓縮，從而降低曆史觀測空間的複雜度，提高基于曆史觀測的強化學習算法的效率。

報告人簡介：

2011年9月-2015年6月，電子科技大學數理基礎科學班，本科

2015年9月-2021年6月，清華大學自動化系，博士；

2021年12月至今，清華大學精密儀器系，博士後；

伟德线上平台、所2023年系列學術活動（第053場）：郭尚岐 助理研究員 清華大學精密儀器系