報告題目: 基于因果推理的強化學習算法
報 告 人: 郭尚岐 清華大學精密儀器系助理研究員
所在單位:清華大學精密儀器系
報告時間:2023年5月22日 星期一 10:00-11:00
報告地點:數學樓第二報告廳
校内聯系人:孫維鵬 sunwp@jlu.edu.cn
報告摘要:在面對實際複雜問題時,強化學習通常面臨部分觀測的問題。為此,目前研究通常将曆史觀測序列引入到強化學習算法中,然而這導緻狀态空間随着曆史長度增加而指數級增大。因果學習可以挖掘曆史觀測中的重要觀測狀态,講曆史序列進行壓縮,從而降低曆史觀測空間的複雜度,提高基于曆史觀測的強化學習算法的效率。
報告人簡介:
2011年9月-2015年6月,電子科技大學數理基礎科學班,本科
2015年9月-2021年6月,清華大學自動化系,博士;
2021年12月至今,清華大學精密儀器系,博士後;