當前位置: 首 頁 - 科學研究 - 學術報告 - 正文

伟德线上平台、所2023年系列學術活動(第053場):郭尚岐 助理研究員 清華大學精密儀器系

發表于: 2023-05-17   點擊: 

報告題目: 基于因果推理的強化學習算法

報 告 人: 郭尚岐 清華大學精密儀器系助理研究員

所在單位:清華大學精密儀器系

報告時間:2023年5月22日 星期一 10:00-11:00

報告地點:數學樓第二報告廳

校内聯系人:孫維鵬 sunwp@jlu.edu.cn


報告摘要:在面對實際複雜問題時,強化學習通常面臨部分觀測的問題。為此,目前研究通常将曆史觀測序列引入到強化學習算法中,然而這導緻狀态空間随着曆史長度增加而指數級增大。因果學習可以挖掘曆史觀測中的重要觀測狀态,講曆史序列進行壓縮,從而降低曆史觀測空間的複雜度,提高基于曆史觀測的強化學習算法的效率。


報告人簡介:

2011年9月-2015年6月,電子科技大學數理基礎科學班,本科

2015年9月-2021年6月,清華大學自動化系,博士;

2021年12月至今,清華大學精密儀器系,博士後;


Baidu
sogou