報告題目:自動化特征工程:填補特征工程與自優化之間的空白
報 告 人:劉鲲鵬 助理教授 Portland State University
報告時間:2023年4月27日 10:00-11:00
報告地點:數學樓第二報告廳
校内聯系人:程建華 chengjh@jlu.edu.cn
報告摘要:近年來,數據挖掘已經在許多應用場景中取得了巨大的成功。作為數據挖掘的基礎技術,特征工程在理解與感知數據的過程中有着不可替代的作用。理想的特征工程可以移除無關特征、生成信息量大的特征、提高模型表現、提高泛化性、提供更好的理解力和可解釋性。但是,在諸多的應用場景中,大多數從業者并不是特征工程的專家,因此,自動化特征工程,降低特征工程的使用門檻,成為一個不可忽視的需求。本次報告首先介紹自動化特征工程的重要性及其挑戰性;然後着重闡述:1. 自動化特征選擇;2. 自動化特征生成;最後,展望未來的智能化、可理解、可交互的自動化數據科學系統,并提出若幹發展方向。
報告人簡介:劉鲲鵬,波特蘭州立大學計算機系助理教授,研究興趣為數據挖掘與強化學習,研究方向集中在自動化數據科學系統及其在大數據問題上的應用,包括智能城市、機器學習隐私保護、可解釋的推薦系統、用戶行為分析。研究成果發表在KDD、TKDE、IJCAI、AAAI、WWW 等數據挖掘、機器學習的頂級會議、期刊上。多次擔任IJCAI高級程序委員會委員,并且在KDD、ICML、ICLR、NeurIPS、AAAI、WWW、CIKM、ICDM等國際頂級會議中常态化擔任程序委員會委員。