資源簡介
深度逆向強化學習是機器學習領域的一個新的研究熱點,它針對深度強化學習的回報函數(shù)難以獲取問題,提出了通過專家示例軌跡重構回報函數(shù)的方法。首先介紹了3類深度強化學習方法的經(jīng)典算法;接著闡述了經(jīng)典的逆向強化學習算法,包括基于學徒學習、最大邊際規(guī)劃、結構化分類和概率模型形式化的方法;然后對深度逆向強化學習的一些前沿方向進行了綜述,包括基于最大邊際法的深度逆向強化學習、基于深度Q網(wǎng)絡的深度逆向強化學習和基于最大熵模型的深度逆向強化學習和示例軌跡非專家情況下的逆向強化學習方法等。最后總結了深度逆向強化學習在算法、理論和應用方面存在的問題和發(fā)展方向。
代碼片段和文件信息
- 上一篇:F_鏡頭的光學設計.pdf
- 下一篇:e語言-易語言利用服務器組件做的登錄源碼
評論
共有 條評論