資源簡介
隨機學習與優化在現代工程、社會、金融問題中具有廣泛的應用。《隨機學習與優化:基于靈敏度的方法》以一個統一的框架,涵蓋了離散事件動態系統的攝動分析、馬爾可大決策過程、強化學習、辨識和自適應控制等學習和優化的不同學科;并利用基于性能差分公式的簡單方法介紹馬爾可夫決策過程理論,通過該方法能求得以長期平均代價為準則的n階偏差優化策略以及無折扣的Blackwell優化策略。《隨機學習與優化:基于靈敏度的方法》還包含有最近發展出來的基于事件的優化方法,它為利用系統的特性來克服或減輕數災的研究開辟了個新方向。《隨機學習與優化:基于靈敏度的方法》強調以樣本路徑的構造為基礎的物理解釋,物理上的直觀認識可以為完善已有的優化方法提供新思路。
為幫助讀者理解掌握書中的內容,《隨機學習與優化:基于靈敏度的方法》提供了大量的示例和豐富的習題。
《隨機學習與優化:基于靈敏度的方法》適合作為相關專業的研究生教材,學生可從一門課程中學到原本屬于多個不同學科的內容。《隨機學習與優化:基于靈敏度的方法》有助于促進學習和優化領域中各學科之間的合作,對該領域的研究人員也大有裨益。
代碼片段和文件信息
評論
共有 條評論