-
大小: 0.39M文件類型: .zip金幣: 1下載: 0 次發(fā)布日期: 2021-03-03
- 語言: Python
- 標(biāo)簽: 深度學(xué)習(xí)??問題??迷宮??學(xué)習(xí)??
資源簡(jiǎn)介
強(qiáng)化深度學(xué)習(xí)迷宮問題
代碼片段和文件信息
import?tensorflow?as?tf
import?numpy?as?np
from?collections?import?deque
import?random
class?DeepQNetwork:
????r?=?np.array([[-1?-1?-1?-1?0?-1]
??????????????????[-1?-1?-1?0?-1?100.0]
??????????????????[-1?-1?-1?0?-1?-1]
??????????????????[-1?0?0?-1?0?-1]
??????????????????[0?-1?-1?1?-1?100]
??????????????????[-1?0?-1?-1?0?100]
??????????????????])
????#?執(zhí)行步數(shù)。
????step_index?=?0
????#?狀態(tài)數(shù)。
????state_num?=?6
????#?動(dòng)作數(shù)。
????action_num?=?6
????#?訓(xùn)練之前觀察多少步。
????OBSERVE?=?1000.
????#?選取的小批量訓(xùn)練樣本數(shù)。
????BATCH?=?20
????#?epsilon?的最小值,當(dāng)?epsilon?小于該值時(shí),將不在隨機(jī)選擇行為。
????FINAL_EPSILON?=?0.0001
????#?epsilon?的初始值,epsilon?逐漸減小。
????INITIAL_EPSILON?=?0.1
????#?epsilon?衰減的總步數(shù)。
????EXPLORE?=?3000000.
????#?探索模式計(jì)數(shù)。
????epsilon?=?0
????#?訓(xùn)練步數(shù)統(tǒng)計(jì)。
????learn_step_counter?=?0
????#?學(xué)習(xí)率。
????learning_rate?=?0.001
????#?γ經(jīng)驗(yàn)折損率。
????gamma?=?0.9
????#?記憶上限。
????memory_size?=?5000
????#?當(dāng)前記憶數(shù)。
????memory_counter
?屬性????????????大小?????日期????時(shí)間???名稱
-----------?---------??----------?-----??----
?????文件??????429107??2020-07-09?18:10??鍒嗗竷寮忚綆楁湡鏈綔涓?pptx
?????文件?????????277??2020-07-09?18:10??__MACOSX\._鍒嗗竷寮忚綆楁湡鏈綔涓?pptx
?????文件???????11257??2020-07-15?13:08??榪峰.py
?????文件?????????384??2020-07-15?13:08??__MACOSX\._榪峰.py
評(píng)論
共有 條評(píng)論