91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

資源簡(jiǎn)介

強(qiáng)化深度學(xué)習(xí)迷宮問題

資源截圖

代碼片段和文件信息

import?tensorflow?as?tf
import?numpy?as?np
from?collections?import?deque
import?random


class?DeepQNetwork:
????r?=?np.array([[-1?-1?-1?-1?0?-1]
??????????????????[-1?-1?-1?0?-1?100.0]
??????????????????[-1?-1?-1?0?-1?-1]
??????????????????[-1?0?0?-1?0?-1]
??????????????????[0?-1?-1?1?-1?100]
??????????????????[-1?0?-1?-1?0?100]
??????????????????])

????#?執(zhí)行步數(shù)。
????step_index?=?0

????#?狀態(tài)數(shù)。
????state_num?=?6

????#?動(dòng)作數(shù)。
????action_num?=?6

????#?訓(xùn)練之前觀察多少步。
????OBSERVE?=?1000.

????#?選取的小批量訓(xùn)練樣本數(shù)。
????BATCH?=?20

????#?epsilon?的最小值,當(dāng)?epsilon?小于該值時(shí),將不在隨機(jī)選擇行為。
????FINAL_EPSILON?=?0.0001

????#?epsilon?的初始值,epsilon?逐漸減小。
????INITIAL_EPSILON?=?0.1

????#?epsilon?衰減的總步數(shù)。
????EXPLORE?=?3000000.

????#?探索模式計(jì)數(shù)。
????epsilon?=?0

????#?訓(xùn)練步數(shù)統(tǒng)計(jì)。
????learn_step_counter?=?0

????#?學(xué)習(xí)率。
????learning_rate?=?0.001

????#?γ經(jīng)驗(yàn)折損率。
????gamma?=?0.9

????#?記憶上限。
????memory_size?=?5000

????#?當(dāng)前記憶數(shù)。
????memory_counter

?屬性????????????大小?????日期????時(shí)間???名稱
-----------?---------??----------?-----??----
?????文件??????429107??2020-07-09?18:10??鍒嗗竷寮忚綆楁湡鏈綔涓?pptx
?????文件?????????277??2020-07-09?18:10??__MACOSX\._鍒嗗竷寮忚綆楁湡鏈綔涓?pptx
?????文件???????11257??2020-07-15?13:08??榪峰.py
?????文件?????????384??2020-07-15?13:08??__MACOSX\._榪峰.py

評(píng)論

共有 條評(píng)論