91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

  • 大小: 2KB
    文件類型: .py
    金幣: 1
    下載: 0 次
    發布日期: 2021-01-09
  • 語言: Python
  • 標簽: 強化學習??Qlearn??

資源簡介

強化學習中Qlearning的簡單實現,維度為1,通過Qlearning自主找到最優的Q表

資源截圖

代碼片段和文件信息

import?numpy?as?np
import?pandas?as?pd
import?time

N_STATES?=?6???#1維世界的寬度
ACTIONS?=?[‘left‘‘right‘]??#動作
EPSILON?=?0.9???#貪婪都
ALPHA?=?0.1??#學習率
GAMMA?=?0.9??#獎勵遞減值
MAX_ROUND?=?13??#最大回合數
FRESH_TIME?=?0.01?#移動間隔時間

def?build_q_table(n_statesactions):
????table?=?pd.Dataframe(np.zeros((n_stateslen(actions)))columns=actions)
????return?table

def?choose_action(stateq_table):
????state_actions?=?q_table.iloc[state:]
????if(np.random.uniform()>EPSILON)?or?(state_actions.all()==0):
????????action_name?=?np.random.choice(ACTIONS)
????else:
????????action_name?=?state_actions.argmax()
????return?action_name

def?get_env_feedback(SA):
????if?A?==?‘right‘:
????????if?S?==?N_STATES?-2:
????????????S_?=?‘terminal‘
????????????R?=?1
????????else:
????????????S_?=?

評論

共有 條評論