91av视频/亚洲h视频/操亚洲美女/外国一级黄色毛片 - 国产三级三级三级三级

  • 大小: 982B
    文件類型: .m
    金幣: 1
    下載: 0 次
    發布日期: 2021-06-09
  • 語言: Matlab
  • 標簽: Q-learning??M??

資源簡介

一個簡單的Q-Learning算法的綜合示例,可以在Matlab仿真平臺上實現。

資源截圖

代碼片段和文件信息

state_num=6;
episode_num=300;

%初始化
gammer=0.8;??%給定折扣因子
reward_R=[
????-1-1-1-10-1;???%設置獎勵矩陣R
????-1-1-10-1100;
????-1-1-10-1-1;
????-100-10-1;
????0-1-10-1100;
????-10-1-10100;
????]
Q_table=zeros(size(reward_R));??%設置初始化矩陣Q
final_state=6;
%For?each?episode
for?i=1:episode_num
????current_state=randperm(state_num1);???%隨機選擇一個狀態
????while?current_state~=final_state
????action_option=find(reward_R(

評論

共有 條評論