-
大小: 982B文件類型: .m金幣: 1下載: 0 次發布日期: 2021-06-09
- 語言: Matlab
- 標簽: Q-learning??M??
資源簡介
一個簡單的Q-Learning算法的綜合示例,可以在Matlab仿真平臺上實現。
代碼片段和文件信息
state_num=6;
episode_num=300;
%初始化
gammer=0.8;??%給定折扣因子
reward_R=[
????-1-1-1-10-1;???%設置獎勵矩陣R
????-1-1-10-1100;
????-1-1-10-1-1;
????-100-10-1;
????0-1-10-1100;
????-10-1-10100;
????]
Q_table=zeros(size(reward_R));??%設置初始化矩陣Q
final_state=6;
%For?each?episode
for?i=1:episode_num
????current_state=randperm(state_num1);???%隨機選擇一個狀態
????while?current_state~=final_state
????action_option=find(reward_R(
- 上一篇:基于遺傳算法尋優的PID控制及MATLAB仿真
- 下一篇:四階三次均勻B樣條函數插值
評論
共有 條評論