資源簡介
近似動態(tài)規(guī)劃學習例子,是我在看魏慶來的《迭代自適應動態(tài)規(guī)劃理論及應用》書中的例子,自己編的程序,可以運行,有一定參考價值。
代碼片段和文件信息
%魏慶來迭代自適應動態(tài)規(guī)劃理論及應用例2.1
%考慮如下仿射非線性系統(tǒng)
%x(k+1)=x(k)-x(k)^2+0.3*x(k)^3+0.2*x(k)*kexi(k)*exp(x(k)^2)-0.8*ln(x(k)^2+1)*u(k)
%其中,x(0)=1性能指標定義為
%?J=∑_(k=0)^∞(ln(x(k)^2+exp(x(k)^2)*u(k)^2?+1))?(pg40)
%本方法應用在k=0時刻。兩個三層神經網絡用來設計評判網絡和執(zhí)行網絡,其結構分
%別是2-8-1和1-8-1。評判網絡和執(zhí)行網絡的初始權值均取[-11]內的值。設x_=0u_=0
%選取初始控制u(0)=0并運行系統(tǒng)40步,設計算精度為epsl=1e-6.系統(tǒng)噪聲kexi(k)取[-0.050.05]
%內隨機值。
clear
clc
x_=0;?u_=0;?%期望值
u=0;
x(1)=1;?%初始值(數(shù)組下標不能為0)
epsl=1e-6;?%計算精度
wa1=rands(18);
wa2=rands(81);
wc1=rands(28);
wc2=rands(81);
Nsteps=100;?%仿真步數(shù)
for?k=1:Nsteps
????%計算新狀態(tài)
????kexi(k)=0.05*rands(1);
???x(k+1)=x(k)-x(k)^2+0.3*x(k)^3+0.2*x(k)*kexi(k)*exp(x(k)^2)-0.8*log(x(k)^2+1)*u(k)?;
???d_x(k+1)=x(k+1)-x_;??%最為兩個神經網絡的輸入
???ha=d_x(k
?屬性????????????大小?????日期????時間???名稱
-----------?---------??----------?-----??----
?????文件???????1690??2016-03-25?22:20??weiqinglaieg2_1.m
-----------?---------??----------?-----??----
?????????????????1690????????????????????1
評論
共有 條評論