国家重点基础研究发展计划(973计划)(2013CB228205);国家自然科学基金项目(51177051);中央高校基本业务费重点项目(2012ZZ0020);中国南方电网科技项目资助
CPS标准下的互联电网的自动发电控制(AGC)系统是一个典型的不确定随机系统,提出一种新型应用于AGC系统的随机最优控制策略——基于SARSA算法的互联电网CPS最优控制策略。SARSA算法更多地考虑控制策略动作的花费,倾向于避开进入随机系统中搜索一些危险的状态,相对于离策略(off-policy)的Q学习算法,在策略(on-policy)SARSA算法的学习试错过程中对受控系统影响更小。仿真结果表明,基于SARSA算法的CPS控制器较Q学习算法有更好的鲁棒性和适应性,能够获得更佳的CPS指标。
余涛,张水平.在策略SARSA算法在互联电网CPS最优控制中的应用[J].电力系统保护与控制,2013,41(1):211-216.[.[J]. Power System Protection and Control,2013,V41(1):211-216]