近年来,强化学习(Reinforcement Learning, RL)控制方法在众多领域成为研究热点。在电力电子领域,相较于传统控制方法,强化学习拥有自适应自学习的能力,可以更有效地对带恒功率负载的DC-DC变换器进行电压控制。然而,在训练过程中仿真环境与实际系统之间不可避免存在偏差,这使得虽然智能体训练时表现出良好的控制性能,但是在迁移到实际环境时性能下降甚至无法有效控制目标。为此,该文提出了一种迁移映射关系(DRM),首次将已训练好的智能体迁移到实际系统中,既保证了控制的瞬态性能,又保证了其稳态性能。同时使得智能体针对电路参数变化有一定的自适应能力,即同一个智能体可以针对不同电路参数(主要为电感和电容变化)进行有效控制。
本文首先在Simulink中利用电力电子以及强化学习工具箱预训练出智能体,随后对智能体进行网络重建,接着采集仿真环境于实际系统的电压电流关系并构建占空比映射表,最后将该表应用于该智能体对实际系统的控制中,实现了DC-DC变换器瞬态和稳态控制性能的显著提高。
崔承刚副教授此前关于“无模型强化学习控制DC-DC变换器”的工作“Voltage Regulation of DC-DC Buck Converters Feeding CPLs via Deep Reinforcement”(https://ieeexplore.ieee.org/abstract/document/9521987)于2021年8月发表在另一电力电子期刊IEEE Transactions on Circuits and Systems II: Express Briefs(IEEE TCAS II,SCI二区,IF=3.691)。
以上工作得到了国家自然基金项目资助。
威尼斯886699
2022年7月26日