Robust Deterministic Policy Gradient for Disturbance Attenuation and Its Application to Quadrotor Control

Taeho Lee; Donghwan Lee

Robust Deterministic Policy Gradient for Disturbance Attenuation and Its Application to Quadrotor Control

Taeho Lee, Donghwan Lee

Abstract

This paper presents a robust reinforcement learning algorithm called robust deterministic policy gradient (RDPG), which reformulates the H-infinity control problem as a two-player zero-sum dynamic game between a user and an adversary. The method combines deterministic policy gradients with deep reinforcement learning to train a robust policy that attenuates disturbances efficiently. A practical variant, robust deep deterministic policy gradient (RDDPG), integrates twin-delayed updates for stability and sample efficiency. Experiments on an unmanned aerial vehicle demonstrate superior robustness and tracking accuracy under severe disturbance conditions.

Robust Deterministic Policy Gradient for Disturbance Attenuation and Its Application to Quadrotor Control

Abstract

Robust Deterministic Policy Gradient for Disturbance Attenuation and Its Application to Quadrotor Control

Abstract

Paper Structure