Sample-Based Planning for Continuous Action Markov Decision Processes

In this paper, we present a new algorithm that integrates recent advances in solving continuous bandit problems with sample-based rollout methods for planning in Markov Decision Processes (MDPs). Our

RELATED CATEGORIES

PLANNING AND SCHEDULING

Sample-Based Planning for Continuous Action Markov Decision Processes

Chris Mansley

RELATED CATEGORIES

MORE VIDEOS FROM THE EVENT

MORE VIDEOS FROM THE SAME CATEGORIES