Markov Decision Processes with Ordinal Rewards: Reference Point-Based Preferences

In a standard Markov decision process (MDP), rewards are assumed to be precisely known and of quantitative nature. This can be a too strong hypothesis in some situations. When rewards can really be

RELATED CATEGORIES

PLANNING AND SCHEDULING

Markov Decision Processes with Ordinal Rewards: Reference Point-Based Preferences

Paul Weng

RELATED CATEGORIES

MORE VIDEOS FROM THE EVENT

MORE VIDEOS FROM THE SAME CATEGORIES