Artículo

Mixed Acceleration Techniques for Solving Quickly Stochastic Shortest-Path Markov Decision Processes

García Hernández, M. de G.; Ruiz Pinales, J.; Onaindía, E.; Ledesma Orozco, S.; Aviña Cervantes, J. G.; Alvarado Méndez, E.; Reyes Ballesteros, A.

Instituto de Ciencias Aplicadas y Tecnología, UNAM, publicado en Journal of Applied Research and Technology, y cosechado de Revistas UNAM

Licencia de uso

Procedencia del contenido

Entidad o dependencia

Instituto de Ciencias Aplicadas y Tecnología, UNAM

Revista

Journal of Applied Research and Technology

Repositorio

Revistas UNAM

Contacto

Revistas UNAM. Dirección General de Publicaciones y Fomento Editorial, UNAM en revistas@unam.mx

Cita

García Hernández, M. de G., et al. (2011). Mixed Acceleration Techniques for Solving Quickly Stochastic Shortest-Path Markov Decision Processes. Journal of Applied Research and Technology; Vol. 9 Núm. 02. Recuperado de https://repositorio.unam.mx/contenidos/45466

Descripción del recurso

Autor(es)

García Hernández, M. de G.; Ruiz Pinales, J.; Onaindía, E.; Ledesma Orozco, S.; Aviña Cervantes, J. G.; Alvarado Méndez, E.; Reyes Ballesteros, A.

Tipo

Artículo de Investigación

Área del conocimiento

Ingenierías

Título

Mixed Acceleration Techniques for Solving Quickly Stochastic Shortest-Path Markov Decision Processes

Fecha

2011-08-01

Resumen

In this paper we propose the combination of accelerated variants of value iteration mixed with improved prioritizedsweeping for the fast solution of stochastic shortest-path Markov decision processes. Value iteration is a classicalalgorithm for solving Markov decision processes, but this algorithm and its variants are quite slow for solvingconsiderably large problems. In order to improve the solution time, acceleration techniques such as asynchronousupdates, prioritization and prioritized sweeping have been explored in this paper. A topological reordering algorithmwas also compared with static reordering. Experimental results obtained on finite state and action-space stochasticshortest-path problems show that our approach achieves a considerable reduction in the solution time with respect tothe tested variants of value iteration. For instance, the experiments showed in one test a reduction of 5.7 times withrespect to value iteration with asynchronous updates.

Tema

Markov decision processes; acceleration techniques; prioritization; procesos de decisión de Markov; técnicas de aceleración; la ordenación

Idioma

eng

ISSN

ISSN electrónico: 2448-6736; ISSN: 1665-6423

Enlaces

Ficha original

Contenido completo

No entro en nada

No entro en nada 2

Mixed Acceleration Techniques for Solving Quickly Stochastic Shortest-Path Markov Decision Processes

Licencia de uso

Procedencia del contenido

Cita

Descripción del recurso

Enlaces