dor_id: 45466

506.#.#.a: Público

590.#.#.d: Los artículos enviados a la revista "Journal of Applied Research and Technology", se juzgan por medio de un proceso de revisión por pares

510.0.#.a: Scopus, Directory of Open Access Journals (DOAJ); Sistema Regional de Información en Línea para Revistas Científicas de América Latina, el Caribe, España y Portugal (Latindex); Indice de Revistas Latinoamericanas en Ciencias (Periódica); La Red de Revistas Científicas de América Latina y el Caribe, España y Portugal (Redalyc); Consejo Nacional de Ciencia y Tecnología (CONACyT); Google Scholar Citation

561.#.#.u: https://www.icat.unam.mx/

650.#.4.x: Ingenierías

336.#.#.b: article

336.#.#.3: Artículo de Investigación

336.#.#.a: Artículo

351.#.#.6: https://jart.icat.unam.mx/index.php/jart

351.#.#.b: Journal of Applied Research and Technology

351.#.#.a: Artículos

harvesting_group: RevistasUNAM

270.1.#.p: Revistas UNAM. Dirección General de Publicaciones y Fomento Editorial, UNAM en revistas@unam.mx

590.#.#.c: Open Journal Systems (OJS)

270.#.#.d: MX

270.1.#.d: México

590.#.#.b: Concentrador

883.#.#.u: https://revistas.unam.mx/catalogo/

883.#.#.a: Revistas UNAM

590.#.#.a: Coordinación de Difusión Cultural

883.#.#.1: https://www.publicaciones.unam.mx/

883.#.#.q: Dirección General de Publicaciones y Fomento Editorial

850.#.#.a: Universidad Nacional Autónoma de México

856.4.0.u: https://jart.icat.unam.mx/index.php/jart/article/view/439/435

100.1.#.a: García Hernández, M. de G.; Ruiz Pinales, J.; Onaindía, E.; Ledesma Orozco, S.; Aviña Cervantes, J. G.; Alvarado Méndez, E.; Reyes Ballesteros, A.

524.#.#.a: García Hernández, M. de G., et al. (2011). Mixed Acceleration Techniques for Solving Quickly Stochastic Shortest-Path Markov Decision Processes. Journal of Applied Research and Technology; Vol. 9 Núm. 02. Recuperado de https://repositorio.unam.mx/contenidos/45466

245.1.0.a: Mixed Acceleration Techniques for Solving Quickly Stochastic Shortest-Path Markov Decision Processes

502.#.#.c: Universidad Nacional Autónoma de México

561.1.#.a: Instituto de Ciencias Aplicadas y Tecnología, UNAM

264.#.0.c: 2011

264.#.1.c: 2011-08-01

653.#.#.a: Markov decision processes; acceleration techniques; prioritization; procesos de decisión de Markov; técnicas de aceleración; la ordenación

506.1.#.a: La titularidad de los derechos patrimoniales de esta obra pertenece a las instituciones editoras. Su uso se rige por una licencia Creative Commons BY-NC-SA 4.0 Internacional, https://creativecommons.org/licenses/by-nc-sa/4.0/legalcode.es, para un uso diferente consultar al responsable jurídico del repositorio por medio del correo electrónico gabriel.ascanio@icat.unam.mx

884.#.#.k: https://jart.icat.unam.mx/index.php/jart/article/view/439

001.#.#.#: 074.oai:ojs2.localhost:article/439

041.#.7.h: eng

520.3.#.a: In this paper we propose the combination of accelerated variants of value iteration mixed with improved prioritizedsweeping for the fast solution of stochastic shortest-path Markov decision processes. Value iteration is a classicalalgorithm for solving Markov decision processes, but this algorithm and its variants are quite slow for solvingconsiderably large problems. In order to improve the solution time, acceleration techniques such as asynchronousupdates, prioritization and prioritized sweeping have been explored in this paper. A topological reordering algorithmwas also compared with static reordering. Experimental results obtained on finite state and action-space stochasticshortest-path problems show that our approach achieves a considerable reduction in the solution time with respect tothe tested variants of value iteration. For instance, the experiments showed in one test a reduction of 5.7 times withrespect to value iteration with asynchronous updates.

773.1.#.t: Journal of Applied Research and Technology; Vol. 9 Núm. 02

773.1.#.o: https://jart.icat.unam.mx/index.php/jart

022.#.#.a: ISSN electrónico: 2448-6736; ISSN: 1665-6423

310.#.#.a: Bimestral

264.#.1.b: Instituto de Ciencias Aplicadas y Tecnología, UNAM

doi: https://doi.org/10.22201/icat.16656423.2011.9.02.439

harvesting_date: 2023-11-08 13:10:00.0

856.#.0.q: application/pdf

245.1.0.b: Mixed Acceleration Techniques for Solving Quickly Stochastic Shortest-Path Markov Decision Processes

last_modified: 2024-03-19 14:00:00

license_url: https://creativecommons.org/licenses/by-nc-sa/4.0/legalcode.es

license_type: by-nc-sa

_deleted_conflicts: 2-2c7e5d57ac286914225f65561f55589e

No entro en nada

No entro en nada 2

Artículo

Mixed Acceleration Techniques for Solving Quickly Stochastic Shortest-Path Markov Decision Processes

García Hernández, M. de G.; Ruiz Pinales, J.; Onaindía, E.; Ledesma Orozco, S.; Aviña Cervantes, J. G.; Alvarado Méndez, E.; Reyes Ballesteros, A.

Instituto de Ciencias Aplicadas y Tecnología, UNAM, publicado en Journal of Applied Research and Technology, y cosechado de Revistas UNAM

Licencia de uso

Procedencia del contenido

Cita

García Hernández, M. de G., et al. (2011). Mixed Acceleration Techniques for Solving Quickly Stochastic Shortest-Path Markov Decision Processes. Journal of Applied Research and Technology; Vol. 9 Núm. 02. Recuperado de https://repositorio.unam.mx/contenidos/45466

Descripción del recurso

Autor(es)
García Hernández, M. de G.; Ruiz Pinales, J.; Onaindía, E.; Ledesma Orozco, S.; Aviña Cervantes, J. G.; Alvarado Méndez, E.; Reyes Ballesteros, A.
Tipo
Artículo de Investigación
Área del conocimiento
Ingenierías
Título
Mixed Acceleration Techniques for Solving Quickly Stochastic Shortest-Path Markov Decision Processes
Fecha
2011-08-01
Resumen
In this paper we propose the combination of accelerated variants of value iteration mixed with improved prioritizedsweeping for the fast solution of stochastic shortest-path Markov decision processes. Value iteration is a classicalalgorithm for solving Markov decision processes, but this algorithm and its variants are quite slow for solvingconsiderably large problems. In order to improve the solution time, acceleration techniques such as asynchronousupdates, prioritization and prioritized sweeping have been explored in this paper. A topological reordering algorithmwas also compared with static reordering. Experimental results obtained on finite state and action-space stochasticshortest-path problems show that our approach achieves a considerable reduction in the solution time with respect tothe tested variants of value iteration. For instance, the experiments showed in one test a reduction of 5.7 times withrespect to value iteration with asynchronous updates.
Tema
Markov decision processes; acceleration techniques; prioritization; procesos de decisión de Markov; técnicas de aceleración; la ordenación
Idioma
eng
ISSN
ISSN electrónico: 2448-6736; ISSN: 1665-6423

Enlaces