dor_id: 4142306

506.#.#.a: Público

590.#.#.d: Los artículos enviados a la revista "Investigación Bibliotecológica: Archivonomía, Bibliotecología e Información", se juzgan por medio de un proceso de revisión por pares

510.0.#.a: Consejo Nacional de Ciencia y Tecnología (CONACyT); Sistema Regional de Información en Línea para Revistas Científicas de América Latina, el Caribe, España y Portugal (Latindex); Scientific Electronic Library Online (SciELO); SCOPUS, Web Of Science (WoS); SCImago Journal Rank (SJR); Latinoamericanas en Ciencias Sociales y Humanidades (CLASE); Science Direct (ELSEVIER); Dialnet, Directory of Open Access Journals (DOAJ); Library & Information Science Abstracts (LISA) , Red Bibliotecas y Archivos (CSIC)

561.#.#.u: https://iibi.unam.mx/

650.#.4.x: Ciencias Sociales y Económicas

336.#.#.b: article

336.#.#.3: Artículo de Investigación

336.#.#.a: Artículo

351.#.#.6: http://rev-ib.unam.mx/ib/index.php/ib/index

351.#.#.b: Investigación Bibliotecológica: Archivonomía, Bibliotecología e Información

351.#.#.a: Artículos

harvesting_group: RevistasUNAM

270.1.#.p: Revistas UNAM. Dirección General de Publicaciones y Fomento Editorial, UNAM en revistas@unam.mx

590.#.#.c: Open Journal Systems (OJS)

270.#.#.d: MX

270.1.#.d: México

590.#.#.b: Concentrador

883.#.#.u: https://revistas.unam.mx/catalogo/

883.#.#.a: Revistas UNAM

590.#.#.a: Coordinación de Difusión Cultural

883.#.#.1: https://www.publicaciones.unam.mx/

883.#.#.q: Dirección General de Publicaciones y Fomento Editorial

850.#.#.a: Universidad Nacional Autónoma de México

856.4.0.u: http://rev-ib.unam.mx/ib/index.php/ib/article/view/58419/52185

100.1.#.a: Polo Bautista, Luis Roberto; Martínez Acevedo, Karen Vanessa

524.#.#.a: Polo Bautista, Luis Roberto, et al. (2021). Algoritmo para el análisis temático de documentos digitales. Investigación Bibliotecológica. Archivonomía, bibliotecología e información; Vol. 35 No. 89, 2021; 13-31. Recuperado de https://repositorio.unam.mx/contenidos/4142306

245.1.0.a: Algoritmo para el análisis temático de documentos digitales

502.#.#.c: Universidad Nacional Autónoma de México

561.1.#.a: Instituto de Investigaciones Bibliotecológicas y de la Información, UNAM

264.#.0.c: 2021

264.#.1.c: 2021-09-27

653.#.#.a: Latent Dirichlet Allocation; Algorithms; Thematic Analysis; Digital Documents; Asignación Latente de Dirichlet; Algoritmos; Análisis Temático; Documentos Digitales

506.1.#.a: La titularidad de los derechos patrimoniales de esta obra pertenece a las instituciones editoras. Su uso se rige por una licencia Creative Commons BY-NC-ND 4.0 Internacional, https://creativecommons.org/licenses/by-nc-nd/4.0/legalcode.es, para un uso diferente consultar al responsable jurídico del repositorio por medio del correo electrónico drevista@iibi.unam.mx

884.#.#.k: http://rev-ib.unam.mx/ib/index.php/ib/article/view/58419

001.#.#.#: 070.oai:ojs.pkp.sfu.ca:article/58419

041.#.7.h: spa

520.3.#.a: El objetivo del artículo es presentar un algoritmo para asignar áreas temáticas a documentos digitales que sirva como herramienta de apoyo al análisis temático dentro de la organización de la información, con el fin de ser implementado en el desarrollo de vocabularios controlados. La metodología utilizada consistió en aplicar el Reconocimiento Óptico de Caracteres (ROC) y la Asignación Latente de Dirichlet (ALD) como las principales herramientas para el desarrollo de un algoritmo basado en el lenguaje de programación Python, que permite la lectura de archivos con extensión PDF para la obtención de los principales temas del corpus textual. Los resultados de la aplicación del algoritmo demuestran su utilidad en el área de la indización como un sistema para identificar y extraer temas relevantes de un documento específico en formato electrónico, permitiendo la automatización de procesos por parte del profesional de la información. De esta forma, se concluye su uso como desarrollo de puntos de acceso alternativos en función del contenido de los textos.

773.1.#.t: Investigación Bibliotecológica. Archivonomía, bibliotecología e información; Vol. 35 No. 89 (2021); 13-31

773.1.#.o: http://rev-ib.unam.mx/ib/index.php/ib/index

022.#.#.a: ISSN electrónico: 2448-8321; ISSN impreso: 0187-358X

310.#.#.a: Trimestral

300.#.#.a: Páginas: 13-31

264.#.1.b: Instituto de Investigaciones Bibliotecológicas y de la Información, UNAM

doi: https://doi.org/10.22201/iibi.24488321xe.2021.89.58419

handle: 70cd79a14db83554

harvesting_date: 2023-06-20 17:00:00.0

856.#.0.q: application/pdf

file_creation_date: 2021-09-25 00:56:33.0

file_modification_date: 2021-09-28 14:51:53.0

file_creator: Luis Roberto Polo Bautista

file_name: 299a68f39249136e04e8a8993462ba205d1de7cde634801f3fbc900b77e44680.pdf

file_pages_number: 19

file_format_version: application/pdf; version=1.4

file_size: 782587

245.1.0.b: Algorithm for thematic analysis of digital documents

last_modified: 2023-06-20 17:00:00

license_url: https://creativecommons.org/licenses/by-nc-nd/4.0/legalcode.es

license_type: by-nc-nd

No entro en nada

No entro en nada 2

Artículo

Algoritmo para el análisis temático de documentos digitales

Polo Bautista, Luis Roberto; Martínez Acevedo, Karen Vanessa

Instituto de Investigaciones Bibliotecológicas y de la Información, UNAM, publicado en Investigación Bibliotecológica: Archivonomía, Bibliotecología e Información, y cosechado de Revistas UNAM

Licencia de uso

Procedencia del contenido

Cita

Polo Bautista, Luis Roberto, et al. (2021). Algoritmo para el análisis temático de documentos digitales. Investigación Bibliotecológica. Archivonomía, bibliotecología e información; Vol. 35 No. 89, 2021; 13-31. Recuperado de https://repositorio.unam.mx/contenidos/4142306

Descripción del recurso

Autor(es)
Polo Bautista, Luis Roberto; Martínez Acevedo, Karen Vanessa
Tipo
Artículo de Investigación
Área del conocimiento
Ciencias Sociales y Económicas
Título
Algoritmo para el análisis temático de documentos digitales
Fecha
2021-09-27
Resumen
El objetivo del artículo es presentar un algoritmo para asignar áreas temáticas a documentos digitales que sirva como herramienta de apoyo al análisis temático dentro de la organización de la información, con el fin de ser implementado en el desarrollo de vocabularios controlados. La metodología utilizada consistió en aplicar el Reconocimiento Óptico de Caracteres (ROC) y la Asignación Latente de Dirichlet (ALD) como las principales herramientas para el desarrollo de un algoritmo basado en el lenguaje de programación Python, que permite la lectura de archivos con extensión PDF para la obtención de los principales temas del corpus textual. Los resultados de la aplicación del algoritmo demuestran su utilidad en el área de la indización como un sistema para identificar y extraer temas relevantes de un documento específico en formato electrónico, permitiendo la automatización de procesos por parte del profesional de la información. De esta forma, se concluye su uso como desarrollo de puntos de acceso alternativos en función del contenido de los textos.
Tema
Latent Dirichlet Allocation; Algorithms; Thematic Analysis; Digital Documents; Asignación Latente de Dirichlet; Algoritmos; Análisis Temático; Documentos Digitales
Idioma
spa
ISSN
ISSN electrónico: 2448-8321; ISSN impreso: 0187-358X

Enlaces