dor_id: 4124145

506.#.#.a: Público

590.#.#.d: Los artículos enviados a la revista Biblioteca Universitaria", se juzgan por medio de un proceso de revisión por pares

510.0.#.a: Citas Latinoamericanas en Ciencias Sociales y Humanidades (CLASE); Información y Bibliotecología Latinoamericana (INFOBILA); Base de datos de la Universidad Complutense de Madrid (COMPLUDOC) y Catálogo de revistas científicas y arbitradas de la UNAM

561.#.#.u: http://dgb.unam.mx/

650.#.4.x: Multidisciplina

336.#.#.b: article

336.#.#.3: Artículo Técnico-Profesional

336.#.#.a: Artículo

351.#.#.6: https://bibliotecauniversitaria.dgb.unam.mx/rbu

351.#.#.b: Biblioteca Universitaria

351.#.#.a: Artículos

harvesting_group: RevistasUNAM

270.1.#.p: Revistas UNAM. Dirección General de Publicaciones y Fomento Editorial, UNAM en revistas@unam.mx

590.#.#.c: Open Journal Systems (OJS)

270.#.#.d: MX

270.1.#.d: México

590.#.#.b: Concentrador

883.#.#.u: https://revistas.unam.mx/catalogo/

883.#.#.a: Revistas UNAM

590.#.#.a: Coordinación de Difusión Cultural

883.#.#.1: https://www.publicaciones.unam.mx/

883.#.#.q: Dirección General de Publicaciones y Fomento Editorial

850.#.#.a: Universidad Nacional Autónoma de México

856.4.0.u: https://bibliotecauniversitaria.dgb.unam.mx/rbu/article/view/39/35

100.1.#.a: Ballesteros Estrada, Silvia Socorro; Morales Romero, Guillermo; Cedillo Pérez, Pavel Alfredo

524.#.#.a: Ballesteros Estrada, Silvia Socorro, et al. (2012). Los problemas de identificación de caracteres OCR para la recuperación de texto en el libro antiguo: un análisis de caso en el Fondo Antiguo de la Biblioteca Central, UNAM. Biblioteca Universitaria; Vol. 15 Núm. 1, 2012; 25-34. Recuperado de https://repositorio.unam.mx/contenidos/4124145

245.1.0.a: Los problemas de identificación de caracteres OCR para la recuperación de texto en el libro antiguo: un análisis de caso en el Fondo Antiguo de la Biblioteca Central, UNAM

502.#.#.c: Universidad Nacional Autónoma de México

561.1.#.a: Dirección General de Bibliotecas y Servicios Digitales de Información, UNAM

264.#.0.c: 2012

264.#.1.c: 2012-06-20

653.#.#.a: Text recognition; OCR; ancient collections; digitization; Reconocimiento de texto; OCR; libro antiguo; digitalización de obras antiguas

506.1.#.a: La titularidad de los derechos patrimoniales de esta obra pertenece a las instituciones editoras. Su uso se rige por una licencia Creative Commons BY-NC-SA 4.0 Internacional, https://creativecommons.org/licenses/by-nc-sa/4.0/legalcode.es, para un uso diferente consultar al responsable jurídico del repositorio por medio del correo electrónico revistabu@dgb.unam.mx

884.#.#.k: https://bibliotecauniversitaria.dgb.unam.mx/rbu/article/view/39

001.#.#.#: 024.oai:ojs.pkp.sfu.ca:article/39

041.#.7.h: spa

520.3.#.a: El presente artículo describe de manera general los problemas enfrentados para lograr una correcta recuperación de texto por medio del reconocimiento óptico de caracteres (OCR) en el libro antiguo, tomando una muestra de las obras de los siglos XV al XVIII que resguarda el Fondo Antiguo de la Biblioteca Central de la Universidad Nacional Autónoma de México (UNAM), digitalizadas por la Dirección General de Bibliotecas (DGB). Se presenta, en primer lugar, la exposición teórica conceptual del OCR y su aplicación en la recuperación de texto para continuar con la ejemplificación de los factores que determinan la correcta o incorrecta identificación de los grafemas en estos libros mediante las pruebas aplicadas con el software Adobe Acrobat 8 Professional® y, por último, muestra algunos hallazgos obtenidos como producto del análisis e interpretación de los datos correspondientes a las variables.

773.1.#.t: Biblioteca Universitaria; Vol. 15 Núm. 1 (2012); 25-34

773.1.#.o: https://bibliotecauniversitaria.dgb.unam.mx/rbu

046.#.#.j: 2021-11-25 00:00:00.000000

022.#.#.a: ISSN electrónico: 2594-0074

310.#.#.a: Semestral

300.#.#.a: Páginas: 25-34

264.#.1.b: Dirección General de Bibliotecas y Servicios Digitales de Información, UNAM

doi: https://doi.org/10.22201/dgb.0187750xp.2012.1.39

handle: 00d46af2f3385a9a

harvesting_date: 2023-06-20 16:00:00.0

856.#.0.q: application/pdf

file_creation_date: 2012-07-23 17:12:51.0

file_modification_date: 2012-07-23 17:12:54.0

file_name: 368cd195b86528d280c51c3e8adba23333f17d88eb8e7015f51cec1a8aef875f.pdf

file_pages_number: 10

file_format_version: application/pdf; version=1.5

file_size: 921405

245.1.0.b: Identification problems for OCR characters for text retrieval in ancient books: A case study in the Ancient Collections of the Central Library at UNAM

last_modified: 2023-06-20 16:00:00

license_url: https://creativecommons.org/licenses/by-nc-sa/4.0/legalcode.es

license_type: by-nc-sa

No entro en nada

No entro en nada 2

Artículo

Los problemas de identificación de caracteres OCR para la recuperación de texto en el libro antiguo: un análisis de caso en el Fondo Antiguo de la Biblioteca Central, UNAM

Ballesteros Estrada, Silvia Socorro; Morales Romero, Guillermo; Cedillo Pérez, Pavel Alfredo

Dirección General de Bibliotecas y Servicios Digitales de Información, UNAM, publicado en Biblioteca Universitaria, y cosechado de Revistas UNAM

Licencia de uso

Procedencia del contenido

Entidad o dependencia
Dirección General de Bibliotecas y Servicios Digitales de Información, UNAM
Revista
Repositorio
Contacto
Revistas UNAM. Dirección General de Publicaciones y Fomento Editorial, UNAM en revistas@unam.mx

Cita

Ballesteros Estrada, Silvia Socorro, et al. (2012). Los problemas de identificación de caracteres OCR para la recuperación de texto en el libro antiguo: un análisis de caso en el Fondo Antiguo de la Biblioteca Central, UNAM. Biblioteca Universitaria; Vol. 15 Núm. 1, 2012; 25-34. Recuperado de https://repositorio.unam.mx/contenidos/4124145

Descripción del recurso

Autor(es)
Ballesteros Estrada, Silvia Socorro; Morales Romero, Guillermo; Cedillo Pérez, Pavel Alfredo
Tipo
Artículo Técnico-Profesional
Área del conocimiento
Multidisciplina
Título
Los problemas de identificación de caracteres OCR para la recuperación de texto en el libro antiguo: un análisis de caso en el Fondo Antiguo de la Biblioteca Central, UNAM
Fecha
2012-06-20
Resumen
El presente artículo describe de manera general los problemas enfrentados para lograr una correcta recuperación de texto por medio del reconocimiento óptico de caracteres (OCR) en el libro antiguo, tomando una muestra de las obras de los siglos XV al XVIII que resguarda el Fondo Antiguo de la Biblioteca Central de la Universidad Nacional Autónoma de México (UNAM), digitalizadas por la Dirección General de Bibliotecas (DGB). Se presenta, en primer lugar, la exposición teórica conceptual del OCR y su aplicación en la recuperación de texto para continuar con la ejemplificación de los factores que determinan la correcta o incorrecta identificación de los grafemas en estos libros mediante las pruebas aplicadas con el software Adobe Acrobat 8 Professional® y, por último, muestra algunos hallazgos obtenidos como producto del análisis e interpretación de los datos correspondientes a las variables.
Tema
Text recognition; OCR; ancient collections; digitization; Reconocimiento de texto; OCR; libro antiguo; digitalización de obras antiguas
Idioma
spa
ISSN
ISSN electrónico: 2594-0074

Enlaces