Artículo

Los problemas de identificación de caracteres OCR para la recuperación de texto en el libro antiguo: un análisis de caso en el Fondo Antiguo de la Biblioteca Central, UNAM

Ballesteros Estrada, Silvia Socorro

Dirección General de Bibliotecas, UNAM, publicado en Biblioteca Universitaria, y cosechado de Revistas UNAM

Licencia de uso

Procedencia del contenido

Entidad o dependencia
Dirección General de Bibliotecas, UNAM
Revista
Repositorio
Contacto
Revistas UNAM. Dirección General de Publicaciones y Fomento Editorial, UNAM en revistas@unam.mx

Cita

Ballesteros Estrada, Silvia Socorro. (2012). Los problemas de identificación de caracteres OCR para la recuperación de texto en el libro antiguo: un análisis de caso en el Fondo Antiguo de la Biblioteca Central, UNAM. Biblioteca Universitaria; Vol 15, No 1, 2012. Recuperado de https://repositorio.unam.mx/contenidos/51763

Descripción del recurso

Autor(es)
Ballesteros Estrada, Silvia Socorro
Adscripción del autor
Secretaria Técnica De Biblioteca Digital, Dirección General De Bibliotecas. Anexo De La Dgb
Tipo
Artículo Técnico-Profesional
Área del conocimiento
Multidisciplina
Título
Los problemas de identificación de caracteres OCR para la recuperación de texto en el libro antiguo: un análisis de caso en el Fondo Antiguo de la Biblioteca Central, UNAM
Fecha
2012-08-03
Resumen
El presente artículo describe de manera general los problemas enfrentados para lograr una correcta recuperación de texto por medio del reconocimiento óptico de caracteres (ocr) en el libro antiguo, tomando una muestra de las obras de los siglos xv al xviii que resguarda el Fondo Antiguo de la Biblioteca Central de la Universidad Nacional Autónoma de México (unam), digitalizadas por la Dirección General de Bibliotecas (dgb). Se presenta, en primer lugar, la exposición teórica conceptual del ocr y su aplicación en la recuperación de texto para continuar con la ejemplificación de los factores que determinan la correcta o incorrecta identificación de los grafemas en estos libros mediante las pruebas aplicadas con el software Adobe Acrobat 8 Professional® y, por último, muestra algunos hallazgos obtenidos como producto del análisis e interpretación de los datos correspondientes a las variables.
Idioma
spa
ISSN
0187-750X

Enlaces