Artículo

Determinación Automática de Roles Semánticos usando Preferencias de Selección sobre Corpus muy Grandes

Centro de Investigación en Computación, Dirección General de Servicios de Cómputo Académico, IPN, publicado en Computación y Sistemas, y cosechado de Revistas UNAM

Procedencia del contenido

Entidad o dependencia
Centro de Investigación en Computación, Dirección General de Servicios de Cómputo Académico, IPN
Revista
Repositorio
Contacto
Revistas UNAM. Dirección General de Publicaciones y Fomento Editorial, UNAM en revistas@unam.mx

Cita

Determinación Automática de Roles Semánticos usando Preferencias de Selección sobre Corpus muy Grandes. Computación y Sistemas; Vol 12, No 001, 2008. Recuperado de https://repositorio.unam.mx/contenidos/29444

Descripción del recurso

Colaborador(es)
Calvo, Hirman ; Gelbukh, Alexander
Tipo
Artículo de Investigación
Área del conocimiento
Ciencias Sociales y Económicas
Título
Determinación Automática de Roles Semánticos usando Preferencias de Selección sobre Corpus muy Grandes
Resumen
SE PRESENTA UN MÉTODO PARA RECONOCER LOS ROLES SEMÁNTICOS DE LAS ORACIONES EN ESPAÑOL, ES DECIR, IDENTIFICAR EL PAPEL QUE TIENE CADA UNO DE LOS ELEMENTOS DE LA ORACIÓN. ESTE MÉTODO SE BASA EN ANÁLISIS DE DEPENDENCIAS USANDO REGLAS HEURÍSTICAS PARA INFERIR RELACIONES DE DEPENDENCIA ENTRE PALABRAS, ASÍ COMO ESTADÍSTICAS DE CO-OCURRENCIA (APRENDIDAS DE MANERA NO SUPERVISADA) PARA RESOLVER AMBIGÜEDADES COMO LA ADJUNCIÓN DE SINTAGMA PREPOSICIONAL. SI NO SE PUEDE PRODUCIR UN ANÁLISIS COMPLETO, SE CONSTRUYE UNA ESTRUCTURA PARCIAL CON ALGUNAS (SI NO TODAS) RELACIONES DE DEPENDENCIA IDENTIFICADAS. LA EVALUACIÓN MUESTRA QUE A PESAR DE SU SIMPLICIDAD, LA PRECISIÓN DEL ANALIZADOR ES SUPERIOR A AQUELLA DE LOS ANALIZADORES EXISTENTES ACTUALES PARA EL ESPAÑOL. A PESAR DE QUE CIERTAS REGLAS GRAMATICALES Y LOS RECURSOS LÉXICOS USADOS SON ESPECÍFICOS PARA EL ESPAÑOL, EL ENFOQUE SUGERIDO ES INDEPENDIENTE DEL LENGUAJE. UNA AMBIGÜEDAD INTERESANTE QUE HEMOS DECIDIDO ANALIZAR A MAYOR PROFUNDIDAD, ES LA DESAMBIGUACIÓN DE SINTAGMA PREPOSICIONAL. COMPUTACIÓN Y SISTEMAS VOL. 12 NO. 1, 2008, PP 128-150 ISSN 1405-5546 AUTOMATIC SEMANTIC ROLE LABELING USING SELECTIONAL PREFERENCES WITH VERY LARGE CORPORA 129 EL SISTEMA USA UN CONJUNTO ORDENADO DE REGLAS HEURÍSTICAS SIMPLES PARA DETERMINAR ITERATIVAMENTE LAS RELACIONES ENTRE PALABRAS PARA LAS CUALES NO SE LES HA ASIGNADO AÚN UN GOBERNANTE. PARA RESOLVER CIERTOS CASOS DE AMBIGÜEDAD USAMOS ESTADÍSTICAS DE CO-OCURRENCIAS DE PALABRAS. ESTAS ESTADÍSTICAS HAN SIDO OBTENIDAS PREVIAMENTE DE UNA MANERA NO SUPERVISADA, YA SEA A PARTIR DE GRANDES CORPUS DE TEXTO, O A TRAVÉS DE INTERNET (A TRAVÉS DE UN MOTOR DE BÚSQUEDA COMO GOOGLE). EL CONJUNTO DE ESTADÍSTICAS DE CO-OCURRENCIAS DE USO CONFORMAN UNA BASE DE DATOS DE PREFERENCIAS DE SELECCIÓN. PARA EVALUAR ESTE SISTEMA, DESARROLLAMOS UN MÉTODO PARA CONVERTIR UN ESTÁNDAR EXISTENTE, DE UN FORMATO DE CONSTITUYENTES A UN FORMATO DE DEPENDENCIAS. ADICIONALMENTE, CADA UNO DE LOS MÓDULOS DEL SISTEMA (ADQUISICIÓN DE PREFERENCIAS DE SELECCIÓN, DESAMBIGUACIÓN DE SINTAGMA PREPOSICIONAL) SE EVALÚA DE UNA FORMA SEPARADA E INDEPENDIENTE PARA VERIFICAR SU CORRECTO FUNCIONAMIENTO. FINALMENTE, PRESENTAMOS ALGUNAS APLICACIONES DE NUESTRO SISTEMA: DESAMBIGUACIÓN DE SENTIDOS DE PALABRAS Y ESTAGANOGRAFÍA LINGÜÍSTICA.
Tema
Análisis De Dependencias; Desambiguación De Frase Preposicional; Conversión De Constituyentes A Dependencias; Reglas Heurísticas; Analizador Sintáctico Híbrido; Preferencias De Selección
Idioma
spa
ISSN
1405-5546

Enlaces