El problema de gramática más pequeño como elección de constituyentes y análisis de gramática mínima
Autores: Carrascosa, Rafael; Coste, François; Gallé, Matthias; Infante-Lopez, Gabriel
Idioma: Inglés
Editor: Molecular Diversity Preservation International (MDPI)
Año: 2011
Acceso abierto
Artículo científico
2011
El problema de gramática más pequeño como elección de constituyentes y análisis de gramática mínima
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Encontrar
Gramática libre de contexto
Complejidad de Kolmogorov
Compresión de datos
Descubrimiento de patrones
Algoritmos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
El problema gramatical más pequeño, es decir, encontrar una gramática libre de contexto más pequeña que genere exactamente una secuencia, es de importancia práctica y teórica en campos como la complejidad de Kolmogorov, la compresión de datos y el descubrimiento de patrones. Proponemos una nueva perspectiva sobre este problema al dividirlo en dos tareas: (1) elegir qué palabras serán los constituyentes de la gramática y (2) buscar la gramática más pequeña dada este conjunto de constituyentes. Mostramos cómo resolver la segunda tarea en tiempo polinómico al analizar el constituyente más largo con los más pequeños. Proponemos nuevos algoritmos basados en algoritmos prácticos clásicos que utilizan esta optimización para encontrar gramáticas pequeñas. Nuestros algoritmos encuentran consistentemente gramáticas más pequeñas en un banco de pruebas clásico, reduciendo el tamaño en un 10% en algunos casos. Además, nuestra formulación nos permite definir límites interesantes sobre el número de gramáticas pequeñas y comparar empíricamente diferentes gramáticas de tamaño reducido.
Descripción
El problema gramatical más pequeño, es decir, encontrar una gramática libre de contexto más pequeña que genere exactamente una secuencia, es de importancia práctica y teórica en campos como la complejidad de Kolmogorov, la compresión de datos y el descubrimiento de patrones. Proponemos una nueva perspectiva sobre este problema al dividirlo en dos tareas: (1) elegir qué palabras serán los constituyentes de la gramática y (2) buscar la gramática más pequeña dada este conjunto de constituyentes. Mostramos cómo resolver la segunda tarea en tiempo polinómico al analizar el constituyente más largo con los más pequeños. Proponemos nuevos algoritmos basados en algoritmos prácticos clásicos que utilizan esta optimización para encontrar gramáticas pequeñas. Nuestros algoritmos encuentran consistentemente gramáticas más pequeñas en un banco de pruebas clásico, reduciendo el tamaño en un 10% en algunos casos. Además, nuestra formulación nos permite definir límites interesantes sobre el número de gramáticas pequeñas y comparar empíricamente diferentes gramáticas de tamaño reducido.