Enfoque de autómatas para la indexación de datos XML
Autores: estáková, Elika; Janouek, Jan
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Enfoque de autómatas para la indexación de datos XML
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Documentos xml
Estructuras de datos en árbol
Problema del índice xml
Teoría de autómatas
Consultas xpath
Estructuras de datos auxiliares
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La estructura interna de los documentos XML se puede ver como un árbol. Los árboles son una de las estructuras de datos fundamentales y bien estudiadas en la informática. Expresan una estructura jerárquica y se utilizan ampliamente en muchas aplicaciones. Este artículo se centra en el problema del procesamiento de estructuras de datos en forma de árbol; en particular, estudia el problema del índice XML. Aunque existen muchos métodos de vanguardia, el problema del índice XML sigue siendo un área de investigación activa. Sin embargo, los métodos existentes suelen carecer de referencias claras a un enfoque sistemático de la teoría estándar de lenguajes formales y autómatas. Por lo tanto, presentamos algunos métodos nuevos que resuelven el problema del índice XML utilizando la teoría de autómatas. Estos métodos son simples y permiten procesar de manera eficiente un pequeño subconjunto de XPath. Así, teniendo una estructura de datos XML, nuestros métodos se pueden utilizar de manera eficiente como estructuras de datos auxiliares que permiten responder a un conjunto particular de consultas, por ejemplo, consultas XPath utilizando cualquier combinación de los ejes hijo y descendiente-o-sí mismo. Dado un modelo de árbol XML con n nodos, la fase de búsqueda utiliza el índice, lee una consulta de entrada de tamaño m, encuentra la respuesta en tiempo O(m) y no depende del tamaño del documento XML original.
Descripción
La estructura interna de los documentos XML se puede ver como un árbol. Los árboles son una de las estructuras de datos fundamentales y bien estudiadas en la informática. Expresan una estructura jerárquica y se utilizan ampliamente en muchas aplicaciones. Este artículo se centra en el problema del procesamiento de estructuras de datos en forma de árbol; en particular, estudia el problema del índice XML. Aunque existen muchos métodos de vanguardia, el problema del índice XML sigue siendo un área de investigación activa. Sin embargo, los métodos existentes suelen carecer de referencias claras a un enfoque sistemático de la teoría estándar de lenguajes formales y autómatas. Por lo tanto, presentamos algunos métodos nuevos que resuelven el problema del índice XML utilizando la teoría de autómatas. Estos métodos son simples y permiten procesar de manera eficiente un pequeño subconjunto de XPath. Así, teniendo una estructura de datos XML, nuestros métodos se pueden utilizar de manera eficiente como estructuras de datos auxiliares que permiten responder a un conjunto particular de consultas, por ejemplo, consultas XPath utilizando cualquier combinación de los ejes hijo y descendiente-o-sí mismo. Dado un modelo de árbol XML con n nodos, la fase de búsqueda utiliza el índice, lee una consulta de entrada de tamaño m, encuentra la respuesta en tiempo O(m) y no depende del tamaño del documento XML original.