Una Heurística de Conjunción de Patrones Frecuentes para la Generación de Reglas en Flujos de Datos
Autores: Stahl, Frederic; Le, Thien; Badii, Atta; Gaber, Mohamed Medhat
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Una Heurística de Conjunción de Patrones Frecuentes para la Generación de Reglas en Flujos de Datos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Algoritmo
Minería de flujos de datos
En tiempo real
Inducción de reglas descriptivas
Deriva de concepto
Expresividad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este artículo presenta un nuevo y expresivo algoritmo para inducir conjuntos de reglas descriptivas a partir de datos en streaming en tiempo real, con el fin de describir patrones frecuentes explícitamente codificados en el flujo. La Minería de Datos en Streaming (DSM) se ocupa del análisis automático de flujos de datos en tiempo real. Los rápidos flujos de datos desafían la infraestructura de procesamiento y comunicación de última generación, de ahí la motivación para la investigación y la innovación en algoritmos en tiempo real que analizan flujos de datos sobre la marcha y pueden adaptarse automáticamente a los cambios de concepto. Hasta la fecha, las técnicas de DSM se han centrado en gran medida en aplicaciones de minería de datos predictiva que buscan prever el valor de una característica objetivo particular de instancias de datos no vistas, respondiendo preguntas como si una transacción con tarjeta de crédito es fraudulenta o no. No se ha establecido previamente una técnica de Minería de Datos en tiempo real, expresiva y descriptiva para datos en streaming como parte del conjunto de herramientas de DSM. Esto ha motivado el trabajo reportado en este artículo, que ha resultado en el desarrollo y validación de una herramienta de Inducción de Reglas Generalizada (GRI), produciendo así reglas expresivas como explicaciones que pueden ser fácilmente entendidas por analistas humanos. La expresividad de los modelos de decisión en flujos de datos sirve a los objetivos de transparencia, sustentando la visión de "IA explicable" y, sin embargo, es un área de investigación que ha atraído menos atención a pesar de su alta importancia práctica. El algoritmo introducido y descrito en este artículo se denomina Inducción Rápida de Reglas Generalizadas (FGRI). FGRI es capaz de inducir reglas descriptivas de manera incremental para datos en bruto a partir de características categóricas y numéricas. FGRI puede adaptar conjuntos de reglas a los cambios del patrón codificado en el flujo de datos (cambio de concepto) sobre la marcha a medida que llegan nuevos datos y, por lo tanto, puede aplicarse continuamente en tiempo real. El artículo también proporciona una evaluación teórica, cualitativa y empírica de FGRI.
Descripción
Este artículo presenta un nuevo y expresivo algoritmo para inducir conjuntos de reglas descriptivas a partir de datos en streaming en tiempo real, con el fin de describir patrones frecuentes explícitamente codificados en el flujo. La Minería de Datos en Streaming (DSM) se ocupa del análisis automático de flujos de datos en tiempo real. Los rápidos flujos de datos desafían la infraestructura de procesamiento y comunicación de última generación, de ahí la motivación para la investigación y la innovación en algoritmos en tiempo real que analizan flujos de datos sobre la marcha y pueden adaptarse automáticamente a los cambios de concepto. Hasta la fecha, las técnicas de DSM se han centrado en gran medida en aplicaciones de minería de datos predictiva que buscan prever el valor de una característica objetivo particular de instancias de datos no vistas, respondiendo preguntas como si una transacción con tarjeta de crédito es fraudulenta o no. No se ha establecido previamente una técnica de Minería de Datos en tiempo real, expresiva y descriptiva para datos en streaming como parte del conjunto de herramientas de DSM. Esto ha motivado el trabajo reportado en este artículo, que ha resultado en el desarrollo y validación de una herramienta de Inducción de Reglas Generalizada (GRI), produciendo así reglas expresivas como explicaciones que pueden ser fácilmente entendidas por analistas humanos. La expresividad de los modelos de decisión en flujos de datos sirve a los objetivos de transparencia, sustentando la visión de "IA explicable" y, sin embargo, es un área de investigación que ha atraído menos atención a pesar de su alta importancia práctica. El algoritmo introducido y descrito en este artículo se denomina Inducción Rápida de Reglas Generalizadas (FGRI). FGRI es capaz de inducir reglas descriptivas de manera incremental para datos en bruto a partir de características categóricas y numéricas. FGRI puede adaptar conjuntos de reglas a los cambios del patrón codificado en el flujo de datos (cambio de concepto) sobre la marcha a medida que llegan nuevos datos y, por lo tanto, puede aplicarse continuamente en tiempo real. El artículo también proporciona una evaluación teórica, cualitativa y empírica de FGRI.