Aprendizaje por refuerzo basado en interacción de características para detección de anomalías tabulares
Autores: Liu, Yaoxun; Ma, Liangli; Wang, Muyuan; Zhang, Siyuan
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Aprendizaje por refuerzo basado en interacción de características para detección de anomalías tabulares
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje profundo
Detección de anomalías
Datos tabulares
Aprendizaje semi-supervisado
Interacción de características
Aprendizaje por refuerzo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
La detección de anomalías basada en aprendizaje profundo (DAD) ha sido un tema candente de investigación en varios dominios. A pesar de ser el tipo de datos más común, DAD para datos tabulares sigue siendo poco explorado. Debido a la escasez de anomalías en escenarios del mundo real, los métodos de aprendizaje profundo semi-supervisado han llegado a dominar, construyendo modelos de aprendizaje profundo y aprovechando un número limitado de anomalías etiquetadas y datos no etiquetados a gran escala para mejorar sus capacidades de detección. Sin embargo, los trabajos existentes comparten dos inconvenientes. (1) La mayoría de ellos simplemente tratan las muestras no etiquetadas como normales, ignorando el problema de la contaminación de etiquetas, que es muy común en conjuntos de datos del mundo real. (2) Solo unos pocos trabajos han diseñado modelos específicamente para datos tabulares en lugar de migrar modelos de otros dominios a datos tabulares. Ambos limitarán el rendimiento del modelo. En este trabajo, proponemos un aprendizaje por refuerzo basado en interacción de características para la detección de anomalías tabulares, FIRTAD. FIRTAD incorpora un módulo de interacción de características en un marco de aprendizaje por refuerzo profundo; el primero puede modelar datos tabulares aprendiendo una relación entre características, mientras que el segundo puede explotar efectivamente la información disponible y explorar completamente anomalías sospechosas de las muestras no etiquetadas. Experimentos extensos en tres conjuntos de datos no solo demuestran su superioridad sobre los métodos de vanguardia, sino que también confirman su robustez ante la rareza de anomalías, la contaminación de etiquetas y las anomalías desconocidas.
Descripción
La detección de anomalías basada en aprendizaje profundo (DAD) ha sido un tema candente de investigación en varios dominios. A pesar de ser el tipo de datos más común, DAD para datos tabulares sigue siendo poco explorado. Debido a la escasez de anomalías en escenarios del mundo real, los métodos de aprendizaje profundo semi-supervisado han llegado a dominar, construyendo modelos de aprendizaje profundo y aprovechando un número limitado de anomalías etiquetadas y datos no etiquetados a gran escala para mejorar sus capacidades de detección. Sin embargo, los trabajos existentes comparten dos inconvenientes. (1) La mayoría de ellos simplemente tratan las muestras no etiquetadas como normales, ignorando el problema de la contaminación de etiquetas, que es muy común en conjuntos de datos del mundo real. (2) Solo unos pocos trabajos han diseñado modelos específicamente para datos tabulares en lugar de migrar modelos de otros dominios a datos tabulares. Ambos limitarán el rendimiento del modelo. En este trabajo, proponemos un aprendizaje por refuerzo basado en interacción de características para la detección de anomalías tabulares, FIRTAD. FIRTAD incorpora un módulo de interacción de características en un marco de aprendizaje por refuerzo profundo; el primero puede modelar datos tabulares aprendiendo una relación entre características, mientras que el segundo puede explotar efectivamente la información disponible y explorar completamente anomalías sospechosas de las muestras no etiquetadas. Experimentos extensos en tres conjuntos de datos no solo demuestran su superioridad sobre los métodos de vanguardia, sino que también confirman su robustez ante la rareza de anomalías, la contaminación de etiquetas y las anomalías desconocidas.