logo móvil
Contáctanos

Aprendizaje por refuerzo basado en interacción de características para detección de anomalías tabulares

Autores: Liu, Yaoxun; Ma, Liangli; Wang, Muyuan; Zhang, Siyuan

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Aprendizaje por refuerzo basado en interacción de características para detección de anomalías tabulares


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Aprendizaje profundo
Detección de anomalías
Datos tabulares
Aprendizaje semi-supervisado
Interacción de características
Aprendizaje por refuerzo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 25

Citaciones: Sin citaciones


Descripción
La detección de anomalías basada en aprendizaje profundo (DAD) ha sido un tema candente de investigación en varios dominios. A pesar de ser el tipo de datos más común, DAD para datos tabulares sigue siendo poco explorado. Debido a la escasez de anomalías en escenarios del mundo real, los métodos de aprendizaje profundo semi-supervisado han llegado a dominar, construyendo modelos de aprendizaje profundo y aprovechando un número limitado de anomalías etiquetadas y datos no etiquetados a gran escala para mejorar sus capacidades de detección. Sin embargo, los trabajos existentes comparten dos inconvenientes. (1) La mayoría de ellos simplemente tratan las muestras no etiquetadas como normales, ignorando el problema de la contaminación de etiquetas, que es muy común en conjuntos de datos del mundo real. (2) Solo unos pocos trabajos han diseñado modelos específicamente para datos tabulares en lugar de migrar modelos de otros dominios a datos tabulares. Ambos limitarán el rendimiento del modelo. En este trabajo, proponemos un aprendizaje por refuerzo basado en interacción de características para la detección de anomalías tabulares, FIRTAD. FIRTAD incorpora un módulo de interacción de características en un marco de aprendizaje por refuerzo profundo; el primero puede modelar datos tabulares aprendiendo una relación entre características, mientras que el segundo puede explotar efectivamente la información disponible y explorar completamente anomalías sospechosas de las muestras no etiquetadas. Experimentos extensos en tres conjuntos de datos no solo demuestran su superioridad sobre los métodos de vanguardia, sino que también confirman su robustez ante la rareza de anomalías, la contaminación de etiquetas y las anomalías desconocidas.

Otros recursos que podrían interesarte

Temas Virtualpro