Detección de anomalías basada en entropía para modelado de mezclas gaussianas
Autores: Scrucca, Luca
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Detección de anomalías basada en entropía para modelado de mezclas gaussianas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Modelado de mezcla gaussiana
Modelo probabilístico
Componente de ruido
Detección de anomalías
Procedimiento basado en entropía
Valores atípicos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
El modelado de mezclas gaussianas es un modelo probabilístico generativo que asume que los datos observados son generados a partir de una mezcla de múltiples distribuciones gaussianas. Este modelo de mezcla proporciona un enfoque flexible para modelar distribuciones complejas que pueden no ser fácilmente representadas por una sola distribución gaussiana. El modelo de mezcla gaussiana con un componente de ruido se refiere a una mezcla finita que incluye un componente de ruido adicional para modelar el ruido de fondo o los valores atípicos en los datos. Este componente de ruido adicional ayuda a tener en cuenta la presencia de anomalías o valores atípicos en los datos. Este último aspecto es crucial para la detección de anomalías en situaciones donde se requiere una clara advertencia temprana de una condición anormal. Este artículo propone un procedimiento novedoso basado en entropía para inicializar el componente de ruido en los modelos de mezcla gaussiana. Nuestro enfoque se muestra ser fácil de implementar y efectivo para la detección de anomalías. Identificamos con éxito anomalías en conjuntos de datos simulados y del mundo real, incluso en presencia de niveles significativos de ruido y valores atípicos. Proporcionamos una descripción paso a paso del proceso de análisis de datos propuesto, junto con el código R correspondiente, que está disponible públicamente en un repositorio de GitHub.
Descripción
El modelado de mezclas gaussianas es un modelo probabilístico generativo que asume que los datos observados son generados a partir de una mezcla de múltiples distribuciones gaussianas. Este modelo de mezcla proporciona un enfoque flexible para modelar distribuciones complejas que pueden no ser fácilmente representadas por una sola distribución gaussiana. El modelo de mezcla gaussiana con un componente de ruido se refiere a una mezcla finita que incluye un componente de ruido adicional para modelar el ruido de fondo o los valores atípicos en los datos. Este componente de ruido adicional ayuda a tener en cuenta la presencia de anomalías o valores atípicos en los datos. Este último aspecto es crucial para la detección de anomalías en situaciones donde se requiere una clara advertencia temprana de una condición anormal. Este artículo propone un procedimiento novedoso basado en entropía para inicializar el componente de ruido en los modelos de mezcla gaussiana. Nuestro enfoque se muestra ser fácil de implementar y efectivo para la detección de anomalías. Identificamos con éxito anomalías en conjuntos de datos simulados y del mundo real, incluso en presencia de niveles significativos de ruido y valores atípicos. Proporcionamos una descripción paso a paso del proceso de análisis de datos propuesto, junto con el código R correspondiente, que está disponible públicamente en un repositorio de GitHub.