Detección de anomalías contextuales en datos de texto
Autores: Mahapatra, Amogh; Srivastava, Nisheeth; Srivastava, Jaideep
Idioma: Inglés
Editor: MDPI
Año: 2012
Acceso abierto
Artículo científico
2012
Detección de anomalías contextuales en datos de texto
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Algoritmo
Detección de anomalías
Información adicional
Contexto semántico
Tasas de falsos positivos
Experimentos computacionales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
Proponemos utilizar información adicional para informar aún más a los algoritmos de detección de anomalías sobre el contexto semántico de los datos de texto que están analizando, considerando así tanto la divergencia del patrón estadístico visto en conjuntos de datos particulares como la divergencia vista desde expectativas semánticas más generales. Los experimentos computacionales muestran que nuestro algoritmo se desempeña según lo esperado en datos que reflejan eventos del mundo real con ambigüedad contextual, mientras que replica el agrupamiento convencional en datos que son demasiado especializados o genéricos para que la información contextual sea útil. Estos resultados sugieren que nuestro algoritmo podría potencialmente reducir las tasas de falsos positivos en los sistemas existentes de detección de anomalías.
Descripción
Proponemos utilizar información adicional para informar aún más a los algoritmos de detección de anomalías sobre el contexto semántico de los datos de texto que están analizando, considerando así tanto la divergencia del patrón estadístico visto en conjuntos de datos particulares como la divergencia vista desde expectativas semánticas más generales. Los experimentos computacionales muestran que nuestro algoritmo se desempeña según lo esperado en datos que reflejan eventos del mundo real con ambigüedad contextual, mientras que replica el agrupamiento convencional en datos que son demasiado especializados o genéricos para que la información contextual sea útil. Estos resultados sugieren que nuestro algoritmo podría potencialmente reducir las tasas de falsos positivos en los sistemas existentes de detección de anomalías.