Técnicas para tratar los elementos fuera de la diagonal en las matrices de confusión
Autores: Barranco-Chamorro, Inmaculada; Carrillo-García, Rosa M.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Técnicas para tratar los elementos fuera de la diagonal en las matrices de confusión
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Matrices de confusión
Errores
Clases
Proceso de clasificación
Métodos estadísticos
Celdas fuera de la diagonal
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Las matrices de confusión son estructuras numéricas que tratan con la distribución de errores entre diferentes clases o categorías en un proceso de clasificación. Desde una perspectiva de calidad, es de interés saber si la confusión entre la clase verdadera A y la clase etiquetada como B no es la misma que la confusión entre la clase verdadera B y la clase etiquetada como A. De lo contrario, puede existir un problema con el clasificador o de identificabilidad entre clases. En este artículo se consideran dos métodos estadísticos para abordar este problema. Ambos se centran en el estudio de las celdas fuera de la diagonal en las matrices de confusión. En primer lugar, se consideran pruebas de tipo McNemar para probar la homogeneidad marginal, las cuales deben seguirse a partir de un estudio de uno contra todos para cada par de categorías. En segundo lugar, se introduce una propuesta bayesiana basada en la distribución de Dirichlet. Esto nos permite evaluar las probabilidades de clasificación errónea en una matriz de confusión. Se han realizado tres aplicaciones, incluido un conjunto de datos ómicos, utilizando el software R.
Descripción
Las matrices de confusión son estructuras numéricas que tratan con la distribución de errores entre diferentes clases o categorías en un proceso de clasificación. Desde una perspectiva de calidad, es de interés saber si la confusión entre la clase verdadera A y la clase etiquetada como B no es la misma que la confusión entre la clase verdadera B y la clase etiquetada como A. De lo contrario, puede existir un problema con el clasificador o de identificabilidad entre clases. En este artículo se consideran dos métodos estadísticos para abordar este problema. Ambos se centran en el estudio de las celdas fuera de la diagonal en las matrices de confusión. En primer lugar, se consideran pruebas de tipo McNemar para probar la homogeneidad marginal, las cuales deben seguirse a partir de un estudio de uno contra todos para cada par de categorías. En segundo lugar, se introduce una propuesta bayesiana basada en la distribución de Dirichlet. Esto nos permite evaluar las probabilidades de clasificación errónea en una matriz de confusión. Se han realizado tres aplicaciones, incluido un conjunto de datos ómicos, utilizando el software R.