Un estudio comparativo de rendimiento de algoritmos de clasificación para sistemas de apoyo a decisiones clínicas
Autores: Tama, Bayu Adhi; Lim, Sunghoon
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Un estudio comparativo de rendimiento de algoritmos de clasificación para sistemas de apoyo a decisiones clínicas
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Algoritmos de clasificación
Sistemas de apoyo a decisiones clínicas
Tarea de predicción de múltiples enfermedades
Rendimiento del clasificador
Diferentes familias
Predicción de múltiples enfermedades
Referencia de algoritmos de clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Los algoritmos de clasificación son ampliamente tenidos en cuenta para sistemas de apoyo a decisiones clínicas. Sin embargo, no siempre es fácil entender el comportamiento de dichos algoritmos en una tarea de predicción de múltiples enfermedades. Cuando se introduce un nuevo clasificador, en la mayoría de los casos nos preguntaremos si el clasificador funciona bien en un conjunto de datos clínicos particular o no. La decisión de utilizar clasificadores depende en su mayoría del tipo de datos y la tarea de clasificación, por lo que a menudo se toma de manera arbitraria. En este estudio, se aborda una evaluación comparativa de un amplio conjunto de clasificadores pertenecientes a seis familias diferentes, es decir, árboles, conjuntos, neuronales, de probabilidad, discriminantes y basados en reglas. Se tienen en cuenta una serie de conjuntos de datos públicos del mundo real que abarcan diferentes enfermedades en el experimento para demostrar la generalizabilidad de los clasificadores en la predicción de múltiples enfermedades. Se exploran un total de 25 clasificadores, 14 conjuntos de datos y tres técnicas de remuestreo diferentes. Este estudio revela que el clasificador que probablemente se convierta en el mejor intérprete es el bosque de árboles de inferencia condicional (cforest), seguido por el análisis discriminante lineal, el modelo lineal generalizado, el bosque aleatorio y el clasificador de proceso gaussiano. Este trabajo contribuye a la literatura existente sobre una exhaustiva evaluación de referencia de algoritmos de clasificación para la predicción de múltiples enfermedades.
Descripción
Los algoritmos de clasificación son ampliamente tenidos en cuenta para sistemas de apoyo a decisiones clínicas. Sin embargo, no siempre es fácil entender el comportamiento de dichos algoritmos en una tarea de predicción de múltiples enfermedades. Cuando se introduce un nuevo clasificador, en la mayoría de los casos nos preguntaremos si el clasificador funciona bien en un conjunto de datos clínicos particular o no. La decisión de utilizar clasificadores depende en su mayoría del tipo de datos y la tarea de clasificación, por lo que a menudo se toma de manera arbitraria. En este estudio, se aborda una evaluación comparativa de un amplio conjunto de clasificadores pertenecientes a seis familias diferentes, es decir, árboles, conjuntos, neuronales, de probabilidad, discriminantes y basados en reglas. Se tienen en cuenta una serie de conjuntos de datos públicos del mundo real que abarcan diferentes enfermedades en el experimento para demostrar la generalizabilidad de los clasificadores en la predicción de múltiples enfermedades. Se exploran un total de 25 clasificadores, 14 conjuntos de datos y tres técnicas de remuestreo diferentes. Este estudio revela que el clasificador que probablemente se convierta en el mejor intérprete es el bosque de árboles de inferencia condicional (cforest), seguido por el análisis discriminante lineal, el modelo lineal generalizado, el bosque aleatorio y el clasificador de proceso gaussiano. Este trabajo contribuye a la literatura existente sobre una exhaustiva evaluación de referencia de algoritmos de clasificación para la predicción de múltiples enfermedades.