Eficiencia del Enfoque de Clasificación Binaria Ajustada (ABC) en la Estimación del Sexo Osteométrico: Un Estudio Comparativo de Diferentes Algoritmos de Aprendizaje Automático Lineales y Tamaños de Muestra de Entrenamiento
Autores: Attia, MennattAllah Hassan; Kholief, Marwa A.; Zaghloul, Nancy M.; Krui, Ivana; Anelinovi, imun; Bai, eljana; Jerkovi, Ivan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Eficiencia del Enfoque de Clasificación Binaria Ajustada (ABC) en la Estimación del Sexo Osteométrico: Un Estudio Comparativo de Diferentes Algoritmos de Aprendizaje Automático Lineales y Tamaños de Muestra de Entrenamiento
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Propuesto
Osteométrico
Aprendizaje automático
Modelos
Precisión
Multivariado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 15
Citaciones: Sin citaciones
El enfoque de clasificación binaria ajustada (ABC) se propuso para asegurar que el modelo de clasificación binaria alcance un nivel de precisión particular. El presente estudio evaluó el ABC para la clasificación sexual osteométrica utilizando múltiples técnicas de aprendizaje automático (ML): análisis discriminante lineal (LDA), modelo lineal generalizado impulsado (GLMB), máquina de soporte vectorial (SVM) y regresión logística (LR). Utilizamos 13 mediciones femorales de 300 individuos de una muestra de población turca moderna y dividimos los datos en dos conjuntos: entrenamiento (n = 240) y prueba (n = 60). Luego, se seleccionaron las cinco mediciones de mejor rendimiento para entrenar modelos univariantes, mientras que se utilizaron grupos de estas variables para los modelos multivariantes. El tipo de clasificador ML no afectó el rendimiento de los modelos no ajustados. La precisión de los modelos univariantes fue del 82-87%, mientras que la de los modelos multivariantes fue del 89-90%. Después de aplicar ABC al conjunto de validación cruzada, la precisión y los valores predictivos positivos y negativos para los modelos univariantes y multivariantes fueron >=95%. Se pudo estimar el sexo de 28-75% de los individuos utilizando modelos univariantes, pero con un sesgo obvio de sexado, probablemente causado por diferentes grados de dimorfismo sexual y superposición entre grupos. Sin embargo, utilizando modelos multivariantes, minimizamos el sesgo y clasificamos correctamente al 81-87% de los individuos. Un rendimiento similar también se observó en la muestra de prueba (excepto para FEB), con precisiones del 96-100%, y una proporción de individuos clasificados entre el 30% y el 82% en modelos univariantes, y entre el 90% y el 91% en modelos multivariantes. Al considerar diferentes tamaños de muestra de entrenamiento, demostramos que LR fue el más sensible con tamaños de muestra limitados (< 150), mientras que GLMB fue el clasificador más estable.
Descripción
El enfoque de clasificación binaria ajustada (ABC) se propuso para asegurar que el modelo de clasificación binaria alcance un nivel de precisión particular. El presente estudio evaluó el ABC para la clasificación sexual osteométrica utilizando múltiples técnicas de aprendizaje automático (ML): análisis discriminante lineal (LDA), modelo lineal generalizado impulsado (GLMB), máquina de soporte vectorial (SVM) y regresión logística (LR). Utilizamos 13 mediciones femorales de 300 individuos de una muestra de población turca moderna y dividimos los datos en dos conjuntos: entrenamiento (n = 240) y prueba (n = 60). Luego, se seleccionaron las cinco mediciones de mejor rendimiento para entrenar modelos univariantes, mientras que se utilizaron grupos de estas variables para los modelos multivariantes. El tipo de clasificador ML no afectó el rendimiento de los modelos no ajustados. La precisión de los modelos univariantes fue del 82-87%, mientras que la de los modelos multivariantes fue del 89-90%. Después de aplicar ABC al conjunto de validación cruzada, la precisión y los valores predictivos positivos y negativos para los modelos univariantes y multivariantes fueron >=95%. Se pudo estimar el sexo de 28-75% de los individuos utilizando modelos univariantes, pero con un sesgo obvio de sexado, probablemente causado por diferentes grados de dimorfismo sexual y superposición entre grupos. Sin embargo, utilizando modelos multivariantes, minimizamos el sesgo y clasificamos correctamente al 81-87% de los individuos. Un rendimiento similar también se observó en la muestra de prueba (excepto para FEB), con precisiones del 96-100%, y una proporción de individuos clasificados entre el 30% y el 82% en modelos univariantes, y entre el 90% y el 91% en modelos multivariantes. Al considerar diferentes tamaños de muestra de entrenamiento, demostramos que LR fue el más sensible con tamaños de muestra limitados (< 150), mientras que GLMB fue el clasificador más estable.