Analizando datos médicos mediante modelos de aprendizaje estadístico
Autores: Mariani, Maria C.; Biney, Francis; Tweneboah, Osei K.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Analizando datos médicos mediante modelos de aprendizaje estadístico
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Investigado
Pronóstico
Datos médicos
Modelos de aprendizaje automático
Factores de riesgo
Técnicas de aprendizaje estadístico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
En este trabajo, investigamos el pronóstico de tres conjuntos de datos médicos específicamente, cáncer de mama, enfermedad cardíaca y cáncer de próstata utilizando 10 modelos de aprendizaje automático. Aplicamos los 10 modelos a cada conjunto de datos para identificar patrones en ellos. Además, utilizamos los modelos para diagnosticar factores de riesgo que aumentan la probabilidad de estas enfermedades. Todas las técnicas de aprendizaje estadístico discutidas se agruparon en modelos lineales y no lineales según sus similitudes y estilos de aprendizaje. El rendimiento de los modelos mejoró significativamente al seleccionar modelos teniendo en cuenta los compromisos entre sesgo y varianza y al utilizar la validación cruzada para seleccionar el parámetro de ajuste. Nuestros resultados sugieren que ninguna clase particular de modelos o estilo de aprendizaje dominó el pronóstico y diagnóstico para los tres conjuntos de datos médicos. Sin embargo, los modelos no lineales ofrecieron el mejor rendimiento predictivo para los datos de cáncer de mama. Por otro lado, los modelos lineales ofrecieron el mejor rendimiento predictivo para los datos de enfermedad cardíaca y una combinación de modelos lineales y no lineales para el conjunto de datos de cáncer de próstata.
Descripción
En este trabajo, investigamos el pronóstico de tres conjuntos de datos médicos específicamente, cáncer de mama, enfermedad cardíaca y cáncer de próstata utilizando 10 modelos de aprendizaje automático. Aplicamos los 10 modelos a cada conjunto de datos para identificar patrones en ellos. Además, utilizamos los modelos para diagnosticar factores de riesgo que aumentan la probabilidad de estas enfermedades. Todas las técnicas de aprendizaje estadístico discutidas se agruparon en modelos lineales y no lineales según sus similitudes y estilos de aprendizaje. El rendimiento de los modelos mejoró significativamente al seleccionar modelos teniendo en cuenta los compromisos entre sesgo y varianza y al utilizar la validación cruzada para seleccionar el parámetro de ajuste. Nuestros resultados sugieren que ninguna clase particular de modelos o estilo de aprendizaje dominó el pronóstico y diagnóstico para los tres conjuntos de datos médicos. Sin embargo, los modelos no lineales ofrecieron el mejor rendimiento predictivo para los datos de cáncer de mama. Por otro lado, los modelos lineales ofrecieron el mejor rendimiento predictivo para los datos de enfermedad cardíaca y una combinación de modelos lineales y no lineales para el conjunto de datos de cáncer de próstata.