Probabilistic ensemble framework for injury narrative classification
Autores: Vichare, Srushti; Nanda, Gaurav; Sundararajan, Raji
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Probabilistic ensemble framework for injury narrative classification
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Investigación
Narrativas
Códigos de lesiones
Modelos de conjunto
Aprendizaje automático
Enfoque probabilístico basado en la probabilidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
En esta investigación, analizamos narrativas del conjunto de datos del Sistema Nacional de Vigilancia de Lesiones Electrónicas (NEISS) para predecir los dos códigos de lesiones principales utilizando un estudio comparativo de modelos de aprendizaje automático (ML) de conjunto. Se evaluaron cuatro modelos de conjunto: Random Forest (RF) combinado con Regresión Logística (LR), Vecino más Cercano (KNN) emparejado con RF, LR combinado con KNN, y un modelo que integra LR, RF y KNN, todos utilizando un enfoque basado en la probabilidad para mejorar la toma de decisiones entre diferentes clasificadores. El conjunto KNN + LR combinado logró una precisión del 90.47% para la predicción principal, mientras que el modelo KNN + RF + LR destacó en predecir los dos códigos de lesiones principales con una precisión muy alta del 99.50%. Estos resultados demuestran el gran potencial de los modelos de conjunto para mejorar la precisión en la clasificación de narrativas no estructuradas, especialmente para abordar casos subrepresentados, y el potencial del marco de conjunto probabilístico propuesto en los modelos de ML para mejorar la toma de decisiones en salud pública y seguridad, proporcionando una base para futuras investigaciones en la clasificación automática de narrativas clínicas y modelado predictivo, especialmente en escenarios con datos desequilibrados.
Descripción
En esta investigación, analizamos narrativas del conjunto de datos del Sistema Nacional de Vigilancia de Lesiones Electrónicas (NEISS) para predecir los dos códigos de lesiones principales utilizando un estudio comparativo de modelos de aprendizaje automático (ML) de conjunto. Se evaluaron cuatro modelos de conjunto: Random Forest (RF) combinado con Regresión Logística (LR), Vecino más Cercano (KNN) emparejado con RF, LR combinado con KNN, y un modelo que integra LR, RF y KNN, todos utilizando un enfoque basado en la probabilidad para mejorar la toma de decisiones entre diferentes clasificadores. El conjunto KNN + LR combinado logró una precisión del 90.47% para la predicción principal, mientras que el modelo KNN + RF + LR destacó en predecir los dos códigos de lesiones principales con una precisión muy alta del 99.50%. Estos resultados demuestran el gran potencial de los modelos de conjunto para mejorar la precisión en la clasificación de narrativas no estructuradas, especialmente para abordar casos subrepresentados, y el potencial del marco de conjunto probabilístico propuesto en los modelos de ML para mejorar la toma de decisiones en salud pública y seguridad, proporcionando una base para futuras investigaciones en la clasificación automática de narrativas clínicas y modelado predictivo, especialmente en escenarios con datos desequilibrados.