Método mejorado de duplicación de entrada aprovechando la linealización de la superficie de respuesta para mejorar la precisión de clasificación en el procesamiento de datos médicos pequeños
Autores: Izonin, Ivan; Tkachenko, Roman; Yendyk, Pavlo; Pliss, Iryna; Bodyanskiy, Yevgeniy; Gregus, Michal
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Método mejorado de duplicación de entrada aprovechando la linealización de la superficie de respuesta para mejorar la precisión de clasificación en el procesamiento de datos médicos pequeños
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Tareas
Análisis de datos inteligente
Medicina
Inteligencia artificial
Clasificación
Aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Actualmente, las tareas de análisis de datos inteligentes en medicina se están volviendo cada vez más comunes. Las herramientas de inteligencia artificial existentes proporcionan una alta efectividad en la resolución de estas tareas al analizar conjuntos de datos lo suficientemente grandes. Sin embargo, cuando hay muy pocos datos de entrenamiento disponibles, los métodos actuales de aprendizaje automático no garantizan una precisión de clasificación adecuada o incluso pueden producir resultados inadecuados. Este documento presenta un método mejorado de duplicación de entrada para tareas de clasificación en el caso de análisis de datos limitados, logrado mediante la expansión del número de atributos independientes en el conjunto de datos aumentado con probabilidades de pertenencia a cada clase de la tarea. Los autores han desarrollado una implementación algorítmica del método mejorado utilizando dos clasificadores de Naïve Bayes. El método fue modelado en un pequeño conjunto de datos para la evaluación del riesgo cardiovascular. Los autores exploraron dos opciones para el uso combinado de clasificadores de Naïve Bayes en ambas etapas del método. Se encontró que el uso de diferentes métodos en ambas etapas potencialmente mejora la precisión de la tarea de clasificación. Los resultados del método mejorado se compararon con una variedad de métodos existentes utilizados para resolver la tarea. Se demostró que el método mejorado de duplicación de entrada logró la mayor precisión de clasificación basada en varios indicadores de rendimiento.
Descripción
Actualmente, las tareas de análisis de datos inteligentes en medicina se están volviendo cada vez más comunes. Las herramientas de inteligencia artificial existentes proporcionan una alta efectividad en la resolución de estas tareas al analizar conjuntos de datos lo suficientemente grandes. Sin embargo, cuando hay muy pocos datos de entrenamiento disponibles, los métodos actuales de aprendizaje automático no garantizan una precisión de clasificación adecuada o incluso pueden producir resultados inadecuados. Este documento presenta un método mejorado de duplicación de entrada para tareas de clasificación en el caso de análisis de datos limitados, logrado mediante la expansión del número de atributos independientes en el conjunto de datos aumentado con probabilidades de pertenencia a cada clase de la tarea. Los autores han desarrollado una implementación algorítmica del método mejorado utilizando dos clasificadores de Naïve Bayes. El método fue modelado en un pequeño conjunto de datos para la evaluación del riesgo cardiovascular. Los autores exploraron dos opciones para el uso combinado de clasificadores de Naïve Bayes en ambas etapas del método. Se encontró que el uso de diferentes métodos en ambas etapas potencialmente mejora la precisión de la tarea de clasificación. Los resultados del método mejorado se compararon con una variedad de métodos existentes utilizados para resolver la tarea. Se demostró que el método mejorado de duplicación de entrada logró la mayor precisión de clasificación basada en varios indicadores de rendimiento.