Mejorando el rendimiento de clasificación de pequeños conjuntos de datos médicos utilizando GAN
Autores: Alauthman, Mohammad; Al-qerem, Ahmad; Sowan, Bilal; Alsarhan, Ayoub; Eshtay, Mohammed; Aldweesh, Amjad; Aslam, Nauman
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Mejorando el rendimiento de clasificación de pequeños conjuntos de datos médicos utilizando GAN
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Modelo de clasificación
Campo médico
Red generativa antagónica
Técnica de aumento de datos
Datos sintéticos
Modelo de máquina de soporte vectorial
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Desarrollar un modelo de clasificación efectivo en el campo médico es un desafío debido a los conjuntos de datos limitados. Para abordar este problema, este estudio propone utilizar una red generativa antagónica (GAN) como técnica de aumento de datos. La investigación tiene como objetivo mejorar el rendimiento de generalización, la estabilidad y la precisión del clasificador a través de la generación de datos sintéticos que se asemejan estrechamente a los datos reales. Empleamos selección de características y aplicamos cinco algoritmos de clasificación a trece conjuntos de datos médicos de referencia, aumentados utilizando el GAN de mínimos cuadrados (LS-GAN). La evaluación de las muestras generadas utilizando diferentes proporciones de datos aumentados mostró que el modelo de máquina de soporte vectorial supera a otros métodos con muestras más grandes. El enfoque propuesto de aumento de datos utilizando un GAN presenta una solución prometedora para mejorar el rendimiento de los modelos de clasificación en el campo de la salud.
Descripción
Desarrollar un modelo de clasificación efectivo en el campo médico es un desafío debido a los conjuntos de datos limitados. Para abordar este problema, este estudio propone utilizar una red generativa antagónica (GAN) como técnica de aumento de datos. La investigación tiene como objetivo mejorar el rendimiento de generalización, la estabilidad y la precisión del clasificador a través de la generación de datos sintéticos que se asemejan estrechamente a los datos reales. Empleamos selección de características y aplicamos cinco algoritmos de clasificación a trece conjuntos de datos médicos de referencia, aumentados utilizando el GAN de mínimos cuadrados (LS-GAN). La evaluación de las muestras generadas utilizando diferentes proporciones de datos aumentados mostró que el modelo de máquina de soporte vectorial supera a otros métodos con muestras más grandes. El enfoque propuesto de aumento de datos utilizando un GAN presenta una solución prometedora para mejorar el rendimiento de los modelos de clasificación en el campo de la salud.