Selección de algoritmos basada en datos sintéticos para la clasificación de imágenes médicas con disponibilidad limitada de datos
Autores: Zhabinets, Maxim; Tyler, Benjamin; Lukac, Martin; Nagayama, Shinobu; Molnár, Ferdinand; Kameyama, Michitaka
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Selección de algoritmos basada en datos sintéticos para la clasificación de imágenes médicas con disponibilidad limitada de datos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Enfoque de selección de algoritmos
Rendimiento
Disponibilidad de datos
Meta-aprendizaje
Datos sintéticos
Red generativa adversaria
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
El enfoque de selección del algoritmo mejora el rendimiento al elegir dinámicamente el algoritmo óptimo para cada instancia de entrada. Aunque esta estrategia de selección ha sido ampliamente estudiada, la cantidad de datos y su naturaleza aún no se han investigado con respecto al meta-aprendizaje, especialmente en escenarios con disponibilidad limitada de datos. Este documento aborda un desafío crítico: cuando datos adicionales pueden no estar disponibles para entrenar un selector de algoritmo, y para implementar un mecanismo de selección, los datos deben ser generados. Enfocándonos en la clasificación de imágenes médicas, investigamos si los datos sintéticos pueden entrenar efectivamente un selector de algoritmo cuando los datos de entrenamiento reales son escasos. Nuestra metodología implica la generación de datos utilizando una Red Generativa Antagónica. Para determinar si la selección de algoritmo entrenada en datos generados sintéticamente puede lograr la misma precisión que si se entrenara en datos naturales del mundo real, evaluamos sistemáticamente el modelo generativo de datos utilizando la menor cantidad de datos necesaria para elegir el algoritmo correcto y lograr el nivel esperado de precisión. Nuestros resultados experimentales demuestran que utilizando una pequeña cantidad de muestras reales se puede proporcionar suficiente información a una Red Generativa Antagónica para sintetizar un nuevo conjunto de datos que, al utilizarse para entrenar la selección de algoritmo, mejora la clasificación de imágenes en algunos casos.
Descripción
El enfoque de selección del algoritmo mejora el rendimiento al elegir dinámicamente el algoritmo óptimo para cada instancia de entrada. Aunque esta estrategia de selección ha sido ampliamente estudiada, la cantidad de datos y su naturaleza aún no se han investigado con respecto al meta-aprendizaje, especialmente en escenarios con disponibilidad limitada de datos. Este documento aborda un desafío crítico: cuando datos adicionales pueden no estar disponibles para entrenar un selector de algoritmo, y para implementar un mecanismo de selección, los datos deben ser generados. Enfocándonos en la clasificación de imágenes médicas, investigamos si los datos sintéticos pueden entrenar efectivamente un selector de algoritmo cuando los datos de entrenamiento reales son escasos. Nuestra metodología implica la generación de datos utilizando una Red Generativa Antagónica. Para determinar si la selección de algoritmo entrenada en datos generados sintéticamente puede lograr la misma precisión que si se entrenara en datos naturales del mundo real, evaluamos sistemáticamente el modelo generativo de datos utilizando la menor cantidad de datos necesaria para elegir el algoritmo correcto y lograr el nivel esperado de precisión. Nuestros resultados experimentales demuestran que utilizando una pequeña cantidad de muestras reales se puede proporcionar suficiente información a una Red Generativa Antagónica para sintetizar un nuevo conjunto de datos que, al utilizarse para entrenar la selección de algoritmo, mejora la clasificación de imágenes en algunos casos.