logo móvil
Contáctanos

Análisis de Dinámicas de Aprendizaje: Evaluación de la Generalización de Modelos de Aprendizaje Automático para la Clasificación Multiclase en Tomografía de Coherencia Óptica

Autores: Sher, Michael; Remyes, David; Sharma, Riah; Toma, Milan

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Análisis de Dinámicas de Aprendizaje: Evaluación de la Generalización de Modelos de Aprendizaje Automático para la Clasificación Multiclase en Tomografía de Coherencia Óptica


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Estudio
Modelos de aprendizaje automático
Clasificación multiclase
Patologías retinianas
Redes neuronales convolucionales
Aumento de datos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Este estudio evaluó la generalización y fiabilidad de los modelos de aprendizaje automático para la clasificación multicategoría de patologías retinianas utilizando un conjunto diverso de imágenes que representan ocho categorías de enfermedades. Las imágenes se agregaron de dos conjuntos de datos públicos y se dividieron en conjuntos de entrenamiento, validación y prueba, con un conjunto de datos independiente adicional utilizado para la validación externa. Se compararon múltiples enfoques de modelado, incluidos algoritmos clásicos de aprendizaje automático, redes neuronales convolucionales con y sin aumento de datos, y una red neuronal profunda que utiliza extracción de características preentrenadas. El análisis de la dinámica de aprendizaje reveló que los modelos clásicos y las redes neuronales convolucionales no aumentadas mostraron sobreajuste y mala generalización, mientras que los modelos con aumento de datos y la red neuronal profunda mostraron una convergencia saludable y paralela del rendimiento de entrenamiento y validación. Solo la red neuronal profunda demostró una disminución consistente y monótona en la precisión, la puntuación F1 y el recall desde el entrenamiento hasta la validación externa, lo que indica una robusta generalización. Estos resultados subrayan la necesidad de evaluar la dinámica de aprendizaje (no solo métricas resumidas) para garantizar la fiabilidad del modelo y la seguridad del paciente. Típicamente, se espera que el rendimiento del modelo disminuya gradualmente a medida que los datos se vuelven menos familiares. Por lo tanto, los modelos que no exhiben estas dinámicas de aprendizaje saludables, o que muestran mejoras inesperadas en el rendimiento en conjuntos de datos posteriores, no deben considerarse para la aplicación clínica, ya que tales patrones pueden indicar fallos metodológicos o filtraciones de datos en lugar de una verdadera generalización.

Otros recursos que podrían interesarte

Temas Virtualpro