Aprendizaje con Pocas Muestras con Codificación de Ubicación Colateral y Atención Espacial Global de Clave Única para la Clasificación de Imágenes Médicas
Autores: Shuai, Wenjing; Li, Jianzhao
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Aprendizaje con Pocas Muestras con Codificación de Ubicación Colateral y Atención Espacial Global de Clave Única para la Clasificación de Imágenes Médicas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Habilidad
Modelos de aprendizaje profundo
Clasificación de imágenes médicas
Información de ubicación
Información global
Atención espacial
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Los humanos nacen con la capacidad de aprender rápidamente al discernir objetos a partir de unas pocas muestras, adquirir nuevas habilidades en un corto período de tiempo y tomar decisiones basadas en experiencias y conocimientos previos limitados. Los modelos existentes de aprendizaje profundo para la clasificación de imágenes médicas a menudo dependen de un gran número de muestras de entrenamiento etiquetadas, mientras que la capacidad de aprendizaje rápido de las redes neuronales profundas ha fallado en desarrollarse. Además, se requiere una gran cantidad de tiempo y recursos informáticos para volver a entrenar el modelo cuando el modelo profundo se encuentra con clases que nunca ha visto antes. Sin embargo, para aplicaciones de atención médica, permitir que un modelo generalice nuevos escenarios clínicos es de gran importancia. Los métodos existentes de clasificación de imágenes no pueden utilizar explícitamente la información de ubicación del píxel, lo que los hace insensibles a las señales relacionadas únicamente con la ubicación. Además, también dependen de convoluciones locales y no pueden utilizar adecuadamente la información global, que es esencial para la clasificación de imágenes. Para aliviar estos problemas, proponemos una codificación de ubicación colateral para ayudar a la red a explotar explícitamente la información de ubicación de cada píxel para facilitar que la red reconozca señales relacionadas con la ubicación únicamente, y se diseña una atención espacial global de una sola clave para que los píxeles en cada ubicación perciban la información espacial global de una manera económica. Los resultados experimentales en tres conjuntos de datos de referencia de imágenes médicas demuestran que nuestro algoritmo propuesto supera a los enfoques de vanguardia tanto en efectividad como en capacidad de generalización.
Descripción
Los humanos nacen con la capacidad de aprender rápidamente al discernir objetos a partir de unas pocas muestras, adquirir nuevas habilidades en un corto período de tiempo y tomar decisiones basadas en experiencias y conocimientos previos limitados. Los modelos existentes de aprendizaje profundo para la clasificación de imágenes médicas a menudo dependen de un gran número de muestras de entrenamiento etiquetadas, mientras que la capacidad de aprendizaje rápido de las redes neuronales profundas ha fallado en desarrollarse. Además, se requiere una gran cantidad de tiempo y recursos informáticos para volver a entrenar el modelo cuando el modelo profundo se encuentra con clases que nunca ha visto antes. Sin embargo, para aplicaciones de atención médica, permitir que un modelo generalice nuevos escenarios clínicos es de gran importancia. Los métodos existentes de clasificación de imágenes no pueden utilizar explícitamente la información de ubicación del píxel, lo que los hace insensibles a las señales relacionadas únicamente con la ubicación. Además, también dependen de convoluciones locales y no pueden utilizar adecuadamente la información global, que es esencial para la clasificación de imágenes. Para aliviar estos problemas, proponemos una codificación de ubicación colateral para ayudar a la red a explotar explícitamente la información de ubicación de cada píxel para facilitar que la red reconozca señales relacionadas con la ubicación únicamente, y se diseña una atención espacial global de una sola clave para que los píxeles en cada ubicación perciban la información espacial global de una manera económica. Los resultados experimentales en tres conjuntos de datos de referencia de imágenes médicas demuestran que nuestro algoritmo propuesto supera a los enfoques de vanguardia tanto en efectividad como en capacidad de generalización.