Detección basada en aprendizaje profundo de fallas en la segmentación de la glotis
Autores: Dadras, Armin A.; Aichinger, Philipp
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Detección basada en aprendizaje profundo de fallas en la segmentación de la glotis
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Segmentación de imágenes médicas
Segmentación de la glotis
Aprendizaje profundo
Segmentaciones defectuosas
Red neuronal
Funciones de pérdida personalizadas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
La segmentación de imágenes médicas es crucial para aplicaciones clínicas, pero persisten desafíos debido al ruido y la variabilidad. En particular, la segmentación precisa de la glotis a partir de videos de alta velocidad es vital para la investigación y diagnóstico de la voz. La búsqueda manual de segmentaciones fallidas es intensiva en mano de obra, lo que suscita interés en métodos automatizados. Este documento propone el primer enfoque de aprendizaje profundo para detectar segmentaciones defectuosas de la glotis. Para este propósito, las segmentaciones defectuosas se generan aplicando tanto una red neuronal de bajo rendimiento como procedimientos de perturbación a tres conjuntos de datos públicos. Se añaden fuertes aumentos de datos a la entrada hasta que el rendimiento de la red neuronal disminuye al índice de intersección sobre unión (IoU) medio deseado. Asimismo, el procedimiento de perturbación implica una serie de transformaciones de imagen a las segmentaciones originales de la verdad terrenal de manera aleatoria. Estos datos se utilizan luego para entrenar una red neuronal ResNet18 con funciones de pérdida personalizadas para predecir los puntajes de IoU de las segmentaciones defectuosas. Este valor se clasifica mediante un IoU fijo de 0.6, logrando así una precisión de clasificación del 88.27% con una especificidad del 91.54%. Los resultados experimentales demuestran la efectividad del enfoque presentado. Las contribuciones incluyen: (i) un procedimiento de perturbación basado en conocimientos, (ii) un marco de aprendizaje profundo para puntuar y detectar segmentaciones defectuosas de la glotis, y (iii) una evaluación de funciones de pérdida personalizadas.
Descripción
La segmentación de imágenes médicas es crucial para aplicaciones clínicas, pero persisten desafíos debido al ruido y la variabilidad. En particular, la segmentación precisa de la glotis a partir de videos de alta velocidad es vital para la investigación y diagnóstico de la voz. La búsqueda manual de segmentaciones fallidas es intensiva en mano de obra, lo que suscita interés en métodos automatizados. Este documento propone el primer enfoque de aprendizaje profundo para detectar segmentaciones defectuosas de la glotis. Para este propósito, las segmentaciones defectuosas se generan aplicando tanto una red neuronal de bajo rendimiento como procedimientos de perturbación a tres conjuntos de datos públicos. Se añaden fuertes aumentos de datos a la entrada hasta que el rendimiento de la red neuronal disminuye al índice de intersección sobre unión (IoU) medio deseado. Asimismo, el procedimiento de perturbación implica una serie de transformaciones de imagen a las segmentaciones originales de la verdad terrenal de manera aleatoria. Estos datos se utilizan luego para entrenar una red neuronal ResNet18 con funciones de pérdida personalizadas para predecir los puntajes de IoU de las segmentaciones defectuosas. Este valor se clasifica mediante un IoU fijo de 0.6, logrando así una precisión de clasificación del 88.27% con una especificidad del 91.54%. Los resultados experimentales demuestran la efectividad del enfoque presentado. Las contribuciones incluyen: (i) un procedimiento de perturbación basado en conocimientos, (ii) un marco de aprendizaje profundo para puntuar y detectar segmentaciones defectuosas de la glotis, y (iii) una evaluación de funciones de pérdida personalizadas.