Redes basadas en máscaras transformadoras para la segmentación de dientes en radiografías panorámicas
Autores: Kanwal, Mehreen; Ur Rehman, Muhammad Mutti; Farooq, Muhammad Umar; Chae, Dong-Kyu
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Redes basadas en máscaras transformadoras para la segmentación de dientes en radiografías panorámicas
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Segmentación dental
Odontología
Método basado en segmentación panóptica
Segmentación de instancias
Segmentación semántica
Red basada en transformadores de doble vía
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
La segmentación de dientes desempeña un papel fundamental en odontología al facilitar diagnósticos precisos y ayudar en el desarrollo de planes de tratamiento efectivos. Aunque los métodos tradicionales se han centrado principalmente en la segmentación de dientes, a menudo no consideran el contexto más amplio de los tejidos orales. Este documento propone un método basado en segmentación panóptica que combina los resultados de la segmentación de instancias con la segmentación semántica del fondo. En particular, presentamos una arquitectura novedosa para la segmentación de dientes por instancias que aprovecha una red basada en transformadores de doble vía, integrada con una función de pérdida de calidad panóptica (PQ). El modelo predice directamente máscaras y sus clases correspondientes, con la función de pérdida PQ simplificando el proceso de entrenamiento. Nuestra arquitectura propuesta cuenta con un bloque de transformador de doble vía que facilita la comunicación bidireccional entre la ruta de píxeles de la CNN y la ruta de memoria. También contiene un bloque decodificador apilado que agrega características multinivel a través de diferentes resoluciones de decodificación. El bloque de transformador integra atención de retroalimentación de píxel a memoria, autoatención de píxel a píxel, y mecanismos de autoatención de memoria a píxel y de memoria a memoria. Las cabezas de salida procesan características para predecir clases de máscara, mientras que la máscara final se obtiene multiplicando características de la ruta de memoria y de la ruta de píxeles. Cuando se aplica al conjunto de datos de imágenes dentales UFBA-UESC, nuestro modelo muestra una mejora sustancial en el rendimiento de la segmentación, superando las técnicas existentes de vanguardia en términos de rendimiento y robustez. Nuestra investigación representa un paso esencial en la segmentación de dientes y contribuye a una comprensión más profunda de las estructuras orales.
Descripción
La segmentación de dientes desempeña un papel fundamental en odontología al facilitar diagnósticos precisos y ayudar en el desarrollo de planes de tratamiento efectivos. Aunque los métodos tradicionales se han centrado principalmente en la segmentación de dientes, a menudo no consideran el contexto más amplio de los tejidos orales. Este documento propone un método basado en segmentación panóptica que combina los resultados de la segmentación de instancias con la segmentación semántica del fondo. En particular, presentamos una arquitectura novedosa para la segmentación de dientes por instancias que aprovecha una red basada en transformadores de doble vía, integrada con una función de pérdida de calidad panóptica (PQ). El modelo predice directamente máscaras y sus clases correspondientes, con la función de pérdida PQ simplificando el proceso de entrenamiento. Nuestra arquitectura propuesta cuenta con un bloque de transformador de doble vía que facilita la comunicación bidireccional entre la ruta de píxeles de la CNN y la ruta de memoria. También contiene un bloque decodificador apilado que agrega características multinivel a través de diferentes resoluciones de decodificación. El bloque de transformador integra atención de retroalimentación de píxel a memoria, autoatención de píxel a píxel, y mecanismos de autoatención de memoria a píxel y de memoria a memoria. Las cabezas de salida procesan características para predecir clases de máscara, mientras que la máscara final se obtiene multiplicando características de la ruta de memoria y de la ruta de píxeles. Cuando se aplica al conjunto de datos de imágenes dentales UFBA-UESC, nuestro modelo muestra una mejora sustancial en el rendimiento de la segmentación, superando las técnicas existentes de vanguardia en términos de rendimiento y robustez. Nuestra investigación representa un paso esencial en la segmentación de dientes y contribuye a una comprensión más profunda de las estructuras orales.