Explorando el Potencial de Conjuntos de Redes de Aprendizaje Profundo para la Segmentación de Imágenes
Autores: Nanni, Loris; Lumini, Alessandra; Fantozzi, Carlo
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Explorando el Potencial de Conjuntos de Redes de Aprendizaje Profundo para la Segmentación de Imágenes
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Identificar objetos
Segmentación semántica
Visión por computadora
Conjuntos
Redes neuronales
Segmentación de pólipos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Para identificar objetos en imágenes, se necesita un conjunto complejo de habilidades que incluye entender el contexto y poder determinar los bordes de los objetos. En visión por computadora, esta tarea se conoce como segmentación semántica y consiste en categorizar cada píxel en una imagen. Es crucial en muchas situaciones del mundo real: para vehículos autónomos, permite la identificación de objetos en el área circundante; en diagnóstico médico, mejora la capacidad de detectar patologías peligrosas a tiempo, reduciendo así el riesgo de consecuencias graves. En este estudio, comparamos el rendimiento de varios conjuntos de redes neuronales convolucionales y transformadoras. Los conjuntos pueden ser creados, por ejemplo, variando la función de pérdida, el método de aumento de datos o la estrategia de tasa de aprendizaje. Nuestro conjunto propuesto, que utiliza una regla de promediado simple, demuestra un rendimiento excepcional en múltiples conjuntos de datos. Notablemente, en comparación con métodos anteriores de vanguardia, nuestro conjunto muestra consistentemente mejoras en el bien estudiado problema de segmentación de pólipos. Este problema implica la delineación e identificación precisa de pólipos dentro de imágenes médicas, y nuestro enfoque muestra avances notables en este dominio, obteniendo un Dice promedio de 0.887, que supera el SOTA actual con un Dice promedio de 0.885.
Descripción
Para identificar objetos en imágenes, se necesita un conjunto complejo de habilidades que incluye entender el contexto y poder determinar los bordes de los objetos. En visión por computadora, esta tarea se conoce como segmentación semántica y consiste en categorizar cada píxel en una imagen. Es crucial en muchas situaciones del mundo real: para vehículos autónomos, permite la identificación de objetos en el área circundante; en diagnóstico médico, mejora la capacidad de detectar patologías peligrosas a tiempo, reduciendo así el riesgo de consecuencias graves. En este estudio, comparamos el rendimiento de varios conjuntos de redes neuronales convolucionales y transformadoras. Los conjuntos pueden ser creados, por ejemplo, variando la función de pérdida, el método de aumento de datos o la estrategia de tasa de aprendizaje. Nuestro conjunto propuesto, que utiliza una regla de promediado simple, demuestra un rendimiento excepcional en múltiples conjuntos de datos. Notablemente, en comparación con métodos anteriores de vanguardia, nuestro conjunto muestra consistentemente mejoras en el bien estudiado problema de segmentación de pólipos. Este problema implica la delineación e identificación precisa de pólipos dentro de imágenes médicas, y nuestro enfoque muestra avances notables en este dominio, obteniendo un Dice promedio de 0.887, que supera el SOTA actual con un Dice promedio de 0.885.