Evaluación de la convolución deformable: una investigación en clasificación de imágenes y videos
Autores: Burgos Madrigal, Andrea; Romero Bautista, Victor; Díaz Hernández, Raquel; Altamirano Robles, Leopoldo
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Evaluación de la convolución deformable: una investigación en clasificación de imágenes y videos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Redes neuronales convolucionales
Convolución deformable
Modelo CNN
DCON
Precisión de clasificación
Robustez
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Las redes neuronales convolucionales (CNNs) presentan inconvenientes para modelar transformaciones geométricas, causados por la localidad de la operación de convolución. La convolución deformable (DCON) es un mecanismo que resuelve estos inconvenientes y mejora la robustez. En este estudio, aclaramos la manera óptima de reemplazar la convolución estándar con su contraparte deformable en un modelo de CNN. Para ello, realizamos varios experimentos utilizando DCONs aplicados en las capas que conforman un pequeño modelo de CNN de cuatro capas y en las cuatro capas de varios ResNets con profundidades de 18, 34, 50 y 101. Los modelos se probaron en clases balanceadas binarias con datos 2D y 3D. Si se utiliza DCON en las primeras capas del modelo propuesto, los recursos computacionales tenderán a aumentar y producirán una mayor clasificación errónea que la CNN estándar. Sin embargo, si DCON se utiliza en las capas finales, la cantidad de Flops disminuirá y la precisión de clasificación mejorará hasta un 20% respecto al modelo base. Además, gana robustez porque puede adaptarse al objeto de interés. Asimismo, el mejor tamaño de kernel de DCON es tres. Con estos resultados, proponemos una guía y contribuimos a comprender el impacto de DCON en la robustez de las CNNs.
Descripción
Las redes neuronales convolucionales (CNNs) presentan inconvenientes para modelar transformaciones geométricas, causados por la localidad de la operación de convolución. La convolución deformable (DCON) es un mecanismo que resuelve estos inconvenientes y mejora la robustez. En este estudio, aclaramos la manera óptima de reemplazar la convolución estándar con su contraparte deformable en un modelo de CNN. Para ello, realizamos varios experimentos utilizando DCONs aplicados en las capas que conforman un pequeño modelo de CNN de cuatro capas y en las cuatro capas de varios ResNets con profundidades de 18, 34, 50 y 101. Los modelos se probaron en clases balanceadas binarias con datos 2D y 3D. Si se utiliza DCON en las primeras capas del modelo propuesto, los recursos computacionales tenderán a aumentar y producirán una mayor clasificación errónea que la CNN estándar. Sin embargo, si DCON se utiliza en las capas finales, la cantidad de Flops disminuirá y la precisión de clasificación mejorará hasta un 20% respecto al modelo base. Además, gana robustez porque puede adaptarse al objeto de interés. Asimismo, el mejor tamaño de kernel de DCON es tres. Con estos resultados, proponemos una guía y contribuimos a comprender el impacto de DCON en la robustez de las CNNs.