Modelo de restauración y proyección de características de múltiples capas para detección de anomalías no supervisada
Autores: Cai, Fuzhen; Xia, Siyu
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Modelo de restauración y proyección de características de múltiples capas para detección de anomalías no supervisada
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Detección de anomalías
Visión por computadora
Reconstrucción de imágenes
Redes neuronales convolucionales
Restauración de características de múltiples capas
Conjunto de datos MvtecAD
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La detección de anomalías de productos es un problema clásico en el campo de la visión por computadora. Los métodos basados en reconstrucción de imágenes han mostrado resultados prometedores en el campo de detección de anomalías. La mayoría de los métodos existentes utilizan redes neuronales convolucionales para construir estructuras de codificación-decodificación para realizar la restauración de imágenes. Sin embargo, el campo receptivo limitado de las redes neuronales convolucionales hace que la información considerada en el proceso de restauración de imágenes sea limitada, y el muestreo descendente en el codificador causa pérdida de información, lo que no es propicio para realizar una restauración detallada de las imágenes. Para resolver este problema, proponemos un modelo de restauración y proyección de características de múltiples capas (MLFRP), que permite que el proceso de restauración se lleve a cabo en mapas de características a múltiples escalas a través de un módulo de restauración de características a nivel de bloque que considera completamente la información detallada y semántica requerida para el proceso de restauración. Realizamos experimentos en profundidad en el conjunto de datos de referencia de detección de anomalías MvtecAD, que mostraron que nuestro modelo supera a los métodos actuales de detección de anomalías de última generación.
Descripción
La detección de anomalías de productos es un problema clásico en el campo de la visión por computadora. Los métodos basados en reconstrucción de imágenes han mostrado resultados prometedores en el campo de detección de anomalías. La mayoría de los métodos existentes utilizan redes neuronales convolucionales para construir estructuras de codificación-decodificación para realizar la restauración de imágenes. Sin embargo, el campo receptivo limitado de las redes neuronales convolucionales hace que la información considerada en el proceso de restauración de imágenes sea limitada, y el muestreo descendente en el codificador causa pérdida de información, lo que no es propicio para realizar una restauración detallada de las imágenes. Para resolver este problema, proponemos un modelo de restauración y proyección de características de múltiples capas (MLFRP), que permite que el proceso de restauración se lleve a cabo en mapas de características a múltiples escalas a través de un módulo de restauración de características a nivel de bloque que considera completamente la información detallada y semántica requerida para el proceso de restauración. Realizamos experimentos en profundidad en el conjunto de datos de referencia de detección de anomalías MvtecAD, que mostraron que nuestro modelo supera a los métodos actuales de detección de anomalías de última generación.