Estimación de la respuesta espectral de cámaras MSFA de ocho bandas de un solo disparo utilizando aprendizaje profundo
Autores: Gouton, Pierre; Ayikpa, Kacoutchy Jean; Mamadou, Diarra
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Estimación de la respuesta espectral de cámaras MSFA de ocho bandas de un solo disparo utilizando aprendizaje profundo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Bandas espectrales
Cámaras MSFA
Aprendizaje profundo
Respuesta espectral
Datos multiespectrales
DRCN
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Las cámaras MSFA (matriz de filtros multiespectrales) de un solo disparo de ocho bandas son tecnologías innovadoras utilizadas para capturar imágenes multiespectrales al capturar múltiples bandas espectrales simultáneamente. Permiten recopilar información detallada sobre las propiedades espectrales de las escenas observadas de manera económica. Estas cámaras se utilizan ampliamente para la detección de objetos, análisis de materiales y agronomía. La evolución de las cámaras MSFA de un solo disparo de 8 a 32 bandas hace posible obtener datos espectrales mucho más detallados, lo cual es crucial para aplicaciones que requieren un análisis delicado y preciso de las propiedades espectrales de las escenas observadas. Nuestro estudio tiene como objetivo desarrollar modelos basados en aprendizaje profundo para estimar la respuesta espectral de este tipo de cámara y proporcionar imágenes cercanas a las propiedades espectrales de los objetos. Primero, preparamos nuestros datos experimentales proyectándolos para reflejar las características de nuestra cámara. Luego, aprovechamos el poder de las redes neuronales de súper resolución profunda, como very deep super-resolution (VDSR), Laplacian pyramid super-resolution networks (LapSRN) y deeply recursive convolutional networks (DRCN), que adaptamos para aproximar la respuesta espectral. Estos modelos aprenden la relación compleja entre los datos multiespectrales de 8 bandas de la cámara y los datos multiespectrales de 31 bandas de la base de datos multiobjetos, lo que permite una conversión precisa y eficiente. Finalmente, evaluamos la calidad de las imágenes utilizando métricas como la función de pérdida, PSNR y SSIM. La evaluación del modelo reveló que DRCN supera a los demás en rendimiento crucial. DRCN logró la pérdida más baja con 0.0047 y destacó en las métricas de calidad de imagen, con un PSNR de 25.5059, SSIM de 0.8355 y SAM de 0.13215, lo que indica una mejor preservación de detalles y texturas. Además, DRCN mostró los valores más bajos de RMSE 0.05849 y MAE 0.0415, confirmando su capacidad para minimizar los errores de reconstrucción de manera más efectiva que VDSR y LapSRN.
Descripción
Las cámaras MSFA (matriz de filtros multiespectrales) de un solo disparo de ocho bandas son tecnologías innovadoras utilizadas para capturar imágenes multiespectrales al capturar múltiples bandas espectrales simultáneamente. Permiten recopilar información detallada sobre las propiedades espectrales de las escenas observadas de manera económica. Estas cámaras se utilizan ampliamente para la detección de objetos, análisis de materiales y agronomía. La evolución de las cámaras MSFA de un solo disparo de 8 a 32 bandas hace posible obtener datos espectrales mucho más detallados, lo cual es crucial para aplicaciones que requieren un análisis delicado y preciso de las propiedades espectrales de las escenas observadas. Nuestro estudio tiene como objetivo desarrollar modelos basados en aprendizaje profundo para estimar la respuesta espectral de este tipo de cámara y proporcionar imágenes cercanas a las propiedades espectrales de los objetos. Primero, preparamos nuestros datos experimentales proyectándolos para reflejar las características de nuestra cámara. Luego, aprovechamos el poder de las redes neuronales de súper resolución profunda, como very deep super-resolution (VDSR), Laplacian pyramid super-resolution networks (LapSRN) y deeply recursive convolutional networks (DRCN), que adaptamos para aproximar la respuesta espectral. Estos modelos aprenden la relación compleja entre los datos multiespectrales de 8 bandas de la cámara y los datos multiespectrales de 31 bandas de la base de datos multiobjetos, lo que permite una conversión precisa y eficiente. Finalmente, evaluamos la calidad de las imágenes utilizando métricas como la función de pérdida, PSNR y SSIM. La evaluación del modelo reveló que DRCN supera a los demás en rendimiento crucial. DRCN logró la pérdida más baja con 0.0047 y destacó en las métricas de calidad de imagen, con un PSNR de 25.5059, SSIM de 0.8355 y SAM de 0.13215, lo que indica una mejor preservación de detalles y texturas. Además, DRCN mostró los valores más bajos de RMSE 0.05849 y MAE 0.0415, confirmando su capacidad para minimizar los errores de reconstrucción de manera más efectiva que VDSR y LapSRN.