Clasificación de manchas de bebidas utilizando imágenes hiperespectrales con un autoencoder optimizado por L-BFGS-B y una CNN 1D con atención de canal
Autores: Shit, Jitendra; Dar, Muzaffar Ahmad; V M, Manikandan; Roy, Partha Pratim
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Clasificación de manchas de bebidas utilizando imágenes hiperespectrales con un autoencoder optimizado por L-BFGS-B y una CNN 1D con atención de canal
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Imágenes hiperespectrales
Autoencoder
Redes neuronales convolucionales
Manchas de bebidas
Marco de conjunto
Análisis espectral
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La imagen hiperespectral (HSI) proporciona información espectral rica y sirve como una técnica no destructiva para el análisis de manchas forenses. Los enfoques convencionales a menudo exhiben un rendimiento degradado debido a la alta dimensionalidad y la redundancia espectral inherente a los datos hiperespectrales. Para abordar este desafío, se desarrolla un conjunto de datos hiperespectrales que comprende nueve manchas de bebidas: papaya, café, granada, naranja, té, vino, whisky, ron y brandy. Basándose en este conjunto de datos, se propone un marco de conjunto que combina un autoencoder optimizado (AE), redes neuronales convolucionales unidimensionales (1D CNN) mejoradas con atención de canal (CA) y una estrategia de fusión ponderada basada en el método de Broyden-Fletcher-Goldfarb-Shanno de memoria limitada (L-BFGS-B). El autoencoder aprende representaciones latentes compactas a partir de los vectores hiperespectrales de 204 bandas, reduciendo la redundancia mientras preserva características espectrales discriminativas. CA enfatiza bandas espectrales informativas y mejora la separabilidad de las manchas. Se entrenan múltiples modelos de 1D CNN utilizando diferentes dimensionalidades latentes, y sus salidas de probabilidad de clase se fusionan a través de un esquema de ponderación L-BFGS-B optimizado, donde los modelos de mejor rendimiento contribuyen más fuertemente a la decisión final. Los resultados experimentales demuestran precisiones de clasificación del 96.54%, 97.19% y 97.86% para los modelos AE32 CA, AE64 CA y AE128 CA, respectivamente, con el conjunto optimizado logrando una precisión del 98.28%. Además, se analiza sistemáticamente la evolución dependiente del tiempo de la reflectancia de las manchas de bebidas utilizando firmas de reflectancia normalizadas y superpuestas adquiridas en intervalos de tiempo de 0 min, 1 h, 2 h, 3 h, 4 h y 5 h. Los resultados confirman que la compresión latente basada en AE, CA y la fusión optimizada del conjunto L-BFGS-B mejoran la clasificación de manchas de bebidas hiperespectrales, proporcionando un marco efectivo y extensible para el análisis de evidencia forense.
Descripción
La imagen hiperespectral (HSI) proporciona información espectral rica y sirve como una técnica no destructiva para el análisis de manchas forenses. Los enfoques convencionales a menudo exhiben un rendimiento degradado debido a la alta dimensionalidad y la redundancia espectral inherente a los datos hiperespectrales. Para abordar este desafío, se desarrolla un conjunto de datos hiperespectrales que comprende nueve manchas de bebidas: papaya, café, granada, naranja, té, vino, whisky, ron y brandy. Basándose en este conjunto de datos, se propone un marco de conjunto que combina un autoencoder optimizado (AE), redes neuronales convolucionales unidimensionales (1D CNN) mejoradas con atención de canal (CA) y una estrategia de fusión ponderada basada en el método de Broyden-Fletcher-Goldfarb-Shanno de memoria limitada (L-BFGS-B). El autoencoder aprende representaciones latentes compactas a partir de los vectores hiperespectrales de 204 bandas, reduciendo la redundancia mientras preserva características espectrales discriminativas. CA enfatiza bandas espectrales informativas y mejora la separabilidad de las manchas. Se entrenan múltiples modelos de 1D CNN utilizando diferentes dimensionalidades latentes, y sus salidas de probabilidad de clase se fusionan a través de un esquema de ponderación L-BFGS-B optimizado, donde los modelos de mejor rendimiento contribuyen más fuertemente a la decisión final. Los resultados experimentales demuestran precisiones de clasificación del 96.54%, 97.19% y 97.86% para los modelos AE32 CA, AE64 CA y AE128 CA, respectivamente, con el conjunto optimizado logrando una precisión del 98.28%. Además, se analiza sistemáticamente la evolución dependiente del tiempo de la reflectancia de las manchas de bebidas utilizando firmas de reflectancia normalizadas y superpuestas adquiridas en intervalos de tiempo de 0 min, 1 h, 2 h, 3 h, 4 h y 5 h. Los resultados confirman que la compresión latente basada en AE, CA y la fusión optimizada del conjunto L-BFGS-B mejoran la clasificación de manchas de bebidas hiperespectrales, proporcionando un marco efectivo y extensible para el análisis de evidencia forense.