Fusión de Múltiples Dominios para la Super-Resolución de Imágenes de UAV Basada en Tiny-Transformer
Autores: Man, Qiaoyue; Gee, Seok-Jeong; Cho, Young-Im
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Fusión de Múltiples Dominios para la Super-Resolución de Imágenes de UAV Basada en Tiny-Transformer
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Vehículo aéreo no tripulado
Degradación del detalle espacial
Marco de superresolución
Columna vertebral de transformador pequeño
Fusión de características multidominio
Texturas de alta frecuencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las imágenes de vehículos aéreos no tripulados a menudo sufren una degradación severa del detalle espacial debido a las limitaciones del sensor y al desenfoque por movimiento, lo que dificulta las tareas de visión posteriores. Para abordar esto, proponemos un marco de superresolución ligero que aprovecha una estructura de Tiny-Transformer mejorada por una estrategia de fusión de características multidominio. Específicamente, modelamos conjuntamente la semántica estructural espacial y los priors de textura en el dominio de frecuencia a través de un mecanismo de atención de fusión entre dominios, lo que permite la restauración coordinada de la consistencia global y los detalles locales. Experimentos extensos demuestran que nuestro método supera a los enfoques de vanguardia en benchmarks estándar, logrando ganancias significativas en la relación de señal a ruido pico y el índice de similitud estructural, mientras mantiene un bajo costo computacional. Notablemente, el modelo exhibe una robustez superior en la reconstrucción de texturas de alta frecuencia comunes en escenas aéreas. Este trabajo proporciona una solución eficiente y desplegable para mejorar la fidelidad visual en aplicaciones con recursos limitados, como la planificación urbana y la agricultura de precisión.
Descripción
Las imágenes de vehículos aéreos no tripulados a menudo sufren una degradación severa del detalle espacial debido a las limitaciones del sensor y al desenfoque por movimiento, lo que dificulta las tareas de visión posteriores. Para abordar esto, proponemos un marco de superresolución ligero que aprovecha una estructura de Tiny-Transformer mejorada por una estrategia de fusión de características multidominio. Específicamente, modelamos conjuntamente la semántica estructural espacial y los priors de textura en el dominio de frecuencia a través de un mecanismo de atención de fusión entre dominios, lo que permite la restauración coordinada de la consistencia global y los detalles locales. Experimentos extensos demuestran que nuestro método supera a los enfoques de vanguardia en benchmarks estándar, logrando ganancias significativas en la relación de señal a ruido pico y el índice de similitud estructural, mientras mantiene un bajo costo computacional. Notablemente, el modelo exhibe una robustez superior en la reconstrucción de texturas de alta frecuencia comunes en escenas aéreas. Este trabajo proporciona una solución eficiente y desplegable para mejorar la fidelidad visual en aplicaciones con recursos limitados, como la planificación urbana y la agricultura de precisión.