Detección de Objetivos Multimodal de Pocas Muestras Basada en Análisis de Incertidumbre en Imágenes de Series Temporales
Autores: Khoshboresh-Masouleh, Mehdi; Shah-Hosseini, Reza
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Detección de Objetivos Multimodal de Pocas Muestras Basada en Análisis de Incertidumbre en Imágenes de Series Temporales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Interpretar datos multimodales
Mapear objetivos
Anomalías
Sistema de reconocimiento automático
Comprensión de imágenes en series temporales
Detección de objetivos multimodales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La capacidad de interpretar datos multimodales y mapear los objetivos y anomalías dentro de ellos es importante para un sistema de reconocimiento automático. Debido a la naturaleza costosa y que consume mucho tiempo de la anotación de datos de series temporales multimodales en la etapa de entrenamiento, la comprensión de imágenes de series temporales multimodales, desde plataformas de drones y robots móviles cuadrúpedos, es una tarea desafiante para la teledetección y la fotogrametría. En este sentido, los métodos robustos deben ser de bajo costo computacional, debido a los datos limitados en plataformas aéreas y terrestres, pero lo suficientemente precisos como para cumplir con las medidas de certeza. En este estudio, se propone una arquitectura de aprendizaje de pocos ejemplos, basada en una estructura de compresión y atención, para la detección de objetivos multimodales, utilizando imágenes de series temporales de las plataformas de drones y robots cuadrúpedos con un pequeño conjunto de datos de entrenamiento. Para construir algoritmos robustos en la detección de objetivos, se ha desarrollado una estructura de compresión y atención a partir de imágenes de series temporales multimodales con datos de entrenamiento limitados como un método optimizado. La arquitectura propuesta fue validada en tres conjuntos de datos con múltiples modalidades (por ejemplo, rojo-verde-azul, color-infrarrojo y térmico), logrando resultados competitivos.
Descripción
La capacidad de interpretar datos multimodales y mapear los objetivos y anomalías dentro de ellos es importante para un sistema de reconocimiento automático. Debido a la naturaleza costosa y que consume mucho tiempo de la anotación de datos de series temporales multimodales en la etapa de entrenamiento, la comprensión de imágenes de series temporales multimodales, desde plataformas de drones y robots móviles cuadrúpedos, es una tarea desafiante para la teledetección y la fotogrametría. En este sentido, los métodos robustos deben ser de bajo costo computacional, debido a los datos limitados en plataformas aéreas y terrestres, pero lo suficientemente precisos como para cumplir con las medidas de certeza. En este estudio, se propone una arquitectura de aprendizaje de pocos ejemplos, basada en una estructura de compresión y atención, para la detección de objetivos multimodales, utilizando imágenes de series temporales de las plataformas de drones y robots cuadrúpedos con un pequeño conjunto de datos de entrenamiento. Para construir algoritmos robustos en la detección de objetivos, se ha desarrollado una estructura de compresión y atención a partir de imágenes de series temporales multimodales con datos de entrenamiento limitados como un método optimizado. La arquitectura propuesta fue validada en tres conjuntos de datos con múltiples modalidades (por ejemplo, rojo-verde-azul, color-infrarrojo y térmico), logrando resultados competitivos.