Inferiendo sesgos visuales en videos de UAV a partir de movimientos oculares
Autores: Perrin, Anne-Flore; Zhang, Lu; Le Meur, Olivier
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Inferiendo sesgos visuales en videos de UAV a partir de movimientos oculares
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Vehículo aéreo no tripulado
Imágenes
Saliencia visual
Agricultura
Servicios de vigilancia
Datos de seguimiento ocular
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las imágenes de Vehículos Aéreos No Tripulados (VANT) están ganando mucho impulso últimamente. De hecho, la información recopilada desde un punto de vista aéreo es particularmente relevante para numerosas aplicaciones, desde la agricultura hasta los servicios de vigilancia. En este estudio, analizamos la saliencia visual para verificar si hay diferencias tangibles entre estas imágenes y contenidos más convencionales. Primero describimos los contenidos típicos y los de VANT basándonos en sus mapas de saliencia humana en un espacio de alta dimensión, abarcando estadísticas de mapas de saliencia, características de distribución y otras características diseñadas específicamente. Gracias a una gran cantidad de datos de seguimiento ocular recopilados sobre VANT, enfatizamos las diferencias entre videos típicos y de VANT, pero más importante aún, dentro de las secuencias de VANT. Luego diseñamos un proceso para extraer nuevos sesgos de atención visual en las imágenes de VANT, lo que lleva a la definición de un nuevo diccionario de sesgos visuales. Posteriormente, realizamos un benchmark en dos conjuntos de datos diferentes, cuyos resultados confirman que los 20 sesgos definidos son relevantes como un sistema de predicción de saliencia de baja complejidad.
Descripción
Las imágenes de Vehículos Aéreos No Tripulados (VANT) están ganando mucho impulso últimamente. De hecho, la información recopilada desde un punto de vista aéreo es particularmente relevante para numerosas aplicaciones, desde la agricultura hasta los servicios de vigilancia. En este estudio, analizamos la saliencia visual para verificar si hay diferencias tangibles entre estas imágenes y contenidos más convencionales. Primero describimos los contenidos típicos y los de VANT basándonos en sus mapas de saliencia humana en un espacio de alta dimensión, abarcando estadísticas de mapas de saliencia, características de distribución y otras características diseñadas específicamente. Gracias a una gran cantidad de datos de seguimiento ocular recopilados sobre VANT, enfatizamos las diferencias entre videos típicos y de VANT, pero más importante aún, dentro de las secuencias de VANT. Luego diseñamos un proceso para extraer nuevos sesgos de atención visual en las imágenes de VANT, lo que lleva a la definición de un nuevo diccionario de sesgos visuales. Posteriormente, realizamos un benchmark en dos conjuntos de datos diferentes, cuyos resultados confirman que los 20 sesgos definidos son relevantes como un sistema de predicción de saliencia de baja complejidad.