Ampliación del campo de visión basada en la predicción de regiones de imagen utilizando videos térmicos
Autores: Batchuluun, Ganbayar; Baek, Na Rae; Park, Kang Ryoung
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Ampliación del campo de visión basada en la predicción de regiones de imagen utilizando videos térmicos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Estudios
Detección humana
Seguimiento
Cámara térmica
Predicción de imágenes
Red generativa adversaria
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
Se han realizado varios estudios para detectar humanos en imágenes. Sin embargo, existen casos en los que una parte del cuerpo humano desaparece en la imagen de entrada y sale del campo de visión de la cámara (FOV). Además, existen casos en los que un peatón entra en el FOV a medida que una parte del cuerpo aparece lentamente. En estos casos, la detección y seguimiento de humanos fallan con los métodos existentes. Por lo tanto, proponemos el método para predecir una región más amplia que el FOV de una cámara térmica basado en la red generativa adversaria de predicción de imágenes versión 2 (IPGAN-2). Cuando se realizó un experimento utilizando el subconjunto de maratón del conjunto de datos abierto de referencia de video infrarrojo térmico de la Universidad de Boston, el método propuesto mostró una mayor predicción de imágenes (índice de similitud estructural (SSIM) de 0.9437) y precisión de detección de objetos (puntuación F1 de 0.866, precisión de 0.914 y unión sobre intersección (IoU) de 0.730) que los métodos de última generación.
Descripción
Se han realizado varios estudios para detectar humanos en imágenes. Sin embargo, existen casos en los que una parte del cuerpo humano desaparece en la imagen de entrada y sale del campo de visión de la cámara (FOV). Además, existen casos en los que un peatón entra en el FOV a medida que una parte del cuerpo aparece lentamente. En estos casos, la detección y seguimiento de humanos fallan con los métodos existentes. Por lo tanto, proponemos el método para predecir una región más amplia que el FOV de una cámara térmica basado en la red generativa adversaria de predicción de imágenes versión 2 (IPGAN-2). Cuando se realizó un experimento utilizando el subconjunto de maratón del conjunto de datos abierto de referencia de video infrarrojo térmico de la Universidad de Boston, el método propuesto mostró una mayor predicción de imágenes (índice de similitud estructural (SSIM) de 0.9437) y precisión de detección de objetos (puntuación F1 de 0.866, precisión de 0.914 y unión sobre intersección (IoU) de 0.730) que los métodos de última generación.