Detección de vehículos tridimensional y estimación de pose en imágenes monoculares para infraestructuras inteligentes
Autores: Borau Bernad, Javier; Ramajo-Ballester, Álvaro; Armingol Moreno, José María
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Detección de vehículos tridimensional y estimación de pose en imágenes monoculares para infraestructuras inteligentes
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Ciudades inteligentes
Sistemas de recopilación de datos
Aprendizaje profundo
Visión por computadora
Estimación de poses en 3D
Cámaras basadas en infraestructura
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Durante las últimas décadas, la idea de las ciudades inteligentes ha evolucionado de un concepto visionario del futuro a una realidad concreta. Sin embargo, la visión de las ciudades inteligentes no se ha realizado completamente dentro de nuestra sociedad, en parte debido a los desafíos encontrados en los sistemas contemporáneos de recopilación de datos. A pesar de estos obstáculos, los avances en aprendizaje profundo y visión por computadora han impulsado el desarrollo de algoritmos de detección altamente precisos capaces de obtener datos en 3D de fuentes de imágenes. Sin embargo, este enfoque se ha centrado predominantemente en la extracción de datos desde la perspectiva de un vehículo, pasando por alto las ventajas de utilizar cámaras montadas en la infraestructura para realizar la estimación de la pose en 3D de vehículos en entornos urbanos. Este artículo se enfoca en aprovechar la estimación de la pose en 3D desde esta perspectiva alternativa, beneficiándose del campo de visión ampliado que proporcionan las cámaras basadas en la infraestructura, evitando las oclusiones y obteniendo más información sobre los tamaños de los objetos, lo que conduce a mejores resultados y predicciones más precisas en comparación con los modelos entrenados desde la perspectiva de un vehículo. Por lo tanto, esta investigación propone un nuevo camino de exploración, apoyando la integración de sistemas de recopilación de datos basados en infraestructura monocular en el desarrollo de ciudades inteligentes.
Descripción
Durante las últimas décadas, la idea de las ciudades inteligentes ha evolucionado de un concepto visionario del futuro a una realidad concreta. Sin embargo, la visión de las ciudades inteligentes no se ha realizado completamente dentro de nuestra sociedad, en parte debido a los desafíos encontrados en los sistemas contemporáneos de recopilación de datos. A pesar de estos obstáculos, los avances en aprendizaje profundo y visión por computadora han impulsado el desarrollo de algoritmos de detección altamente precisos capaces de obtener datos en 3D de fuentes de imágenes. Sin embargo, este enfoque se ha centrado predominantemente en la extracción de datos desde la perspectiva de un vehículo, pasando por alto las ventajas de utilizar cámaras montadas en la infraestructura para realizar la estimación de la pose en 3D de vehículos en entornos urbanos. Este artículo se enfoca en aprovechar la estimación de la pose en 3D desde esta perspectiva alternativa, beneficiándose del campo de visión ampliado que proporcionan las cámaras basadas en la infraestructura, evitando las oclusiones y obteniendo más información sobre los tamaños de los objetos, lo que conduce a mejores resultados y predicciones más precisas en comparación con los modelos entrenados desde la perspectiva de un vehículo. Por lo tanto, esta investigación propone un nuevo camino de exploración, apoyando la integración de sistemas de recopilación de datos basados en infraestructura monocular en el desarrollo de ciudades inteligentes.