Pano-RSOD: un conjunto de datos y una referencia para la detección de objetos en escenas viales panorámicas
Autores: Li, Yong; Tong, Guofeng; Gao, Huashuai; Wang, Yuebin; Zhang, Liqiang; Chen, Huairong
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Pano-RSOD: un conjunto de datos y una referencia para la detección de objetos en escenas viales panorámicas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Imágenes panorámicas
Detección de objetos
Métodos de aprendizaje profundo
Conjunto de datos de entrenamiento
Pano-RSOD
Percepción ambiental
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
Las imágenes panorámicas tienen una amplia gama de aplicaciones en muchos campos gracias a su capacidad para percibir información completa. La detección de objetos basada en imágenes panorámicas tiene ciertas ventajas en términos de percepción del entorno debido a las características de las imágenes panorámicas, por ejemplo, una perspectiva más amplia. En los últimos años, los métodos de aprendizaje profundo han logrado resultados notables en clasificación de imágenes y detección de objetos. Su rendimiento depende de la gran cantidad de datos de entrenamiento. Por lo tanto, un buen conjunto de datos de entrenamiento es un requisito previo para que los métodos logren mejores resultados de reconocimiento. Luego, construimos un benchmark llamado Pano-RSOD para la detección de objetos en escenas viales panorámicas. Pano-RSOD contiene vehículos, peatones, señales de tráfico y flechas guía. Los objetos de Pano-RSOD están etiquetados con cuadros delimitadores en las imágenes. A diferencia de los conjuntos de datos tradicionales de detección de objetos, Pano-RSOD contiene más objetos en una imagen panorámica, y las imágenes de alta resolución tienen una percepción ambiental de 360 grados, más anotaciones, más objetos pequeños y escenas viales diversas. Los algoritmos de aprendizaje profundo de última generación se entrenan en Pano-RSOD para la detección de objetos, lo que demuestra que Pano-RSOD es un benchmark útil, y proporciona un mejor conjunto de datos de entrenamiento de imágenes panorámicas para tareas de detección de objetos, especialmente para objetos pequeños y deformados.
Descripción
Las imágenes panorámicas tienen una amplia gama de aplicaciones en muchos campos gracias a su capacidad para percibir información completa. La detección de objetos basada en imágenes panorámicas tiene ciertas ventajas en términos de percepción del entorno debido a las características de las imágenes panorámicas, por ejemplo, una perspectiva más amplia. En los últimos años, los métodos de aprendizaje profundo han logrado resultados notables en clasificación de imágenes y detección de objetos. Su rendimiento depende de la gran cantidad de datos de entrenamiento. Por lo tanto, un buen conjunto de datos de entrenamiento es un requisito previo para que los métodos logren mejores resultados de reconocimiento. Luego, construimos un benchmark llamado Pano-RSOD para la detección de objetos en escenas viales panorámicas. Pano-RSOD contiene vehículos, peatones, señales de tráfico y flechas guía. Los objetos de Pano-RSOD están etiquetados con cuadros delimitadores en las imágenes. A diferencia de los conjuntos de datos tradicionales de detección de objetos, Pano-RSOD contiene más objetos en una imagen panorámica, y las imágenes de alta resolución tienen una percepción ambiental de 360 grados, más anotaciones, más objetos pequeños y escenas viales diversas. Los algoritmos de aprendizaje profundo de última generación se entrenan en Pano-RSOD para la detección de objetos, lo que demuestra que Pano-RSOD es un benchmark útil, y proporciona un mejor conjunto de datos de entrenamiento de imágenes panorámicas para tareas de detección de objetos, especialmente para objetos pequeños y deformados.