Acelerando la segmentación semántica de instancias utilizando información de movimiento
Autores: Zvoriteanu, Otilia; Caraiman, Simona; Manta, Vasile-Ion
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Acelerando la segmentación semántica de instancias utilizando información de movimiento
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Entorno
Percepción
Comprensión
Visión por computadora
Segmentación semántica de instancias
Flujo óptico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La percepción y comprensión del entorno representan aspectos críticos en la mayoría de los sistemas y/o aplicaciones de visión por computadora. Las técnicas de vanguardia para resolver esta tarea de visión (por ejemplo, la segmentación de instancias semánticas) requieren recursos de hardware dedicados para ejecutarse o un tiempo de ejecución más largo. Generalmente, los principales esfuerzos se centraron en mejorar la precisión de estos métodos en lugar de hacerlos más rápidos. Este artículo presenta una solución novedosa para acelerar la tarea de segmentación de instancias semánticas. La solución combina dos métodos de vanguardia de segmentación de instancias semánticas y campos de flujo óptico. Para reducir el tiempo de inferencia, el marco propuesto ejecuta la inferencia en cada quinto fotograma, y para los cuatro fotogramas restantes, utiliza el mapa de movimiento calculado por el flujo óptico para deformar la salida de segmentación de instancias. Mediante esta estrategia, el tiempo de ejecución se reduce considerablemente mientras se mantiene la precisión en niveles de vanguardia. Evaluamos nuestra solución en dos conjuntos de datos utilizando benchmarks disponibles. Luego, concluimos sobre los resultados obtenidos, destacando la precisión de la solución y la capacidad de operación en tiempo real.
Descripción
La percepción y comprensión del entorno representan aspectos críticos en la mayoría de los sistemas y/o aplicaciones de visión por computadora. Las técnicas de vanguardia para resolver esta tarea de visión (por ejemplo, la segmentación de instancias semánticas) requieren recursos de hardware dedicados para ejecutarse o un tiempo de ejecución más largo. Generalmente, los principales esfuerzos se centraron en mejorar la precisión de estos métodos en lugar de hacerlos más rápidos. Este artículo presenta una solución novedosa para acelerar la tarea de segmentación de instancias semánticas. La solución combina dos métodos de vanguardia de segmentación de instancias semánticas y campos de flujo óptico. Para reducir el tiempo de inferencia, el marco propuesto ejecuta la inferencia en cada quinto fotograma, y para los cuatro fotogramas restantes, utiliza el mapa de movimiento calculado por el flujo óptico para deformar la salida de segmentación de instancias. Mediante esta estrategia, el tiempo de ejecución se reduce considerablemente mientras se mantiene la precisión en niveles de vanguardia. Evaluamos nuestra solución en dos conjuntos de datos utilizando benchmarks disponibles. Luego, concluimos sobre los resultados obtenidos, destacando la precisión de la solución y la capacidad de operación en tiempo real.