Molo-slam: un slam semántico para la eliminación precisa de objetos dinámicos en entornos agrícolas
Autores: Lv, Jinhong; Yao, Beihuo; Guo, Haijun; Gao, Changlun; Wu, Weibin; Li, Junlin; Sun, Shunli; Luo, Qing
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Molo-slam: un slam semántico para la eliminación precisa de objetos dinámicos en entornos agrícolas
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Localización y mapeo simultáneo visual
VSLAM
Objetos dinámicos
MOLO-SLAM
ORBSLAM2.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
La localización y mapeo simultáneo visual (VSLAM) es una tecnología fundamental que permite a los robots lograr locomoción totalmente autónoma, exploración, inspección y más dentro de entornos complejos. Su aplicabilidad también se extiende significativamente a entornos agrícolas. Aunque han surgido numerosos sistemas VSLAM impresionantes, la mayoría de ellos se basan en suposiciones de mundo estático. Esta dependencia limita su uso en escenarios dinámicos reales y conduce a una mayor inestabilidad cuando se aplica en contextos agrícolas. Para abordar el problema de detectar y eliminar objetos dinámicos lentos en escenarios agrícolas de bosques al aire libre y jardines de té, este documento presenta una innovación dinámica VSLAM llamada MOLO-SLAM (optimización de etiqueta de máscara ORB SLAM). MOLO-SLAM fusiona el marco ORBSLAM2 con la red de segmentación de instancias Mask-RCNN, utilizando máscaras y cuadros delimitadores para mejorar la precisión y limpieza de nubes de puntos en 3D. Además, se utilizó el algoritmo de reconstrucción BundleFusion para la reconstrucción de modelos de malla en 3D. Al comparar nuestro algoritmo con varios algoritmos VSLAM dinámicos en los conjuntos de datos TUM y KITTI, los resultados muestran mejoras significativas, con mejoras de hasta un 97.72%, 98.51% y 28.07% en relación con el ORBSLAM2 original en los tres conjuntos de datos. Esto muestra las ventajas sobresalientes de nuestro algoritmo.
Descripción
La localización y mapeo simultáneo visual (VSLAM) es una tecnología fundamental que permite a los robots lograr locomoción totalmente autónoma, exploración, inspección y más dentro de entornos complejos. Su aplicabilidad también se extiende significativamente a entornos agrícolas. Aunque han surgido numerosos sistemas VSLAM impresionantes, la mayoría de ellos se basan en suposiciones de mundo estático. Esta dependencia limita su uso en escenarios dinámicos reales y conduce a una mayor inestabilidad cuando se aplica en contextos agrícolas. Para abordar el problema de detectar y eliminar objetos dinámicos lentos en escenarios agrícolas de bosques al aire libre y jardines de té, este documento presenta una innovación dinámica VSLAM llamada MOLO-SLAM (optimización de etiqueta de máscara ORB SLAM). MOLO-SLAM fusiona el marco ORBSLAM2 con la red de segmentación de instancias Mask-RCNN, utilizando máscaras y cuadros delimitadores para mejorar la precisión y limpieza de nubes de puntos en 3D. Además, se utilizó el algoritmo de reconstrucción BundleFusion para la reconstrucción de modelos de malla en 3D. Al comparar nuestro algoritmo con varios algoritmos VSLAM dinámicos en los conjuntos de datos TUM y KITTI, los resultados muestran mejoras significativas, con mejoras de hasta un 97.72%, 98.51% y 28.07% en relación con el ORBSLAM2 original en los tres conjuntos de datos. Esto muestra las ventajas sobresalientes de nuestro algoritmo.