Generando un conjunto de datos para la segmentación semántica de troncos de viñas en viñedos utilizando aprendizaje semi-supervisado y detección de objetos
Autores: Slaviek, Petar; Hrabar, Ivan; Kovai, Zdenko
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Generando un conjunto de datos para la segmentación semántica de troncos de viñas en viñedos utilizando aprendizaje semi-supervisado y detección de objetos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Enfoque probado experimentalmente
Aprendizaje semi-supervisado
Segmentación semántica
Troncos de vid
Robots autónomos
Conjunto de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
Este artículo describe un enfoque probado experimentalmente utilizando aprendizaje semi-supervisado para generar nuevos conjuntos de datos para la segmentación semántica de troncos de vid con muy pocos datos anotados por humanos, lo que resulta en ahorros significativos en tiempo y recursos. La creación de tales conjuntos de datos es un paso crucial hacia el desarrollo de robots autónomos para el mantenimiento de viñedos. Para que una plataforma robótica móvil realice una tarea de mantenimiento en el viñedo, como el desbaste, se requiere una vista segmentada semánticamente de los troncos de vid. El robot debe reconocer la forma y la posición de los troncos de vid y adaptar sus movimientos y acciones en consecuencia. Comenzando con el reconocimiento de troncos de vid y terminando con el entrenamiento semi-supervisado para la segmentación semántica, hemos demostrado que la necesidad de anotación humana, que suele ser un proceso que consume mucho tiempo y es costoso, puede reducirse significativamente si se dispone de un conjunto de datos para la detección de objetos (tronco de vid). En este estudio, generamos alrededor de 35,000 imágenes con segmentación semántica de troncos de vid utilizando solo 300 imágenes anotadas por un humano. Este método elimina aproximadamente el 99% del tiempo que se requeriría para anotar manualmente todo el conjunto de datos. Basado en el conjunto de datos evaluado, comparamos diferentes arquitecturas de modelos de segmentación semántica para determinar cuál es la más adecuada para aplicaciones con robots móviles. Se determinó un equilibrio entre precisión, velocidad y requisitos de memoria. El modelo con el mejor equilibrio logró una precisión de validación del 81% y un tiempo de procesamiento de solo 5 ms. Los resultados de este trabajo, obtenidos durante experimentos en un viñedo en karst, muestran el potencial de la anotación inteligente de datos, reduciendo el tiempo requerido para el etiquetado y, por lo tanto, allanando el camino para más innovaciones en el aprendizaje automático.
Descripción
Este artículo describe un enfoque probado experimentalmente utilizando aprendizaje semi-supervisado para generar nuevos conjuntos de datos para la segmentación semántica de troncos de vid con muy pocos datos anotados por humanos, lo que resulta en ahorros significativos en tiempo y recursos. La creación de tales conjuntos de datos es un paso crucial hacia el desarrollo de robots autónomos para el mantenimiento de viñedos. Para que una plataforma robótica móvil realice una tarea de mantenimiento en el viñedo, como el desbaste, se requiere una vista segmentada semánticamente de los troncos de vid. El robot debe reconocer la forma y la posición de los troncos de vid y adaptar sus movimientos y acciones en consecuencia. Comenzando con el reconocimiento de troncos de vid y terminando con el entrenamiento semi-supervisado para la segmentación semántica, hemos demostrado que la necesidad de anotación humana, que suele ser un proceso que consume mucho tiempo y es costoso, puede reducirse significativamente si se dispone de un conjunto de datos para la detección de objetos (tronco de vid). En este estudio, generamos alrededor de 35,000 imágenes con segmentación semántica de troncos de vid utilizando solo 300 imágenes anotadas por un humano. Este método elimina aproximadamente el 99% del tiempo que se requeriría para anotar manualmente todo el conjunto de datos. Basado en el conjunto de datos evaluado, comparamos diferentes arquitecturas de modelos de segmentación semántica para determinar cuál es la más adecuada para aplicaciones con robots móviles. Se determinó un equilibrio entre precisión, velocidad y requisitos de memoria. El modelo con el mejor equilibrio logró una precisión de validación del 81% y un tiempo de procesamiento de solo 5 ms. Los resultados de este trabajo, obtenidos durante experimentos en un viñedo en karst, muestran el potencial de la anotación inteligente de datos, reduciendo el tiempo requerido para el etiquetado y, por lo tanto, allanando el camino para más innovaciones en el aprendizaje automático.