Planificación dinámica de tareas para robots recolectores de manzanas de múltiples brazos utilizando el algoritmo de aprendizaje por refuerzo LSTM-PPO
Autores: Guo, Zhengwei; Fu, Heng; Wu, Jiahao; Han, Wenkai; Huang, Wenlei; Zheng, Wengang; Li, Tao
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Planificación dinámica de tareas para robots recolectores de manzanas de múltiples brazos utilizando el algoritmo de aprendizaje por refuerzo LSTM-PPO
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Planificación dinámica de tareas
Robots de recolección de manzanas de múltiples brazos
Aprendizaje profundo por refuerzo
Redes LSTM
Optimización de Políticas Proximales
Cosecha automatizada de manzanas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Este documento presenta un enfoque dinámico de planificación de tareas para robots de recolección de manzanas de varios brazos basado en un marco de aprendizaje profundo por refuerzo (DRL) que incorpora redes de Memoria a Corto y Largo Plazo (LSTM) y la Optimización de Políticas Proximales (PPO). En el contexto del aumento de los costos laborales y la escasez de mano de obra en la agricultura, la cosecha automatizada de manzanas está cobrando cada vez más importancia. El algoritmo propuesto aborda desafíos clave como la coordinación eficiente de tareas, secuencias de recolección óptimas y la toma de decisiones en tiempo real en entornos de huertos complejos y dinámicos. El rendimiento del sistema se valida a través de simulaciones en entornos estáticos y dinámicos, demostrando mejoras significativas en el tiempo de finalización de tareas y la eficiencia del robot en comparación con estrategias existentes. Los resultados muestran que el enfoque LSTM-PPO supera a otros métodos, ofreciendo una mayor adaptabilidad, tolerancia a fallos y eficiencia en la ejecución de tareas, especialmente en condiciones cambiantes e impredecibles. Esta investigación sienta las bases para el desarrollo de sistemas robóticos más eficientes y adaptables en aplicaciones agrícolas.
Descripción
Este documento presenta un enfoque dinámico de planificación de tareas para robots de recolección de manzanas de varios brazos basado en un marco de aprendizaje profundo por refuerzo (DRL) que incorpora redes de Memoria a Corto y Largo Plazo (LSTM) y la Optimización de Políticas Proximales (PPO). En el contexto del aumento de los costos laborales y la escasez de mano de obra en la agricultura, la cosecha automatizada de manzanas está cobrando cada vez más importancia. El algoritmo propuesto aborda desafíos clave como la coordinación eficiente de tareas, secuencias de recolección óptimas y la toma de decisiones en tiempo real en entornos de huertos complejos y dinámicos. El rendimiento del sistema se valida a través de simulaciones en entornos estáticos y dinámicos, demostrando mejoras significativas en el tiempo de finalización de tareas y la eficiencia del robot en comparación con estrategias existentes. Los resultados muestran que el enfoque LSTM-PPO supera a otros métodos, ofreciendo una mayor adaptabilidad, tolerancia a fallos y eficiencia en la ejecución de tareas, especialmente en condiciones cambiantes e impredecibles. Esta investigación sienta las bases para el desarrollo de sistemas robóticos más eficientes y adaptables en aplicaciones agrícolas.