logo móvil
Contáctanos
Portada

Imagen diseñada por Alex Shipps/MIT CSAIL, utilizando fotografías de los investigadores.

2025-07-17

Una tubería basada en simulación adapta los datos de entrenamiento para robots diestros


Cuando ChatGPT o Gemini ofrecen una respuesta aparentemente experta a tus preguntas más urgentes, quizá no te des cuenta de la cantidad de información que necesitan para darla. Al igual que otros modelos populares de inteligencia artificial (IA) generativa, estos chatbots se basan en sistemas fundamentales llamados modelos base que se entrenan con miles de millones, o incluso billones, de datos.

De forma similar, los ingenieros esperan construir modelos básicos que entrenen a diversos robots en nuevas habilidades, como recoger, mover y depositar objetos en lugares como hogares y fábricas. El problema radica en la dificultad de recopilar y transferir datos instructivos entre sistemas robóticos. Se podría entrenar al sistema teleoperando el hardware paso a paso mediante tecnologías como la realidad virtual (RV), pero esto puede requerir mucho tiempo. El entrenamiento con vídeos de internet es menos instructivo, ya que no ofrecen una guía paso a paso de tareas específicas para robots específicos.

Un enfoque basado en simulación, denominado "PhysicsGen", del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) del MIT y el Instituto de Robótica e IA, personaliza los datos de entrenamiento de los robots para ayudarlos a encontrar los movimientos más eficientes para una tarea. El sistema puede multiplicar unas pocas docenas de demostraciones de RV en casi 3000 simulaciones por máquina. Estas instrucciones de alta calidad se asignan posteriormente a las configuraciones precisas de sus compañeros mecánicos, como brazos y manos robóticos.

PhysicsGen crea datos que se generalizan a robots y condiciones específicos mediante un proceso de tres pasos. Primero, un dispositivo de realidad virtual rastrea cómo los humanos manipulan objetos como bloques con las manos. Estas interacciones se mapean simultáneamente en un simulador de física 3D, visualizando los puntos clave de nuestras manos como pequeñas esferas que reflejan nuestros gestos. Por ejemplo, si le dieras la vuelta a un juguete, verías formas 3D que representan diferentes partes de tus manos rotando una versión virtual de ese objeto.

El proceso luego reasigna estos puntos a un modelo 3D de la configuración de una máquina específica (como un brazo robótico), moviéndolos a las "articulaciones" precisas donde un sistema gira y gira. Finalmente, PhysicsGen utiliza la optimización de trayectorias, simulando esencialmente los movimientos más eficientes para completar una tarea, para que el robot conozca las mejores maneras de hacer cosas como reposicionar una caja.

Cada simulación es un punto de datos de entrenamiento detallado que guía al robot a través de posibles maneras de manipular objetos. Al implementarse en una política (o el plan de acción que sigue el robot), la máquina tiene diversas maneras de abordar una tarea y puede probar diferentes movimientos si alguno no funciona.

“Estamos creando datos específicos para robots sin necesidad de que los humanos graben de nuevo demostraciones especializadas para cada máquina”, afirma Lujie Yang, estudiante de doctorado en ingeniería eléctrica e informática del MIT y afiliado a CSAIL, autor principal de un nuevo artículo que presenta el proyecto. “Estamos ampliando la escala de los datos de forma autónoma y eficiente, lo que permite que las instrucciones de las tareas sean útiles para una gama más amplia de máquinas”.

Generar tantas trayectorias de instrucción para robots podría, con el tiempo, ayudar a los ingenieros a construir un conjunto de datos masivo para guiar máquinas como brazos robóticos y manos diestras. Por ejemplo, la canalización podría ayudar a dos brazos robóticos a colaborar en la recogida de artículos del almacén y su colocación en las cajas correctas para su entrega. El sistema también podría guiar a dos robots para que trabajen juntos en un hogar en tareas como guardar tazas.

El potencial de PhysicsGen también se extiende a la conversión de datos diseñados para robots antiguos o entornos diferentes en instrucciones útiles para máquinas nuevas. “A pesar de que se recopilan para un tipo específico de robot, podemos recuperar estos conjuntos de datos anteriores para que sean más útiles en general”, añade Yang.

Suma por multiplicación.

PhysicsGen convirtió tan solo 24 demostraciones humanas en miles de simulaciones, ayudando a robots digitales y del mundo real a reorientar objetos.

Yang y sus colegas probaron primero su proceso en un experimento virtual donde una mano robótica flotante necesitaba rotar un bloque a una posición objetivo. El robot digital ejecutó la tarea con una precisión del 81 % entrenándose con el enorme conjunto de datos de PhysicGen, una mejora del 60 % con respecto a una línea base que solo aprendió de demostraciones humanas.

Los investigadores también descubrieron que PhysicsGen podía mejorar la colaboración entre brazos robóticos virtuales para manipular objetos. Su sistema generó datos de entrenamiento adicionales que ayudaron a dos pares de robots a completar tareas con éxito hasta un 30 % más a menudo que una línea base enseñada exclusivamente por humanos.

En un experimento con un par de brazos robóticos reales, los investigadores observaron mejoras similares cuando las máquinas trabajaron en equipo para voltear una caja grande a su posición designada. Cuando los robots se desviaron de la trayectoria prevista o manipularon mal el objeto, pudieron recuperarse a mitad de la tarea consultando trayectorias alternativas de su biblioteca de datos de instrucción.

El autor principal, Russ Tedrake, profesor Toyota de Ingeniería Eléctrica y Ciencias de la Computación, Aeronáutica y Astronáutica, e Ingeniería Mecánica en el MIT, añade que esta técnica de generación de datos guiada por imitación combina las ventajas de la demostración humana con la potencia de los algoritmos de planificación del movimiento robótico.

«Incluso una sola demostración humana puede simplificar considerablemente el problema de la planificación del movimiento», afirma Tedrake, vicepresidente sénior de modelos de comportamiento de gran tamaño en el Instituto de Investigación Toyota e investigador principal del CSAIL. «En el futuro, quizá los modelos base puedan proporcionar esta información, y este tipo de técnica de generación de datos proporcionará una especie de receta de posentrenamiento para ese modelo».

El futuro de PhysicsGen

Pronto, PhysicsGen podrá extenderse a una nueva frontera: diversificar las tareas que una máquina puede ejecutar.

“Nos gustaría usar PhysicsGen para enseñar a un robot a verter agua cuando solo ha sido entrenado para guardar platos, por ejemplo”, dice Yang. “Nuestra tubería no solo genera movimientos dinámicamente factibles para tareas habituales; también tiene el potencial de crear una biblioteca diversa de interacciones físicas que creemos que pueden servir como base para realizar tareas completamente nuevas que un humano no ha demostrado”.

La creación de una gran cantidad de datos de entrenamiento de amplia aplicación podría, con el tiempo, ayudar a construir un modelo base para robots, aunque los investigadores del MIT advierten que este es un objetivo algo lejano. El equipo liderado por CSAIL investiga cómo PhysicsGen puede aprovechar vastos recursos no estructurados, como vídeos de internet, como base para la simulación. El objetivo: transformar el contenido visual cotidiano en datos ricos y compatibles con robots que puedan enseñar a las máquinas a realizar tareas que nadie les ha enseñado explícitamente.

Yang y sus colegas también buscan que PhysicsGen sea aún más útil para robots con diversas formas y configuraciones en el futuro. Para lograrlo, planean aprovechar conjuntos de datos con demostraciones de robots reales, capturando cómo se mueven las articulaciones robóticas en lugar de las humanas.

Los investigadores también planean incorporar aprendizaje por refuerzo, donde un sistema de IA aprende mediante ensayo y error, para que PhysicsGen amplíe su conjunto de datos más allá de los ejemplos proporcionados por humanos. Podrían ampliar su cartera de datos con técnicas avanzadas de percepción para ayudar a un robot a percibir e interpretar su entorno visualmente, permitiéndole analizar y adaptarse a las complejidades del mundo físico.

Por ahora, PhysicsGen muestra cómo la IA puede ayudarnos a enseñar a diferentes robots a manipular objetos de la misma categoría, en particular los rígidos. El proceso podría ayudar pronto a los robots a encontrar las mejores maneras de manipular objetos blandos (como frutas) y deformables (como arcilla), pero estas interacciones aún no son fáciles de simular.

Yang y Tedrake escribieron el artículo junto con dos colegas de CSAIL: el coautor principal y estudiante de doctorado del MIT, Hyung Ju “Terry” Suh SM ´22, y el estudiante de doctorado del MIT, Bernhard Paus Græsdal. Los investigadores del Instituto de Robótica e IA, Tong Zhao ´22, MEng ´23, Tarik Kelestemur, Jiuguang Wang y Tao Pang PhD ´23, también son autores. Su trabajo contó con el apoyo del Instituto de Robótica e IA y Amazon.

Los investigadores presentaron recientemente su trabajo en la conferencia Robótica: Ciencia y Sistemas.

Autor

Autor
Imagen MIT

MIT

Promover la investigación, las innovaciones, la enseñanza y los eventos y las personas de interés periodístico del MIT a la comunidad del campus, los medios de comunicación y el público en general, Comunicar anuncios del Instituto, Publicar noticias de la comunidad para profesores, estudiantes, personal y ex alumnos del MIT. Proporcionar servicios de medios a los miembros de la comunidad, incluido el asesoramiento sobre cómo trabajar con periodistas, Responder a consultas de los medios y solicitudes de entrevistas...

Noticias más leídas

Otros recursos que podrían interesarte

Temas Virtualpro