Aprendiendo a predecir la dinámica rotacional 3D a partir de imágenes de un cuerpo rígido con distribución de masa desconocida
Autores: Mason, Justice J.; Allen-Blanchette, Christine; Zolman, Nicholas; Davison, Elizabeth; Leonard, Naomi Ehrich
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Aprendiendo a predecir la dinámica rotacional 3D a partir de imágenes de un cuerpo rígido con distribución de masa desconocida
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Configuraciones del mundo real
Observaciones de imágenes
Cuerpos rígidos en 3D
Técnicas de estimación clásicas
Métodos de aprendizaje profundo
Modelo de red neuronal basado en la física
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
En muchos entornos del mundo real, pueden estar disponibles observaciones de imágenes de cuerpos rígidos 3D que rotan libremente cuando no se dispone de mediciones de baja dimensión. Sin embargo, la alta dimensionalidad de los datos de imagen impide el uso de técnicas de estimación clásicas para aprender la dinámica. La utilidad de los métodos estándar de aprendizaje profundo también es limitada, porque una imagen de un cuerpo rígido no revela nada sobre la distribución de masa dentro del cuerpo, que, junto con la velocidad angular inicial, es lo que determina cómo rotará el cuerpo. Presentamos un modelo de red neuronal basado en la física para estimar y predecir la dinámica rotacional 3D a partir de secuencias de imágenes. Logramos esto utilizando un pipeline de predicción de múltiples etapas que mapea imágenes individuales a una representación latente homeomórfica, calcula velocidades angulares a partir de pares latentes y predice futuros estados latentes utilizando las ecuaciones de movimiento hamiltonianas. Demostramos la eficacia de nuestro enfoque en nuevos conjuntos de datos de cuerpos rígidos en rotación de secuencias de imágenes sintéticas de objetos en rotación, incluidos cubos, prismas y satélites, con distribuciones de masa uniformes y no uniformes desconocidas. Nuestro modelo supera a las líneas base competidoras en nuestros conjuntos de datos, produciendo mejores predicciones cualitativas y reduciendo el error observado para la red generativa hamiltoniana de última generación en un factor de 2.
Descripción
En muchos entornos del mundo real, pueden estar disponibles observaciones de imágenes de cuerpos rígidos 3D que rotan libremente cuando no se dispone de mediciones de baja dimensión. Sin embargo, la alta dimensionalidad de los datos de imagen impide el uso de técnicas de estimación clásicas para aprender la dinámica. La utilidad de los métodos estándar de aprendizaje profundo también es limitada, porque una imagen de un cuerpo rígido no revela nada sobre la distribución de masa dentro del cuerpo, que, junto con la velocidad angular inicial, es lo que determina cómo rotará el cuerpo. Presentamos un modelo de red neuronal basado en la física para estimar y predecir la dinámica rotacional 3D a partir de secuencias de imágenes. Logramos esto utilizando un pipeline de predicción de múltiples etapas que mapea imágenes individuales a una representación latente homeomórfica, calcula velocidades angulares a partir de pares latentes y predice futuros estados latentes utilizando las ecuaciones de movimiento hamiltonianas. Demostramos la eficacia de nuestro enfoque en nuevos conjuntos de datos de cuerpos rígidos en rotación de secuencias de imágenes sintéticas de objetos en rotación, incluidos cubos, prismas y satélites, con distribuciones de masa uniformes y no uniformes desconocidas. Nuestro modelo supera a las líneas base competidoras en nuestros conjuntos de datos, produciendo mejores predicciones cualitativas y reduciendo el error observado para la red generativa hamiltoniana de última generación en un factor de 2.