
Imagen. / Wikimedia Commons
2025-08-05
Nuevos algoritmos permiten un aprendizaje automático eficiente con datos simétricos
Si se rota la imagen de una estructura molecular, una persona puede determinar que la imagen rotada sigue siendo la misma molécula, pero un modelo de aprendizaje automático podría interpretarla como un nuevo punto de datos. En el lenguaje informático, la molécula es «simétrica», lo que significa que su estructura fundamental permanece inalterada si sufre ciertas transformaciones, como la rotación.
Si un modelo de descubrimiento de fármacos no comprende la simetría, podría realizar predicciones inexactas sobre las propiedades moleculares. Sin embargo, a pesar de algunos éxitos empíricos, no está claro si existe un método computacionalmente eficiente para entrenar un buen modelo que garantice el respeto de la simetría.
Un nuevo estudio realizado por investigadores del MIT responde a esta pregunta y presenta el primer método de aprendizaje automático con simetría cuya eficiencia es demostrable tanto en términos de la cantidad de computación como de los datos necesarios.
Estos resultados aclaran una cuestión fundamental y podrían ayudar a los investigadores a desarrollar modelos de aprendizaje automático más potentes, diseñados para gestionar la simetría. Dichos modelos serían útiles en diversas aplicaciones, desde el descubrimiento de nuevos materiales hasta la identificación de anomalías astronómicas y el desentrañar patrones climáticos complejos.
“Estas simetrías son importantes porque constituyen información que la naturaleza nos proporciona sobre los datos, y debemos tenerla en cuenta en nuestros modelos de aprendizaje automático. Hemos demostrado que es posible realizar aprendizaje automático con datos simétricos de forma eficiente”, afirma Behrooz Tahmasebi, estudiante de posgrado del MIT y coautor principal de este estudio.
En el artículo, colaboran con él Ashkan Soleymani, coautor principal y estudiante de posgrado del MIT; Stefanie Jegelka, profesora asociada de Ingeniería Eléctrica e Informática (EECS) y miembro del Instituto de Datos, Sistemas y Sociedad (IDSS) y del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL); y el autor principal Patrick Jaillet, profesor Dugald C. Jackson de Ingeniería Eléctrica e Informática e investigador principal del Laboratorio de Sistemas de Información y Decisión (LIDS). La investigación se presentó recientemente en la Conferencia Internacional sobre Aprendizaje Automático.
Estudiando la simetría
Los datos simétricos aparecen en muchos ámbitos, especialmente en las ciencias naturales y la física. Un modelo que reconoce simetrías es capaz de identificar un objeto, como un coche, independientemente de su ubicación en una imagen, por ejemplo.
A menos que un modelo de aprendizaje automático esté diseñado para gestionar la simetría, podría ser menos preciso y propenso a fallas al enfrentarse a nuevos datos simétricos en situaciones reales. Por otro lado, los modelos que aprovechan la simetría podrían ser más rápidos y requerir menos datos para el entrenamiento.
Pero entrenar un modelo para procesar datos simétricos no es una tarea fácil.
Un enfoque común se denomina aumento de datos, en el que los investigadores transforman cada punto de datos simétrico en múltiples puntos de datos para facilitar la generalización del modelo a nuevos datos. Por ejemplo, se podría rotar una estructura molecular varias veces para generar nuevos datos de entrenamiento, pero si los investigadores desean garantizar que el modelo respete la simetría, esto puede resultar computacionalmente prohibitivo.
Un enfoque alternativo consiste en codificar la simetría en la arquitectura del modelo. Un ejemplo bien conocido de esto es una red neuronal de grafos (GNN), que, debido a su diseño, gestiona datos simétricos de forma inherente.
Las redes neuronales de grafos son rápidas y eficientes, y gestionan la simetría bastante bien, pero nadie sabe realmente qué aprenden estos modelos ni por qué funcionan. Comprender las redes neuronales de grafos es una de las principales motivaciones de nuestro trabajo, por lo que comenzamos con una evaluación teórica de lo que sucede cuando los datos son simétricos, afirma Tahmasebi.
Exploraron la compensación entre estadística y computación en el aprendizaje automático con datos simétricos. Esta compensación implica que los métodos que requieren menos datos pueden ser más costosos computacionalmente, por lo que los investigadores necesitan encontrar el equilibrio adecuado.
Basándose en esta evaluación teórica, los investigadores diseñaron un algoritmo eficiente para el aprendizaje automático con datos simétricos.
Combinaciones matemáticas
Para ello, tomaron ideas del álgebra para reducir y simplificar el problema. Luego, lo reformularon utilizando ideas de la geometría que captan eficazmente la simetría.
Finalmente, combinaron el álgebra y la geometría en un problema de optimización que puede resolverse eficientemente, dando como resultado su nuevo algoritmo.
“La mayor parte de la teoría y las aplicaciones se centraban en el álgebra o la geometría. Aquí simplemente las combinamos”, dice Tahmasebi.
El algoritmo requiere menos muestras de datos para el entrenamiento que los enfoques clásicos, lo que mejoraría la precisión del modelo y su capacidad para adaptarse a nuevas aplicaciones.
Al demostrar que los científicos pueden desarrollar algoritmos eficientes para el aprendizaje automático con simetría, y demostrar cómo se puede hacer, estos resultados podrían conducir al desarrollo de nuevas arquitecturas de redes neuronales que podrían ser más precisas y consumir menos recursos que los modelos actuales.
Los científicos también podrían utilizar este análisis como punto de partida para examinar el funcionamiento interno de las GNN y cómo sus operaciones difieren del algoritmo desarrollado por los investigadores del MIT.
“Una vez que sepamos eso mejor, podremos diseñar arquitecturas de redes neuronales más interpretables, más robustas y más eficientes”, añade Soleymani.
Esta investigación está financiada, en parte, por la Fundación Nacional de Investigación de Singapur, los Laboratorios Nacionales DSO de Singapur, la Oficina de Investigación Naval de EE. UU., la Fundación Nacional de Ciencias de EE. UU. y una Cátedra Alexander von Humboldt.
Autor

MIT
Promover la investigación, las innovaciones, la enseñanza y los eventos y las personas de interés periodístico del MIT a la comunidad del campus, los medios de comunicación y el público en general, Comunicar anuncios del Instituto, Publicar noticias de la comunidad para profesores, estudiantes, personal y ex alumnos del MIT. Proporcionar servicios de medios a los miembros de la comunidad, incluido el asesoramiento sobre cómo trabajar con periodistas, Responder a consultas de los medios y solicitudes de entrevistas...