Benchmarking AstroCLIP para la estimación de propiedades de galaxias: reproducción, robustez y análisis de incrustación
Autores: Carollo, Riccardo; Arandjelovi, Ognjen; Harper, Tom
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Benchmarking AstroCLIP para la estimación de propiedades de galaxias: reproducción, robustez y análisis de incrustación
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Modelo auto-supervisado
Evaluación
Incrustación
Espectroscópico
Imagen grande
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las grandes encuestas de imágenes y espectroscopía ahora producen datos heterogéneos a una escala que desafía los enfoques supervisados que dependen de etiquetas escasas y de un reentrenamiento específico de la tarea. En este artículo, realizamos una evaluación y análisis sistemático de AstroCLIP, un modelo auto-supervisado multimodal que alinea imágenes de galaxias y espectros ópticos dentro de un espacio de incrustación compartido. Nuestro objetivo general es ampliar el benchmark publicado con una evaluación más detallada de la robustez y el comportamiento de la incrustación. Utilizando el conjunto de evaluación de la encuesta de imágenes DESI y DESI Legacy, primero reproducimos los principales resultados de regresión de propiedades de galaxias y luego ampliamos la evaluación de dos maneras novedosas: (i) estratificando el rendimiento predictivo a través de un proxy de conteo de vecinos para la densidad del entorno local, y (ii) comparando las categorías observacionales del conjunto etiquetadas como Low-z (Brillante) y High-z (Débil). Además, inspeccionamos el espacio de incrustación utilizando UMAP y agrupamiento no supervisado, y cuantificamos el acuerdo de propiedades de clúster utilizando la información mutua ajustada (AMI). A través de las tareas, las incrustaciones espectrales superan consistentemente a las incrustaciones de imágenes; por ejemplo, la predicción de cero disparos alcanza R2=0.87 para log(M*) y R2=0.63 para log(sSFR). Bajo nuestro proxy de entorno, los intervalos de densidad moderada a menudo producen el rendimiento predictivo más fuerte, mientras que los intervalos muy escasos o abarrotados tienden a tener un rendimiento inferior. Las predicciones basadas en imágenes se benefician sustancialmente del subconjunto Low-z (Brillante), mientras que las incrustaciones espectrales son más estables a través de la división observacional. Al mismo tiempo, UMAP y el agrupamiento revelan solo una débil separación discreta por propiedades físicas individuales, por lo que los resultados son más consistentes con la información útil siendo codificada en una forma en gran medida continua en lugar de en forma de clústeres agudos.
Descripción
Las grandes encuestas de imágenes y espectroscopía ahora producen datos heterogéneos a una escala que desafía los enfoques supervisados que dependen de etiquetas escasas y de un reentrenamiento específico de la tarea. En este artículo, realizamos una evaluación y análisis sistemático de AstroCLIP, un modelo auto-supervisado multimodal que alinea imágenes de galaxias y espectros ópticos dentro de un espacio de incrustación compartido. Nuestro objetivo general es ampliar el benchmark publicado con una evaluación más detallada de la robustez y el comportamiento de la incrustación. Utilizando el conjunto de evaluación de la encuesta de imágenes DESI y DESI Legacy, primero reproducimos los principales resultados de regresión de propiedades de galaxias y luego ampliamos la evaluación de dos maneras novedosas: (i) estratificando el rendimiento predictivo a través de un proxy de conteo de vecinos para la densidad del entorno local, y (ii) comparando las categorías observacionales del conjunto etiquetadas como Low-z (Brillante) y High-z (Débil). Además, inspeccionamos el espacio de incrustación utilizando UMAP y agrupamiento no supervisado, y cuantificamos el acuerdo de propiedades de clúster utilizando la información mutua ajustada (AMI). A través de las tareas, las incrustaciones espectrales superan consistentemente a las incrustaciones de imágenes; por ejemplo, la predicción de cero disparos alcanza R2=0.87 para log(M*) y R2=0.63 para log(sSFR). Bajo nuestro proxy de entorno, los intervalos de densidad moderada a menudo producen el rendimiento predictivo más fuerte, mientras que los intervalos muy escasos o abarrotados tienden a tener un rendimiento inferior. Las predicciones basadas en imágenes se benefician sustancialmente del subconjunto Low-z (Brillante), mientras que las incrustaciones espectrales son más estables a través de la división observacional. Al mismo tiempo, UMAP y el agrupamiento revelan solo una débil separación discreta por propiedades físicas individuales, por lo que los resultados son más consistentes con la información útil siendo codificada en una forma en gran medida continua en lugar de en forma de clústeres agudos.