logo móvil
Contáctanos

Benchmarking AstroCLIP para la estimación de propiedades de galaxias: reproducción, robustez y análisis de incrustación

Autores: Carollo, Riccardo; Arandjelovi, Ognjen; Harper, Tom

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

Benchmarking AstroCLIP para la estimación de propiedades de galaxias: reproducción, robustez y análisis de incrustación


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Modelo auto-supervisado
Evaluación
Incrustación
Espectroscópico
Imagen grande

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Las grandes encuestas de imágenes y espectroscopía ahora producen datos heterogéneos a una escala que desafía los enfoques supervisados que dependen de etiquetas escasas y de un reentrenamiento específico de la tarea. En este artículo, realizamos una evaluación y análisis sistemático de AstroCLIP, un modelo auto-supervisado multimodal que alinea imágenes de galaxias y espectros ópticos dentro de un espacio de incrustación compartido. Nuestro objetivo general es ampliar el benchmark publicado con una evaluación más detallada de la robustez y el comportamiento de la incrustación. Utilizando el conjunto de evaluación de la encuesta de imágenes DESI y DESI Legacy, primero reproducimos los principales resultados de regresión de propiedades de galaxias y luego ampliamos la evaluación de dos maneras novedosas: (i) estratificando el rendimiento predictivo a través de un proxy de conteo de vecinos para la densidad del entorno local, y (ii) comparando las categorías observacionales del conjunto etiquetadas como Low-z (Brillante) y High-z (Débil). Además, inspeccionamos el espacio de incrustación utilizando UMAP y agrupamiento no supervisado, y cuantificamos el acuerdo de propiedades de clúster utilizando la información mutua ajustada (AMI). A través de las tareas, las incrustaciones espectrales superan consistentemente a las incrustaciones de imágenes; por ejemplo, la predicción de cero disparos alcanza R2=0.87 para log(M*) y R2=0.63 para log(sSFR). Bajo nuestro proxy de entorno, los intervalos de densidad moderada a menudo producen el rendimiento predictivo más fuerte, mientras que los intervalos muy escasos o abarrotados tienden a tener un rendimiento inferior. Las predicciones basadas en imágenes se benefician sustancialmente del subconjunto Low-z (Brillante), mientras que las incrustaciones espectrales son más estables a través de la división observacional. Al mismo tiempo, UMAP y el agrupamiento revelan solo una débil separación discreta por propiedades físicas individuales, por lo que los resultados son más consistentes con la información útil siendo codificada en una forma en gran medida continua en lugar de en forma de clústeres agudos.

Otros recursos que podrían interesarte

Temas Virtualpro