Integrando agrupamiento difuso C-Means y IA Explicable para una clasificación robusta de galaxias
Autores: Marín Díaz, Gabriel; Gómez Medina, Raquel; Aijón Jiménez, José Alberto
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Integrando agrupamiento difuso C-Means y IA Explicable para una clasificación robusta de galaxias
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Galaxias
Técnicas de aprendizaje automático
Agrupamiento Fuzzy C-Means
Métodos de explicabilidad
Características morfológicas
Valores SHAP
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 17
Citaciones: Sin citaciones
La clasificación de galaxias ha avanzado significativamente utilizando técnicas de aprendizaje automático, ofreciendo una comprensión más profunda del universo. Este estudio se centra en la tipología de galaxias utilizando datos del proyecto Galaxy Zoo, donde las clasificaciones se basan en las opiniones de voluntarios no expertos, introduciendo un grado de incertidumbre. El objetivo de este estudio es integrar el agrupamiento Fuzzy C-Means (FCM) con métodos de explicabilidad para lograr un modelo preciso e interpretable para la clasificación de galaxias. Aplicamos FCM para gestionar esta incertidumbre y agrupar galaxias según sus características morfológicas. Además, utilizamos métodos de explicabilidad, específicamente valores SHAP (SHapley Additive exPlanations) y LIME (Local Interpretable Model-Agnostic Explanations), para interpretar y explicar los factores clave que influyen en la clasificación. Los resultados muestran que el uso de FCM permite una clasificación precisa mientras se gestiona la incertidumbre de los datos, con valores de precisión altos que cumplen las expectativas del estudio. Además, los valores SHAP y LIME proporcionan una comprensión clara de las características más influyentes en cada grupo. Este método mejora nuestra clasificación y comprensión de las galaxias y es extensible a estudios ambientales en la Tierra, ofreciendo herramientas para la gestión y protección ambiental. La metodología presentada destaca la importancia de integrar técnicas de FCM y XAI para abordar problemas complejos con datos inciertos.
Descripción
La clasificación de galaxias ha avanzado significativamente utilizando técnicas de aprendizaje automático, ofreciendo una comprensión más profunda del universo. Este estudio se centra en la tipología de galaxias utilizando datos del proyecto Galaxy Zoo, donde las clasificaciones se basan en las opiniones de voluntarios no expertos, introduciendo un grado de incertidumbre. El objetivo de este estudio es integrar el agrupamiento Fuzzy C-Means (FCM) con métodos de explicabilidad para lograr un modelo preciso e interpretable para la clasificación de galaxias. Aplicamos FCM para gestionar esta incertidumbre y agrupar galaxias según sus características morfológicas. Además, utilizamos métodos de explicabilidad, específicamente valores SHAP (SHapley Additive exPlanations) y LIME (Local Interpretable Model-Agnostic Explanations), para interpretar y explicar los factores clave que influyen en la clasificación. Los resultados muestran que el uso de FCM permite una clasificación precisa mientras se gestiona la incertidumbre de los datos, con valores de precisión altos que cumplen las expectativas del estudio. Además, los valores SHAP y LIME proporcionan una comprensión clara de las características más influyentes en cada grupo. Este método mejora nuestra clasificación y comprensión de las galaxias y es extensible a estudios ambientales en la Tierra, ofreciendo herramientas para la gestión y protección ambiental. La metodología presentada destaca la importancia de integrar técnicas de FCM y XAI para abordar problemas complejos con datos inciertos.