Evaluación de algoritmos de aprendizaje automático basados en conjuntos para la identificación de exoplanetas
Autores: Luz, Thiago S. F.; Braga, Rodrigo A. S.; Ribeiro, Enio R.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Evaluación de algoritmos de aprendizaje automático basados en conjuntos para la identificación de exoplanetas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Algoritmos de conjunto
Aprendizaje automático
Clasificación de exoplanetas
Hiperparámetros
Métricas de rendimiento
Algoritmo de apilamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Este documento presenta un procedimiento de evaluación integral para evaluar algoritmos de Aprendizaje Automático basados en Conjuntos en el contexto de la clasificación de exoplanetas. Cada uno de los valores de hiperparámetros del algoritmo fue ajustado. Las implementaciones se llevaron a cabo utilizando el método de validación cruzada. Las métricas de rendimiento, incluyendo precisión, sensibilidad, especificidad, precisión y puntuación F1, fueron evaluadas utilizando matrices de confusión generadas a partir de cada implementación. Los algoritmos de Aprendizaje Automático (ML) fueron entrenados y utilizados para identificar datos de exoplanetas. La mayoría de las investigaciones actuales tratan sobre algoritmos tradicionales de ML para este propósito. El algoritmo Ensemble es otro tipo de técnica de ML que combina el rendimiento de predicción de dos o más algoritmos para obtener una predicción final mejorada. Pocos estudios han aplicado algoritmos Ensemble para predecir exoplanetas. Hasta donde sabemos, no existe ningún documento que haya evaluado exclusivamente algoritmos Ensemble, resaltando una brecha significativa en la literatura sobre el potencial de los métodos Ensemble. Cinco algoritmos Ensemble fueron evaluados en este documento: Adaboost, Random Forest, Stacking, Random Subspace Method y Extremely Randomized Trees. Lograron un rendimiento promedio de más del 80% en todas las métricas. Los resultados subrayan los beneficios sustanciales de ajustar finamente los hiperparámetros para mejorar el rendimiento predictivo. El algoritmo Stacking logró un rendimiento más alto que los otros algoritmos. Este aspecto se discute en este documento. Los resultados de este trabajo muestran que vale la pena aumentar el uso de algoritmos Ensemble para mejorar la identificación de exoplanetas.
Descripción
Este documento presenta un procedimiento de evaluación integral para evaluar algoritmos de Aprendizaje Automático basados en Conjuntos en el contexto de la clasificación de exoplanetas. Cada uno de los valores de hiperparámetros del algoritmo fue ajustado. Las implementaciones se llevaron a cabo utilizando el método de validación cruzada. Las métricas de rendimiento, incluyendo precisión, sensibilidad, especificidad, precisión y puntuación F1, fueron evaluadas utilizando matrices de confusión generadas a partir de cada implementación. Los algoritmos de Aprendizaje Automático (ML) fueron entrenados y utilizados para identificar datos de exoplanetas. La mayoría de las investigaciones actuales tratan sobre algoritmos tradicionales de ML para este propósito. El algoritmo Ensemble es otro tipo de técnica de ML que combina el rendimiento de predicción de dos o más algoritmos para obtener una predicción final mejorada. Pocos estudios han aplicado algoritmos Ensemble para predecir exoplanetas. Hasta donde sabemos, no existe ningún documento que haya evaluado exclusivamente algoritmos Ensemble, resaltando una brecha significativa en la literatura sobre el potencial de los métodos Ensemble. Cinco algoritmos Ensemble fueron evaluados en este documento: Adaboost, Random Forest, Stacking, Random Subspace Method y Extremely Randomized Trees. Lograron un rendimiento promedio de más del 80% en todas las métricas. Los resultados subrayan los beneficios sustanciales de ajustar finamente los hiperparámetros para mejorar el rendimiento predictivo. El algoritmo Stacking logró un rendimiento más alto que los otros algoritmos. Este aspecto se discute en este documento. Los resultados de este trabajo muestran que vale la pena aumentar el uso de algoritmos Ensemble para mejorar la identificación de exoplanetas.