EvoPreprocess: marco de preprocesamiento de datos con algoritmos de optimización inspirados en la naturaleza
Autores: Karakati, Sao
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
EvoPreprocess: marco de preprocesamiento de datos con algoritmos de optimización inspirados en la naturaleza
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Modelos de aprendizaje automático
Preparación de datos
Preprocesamiento
Métodos metaheurísticos
Marco de trabajo EvoPreprocess
Algoritmos de optimización inspirados en la naturaleza
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La calidad de los modelos de aprendizaje automático puede verse afectada cuando se utilizan datos inapropiados, lo cual es especialmente común en conjuntos de datos de alta dimensionalidad y desequilibrados. La preparación y preprocesamiento de datos pueden mitigar algunos problemas y, por lo tanto, resultar en mejores modelos. El uso de métodos metaheurísticos e inspirados en la naturaleza para el preprocesamiento de datos se ha vuelto común, pero estos enfoques aún no están fácilmente disponibles para los profesionales con una interfaz de programación de aplicaciones (API) simple y extensible. En este documento se presenta el marco de trabajo de código abierto EvoPreprocess en Python, que preprocesa datos con el uso de algoritmos de optimización evolutiva e inspirados en la naturaleza. Los principales problemas abordados por el marco de trabajo son (muestreo excesivo y deficiente de instancias de datos simultáneamente), y para problemas de aprendizaje automático supervisado. El marco de trabajo de EvoPreprocess proporciona una API simple orientada a objetos y paralela de las tareas de preprocesamiento y puede utilizarse con las bibliotecas de aprendizaje automático en Python scikit-learn e imbalanced-learn. El marco de trabajo utiliza algoritmos metaheurísticos bien conocidos inspirados en la naturaleza autoadaptativos y puede ampliarse fácilmente con estrategias de optimización y evaluación personalizadas. El documento presenta la arquitectura del marco de trabajo, su uso, resultados de experimentos y comparación con otros enfoques comunes de preprocesamiento.
Descripción
La calidad de los modelos de aprendizaje automático puede verse afectada cuando se utilizan datos inapropiados, lo cual es especialmente común en conjuntos de datos de alta dimensionalidad y desequilibrados. La preparación y preprocesamiento de datos pueden mitigar algunos problemas y, por lo tanto, resultar en mejores modelos. El uso de métodos metaheurísticos e inspirados en la naturaleza para el preprocesamiento de datos se ha vuelto común, pero estos enfoques aún no están fácilmente disponibles para los profesionales con una interfaz de programación de aplicaciones (API) simple y extensible. En este documento se presenta el marco de trabajo de código abierto EvoPreprocess en Python, que preprocesa datos con el uso de algoritmos de optimización evolutiva e inspirados en la naturaleza. Los principales problemas abordados por el marco de trabajo son (muestreo excesivo y deficiente de instancias de datos simultáneamente), y para problemas de aprendizaje automático supervisado. El marco de trabajo de EvoPreprocess proporciona una API simple orientada a objetos y paralela de las tareas de preprocesamiento y puede utilizarse con las bibliotecas de aprendizaje automático en Python scikit-learn e imbalanced-learn. El marco de trabajo utiliza algoritmos metaheurísticos bien conocidos inspirados en la naturaleza autoadaptativos y puede ampliarse fácilmente con estrategias de optimización y evaluación personalizadas. El documento presenta la arquitectura del marco de trabajo, su uso, resultados de experimentos y comparación con otros enfoques comunes de preprocesamiento.