logo móvil
Contáctanos

EvoPreprocess: marco de preprocesamiento de datos con algoritmos de optimización inspirados en la naturaleza

Autores: Karakati, Sao

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

EvoPreprocess: marco de preprocesamiento de datos con algoritmos de optimización inspirados en la naturaleza


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Modelos de aprendizaje automático
Preparación de datos
Preprocesamiento
Métodos metaheurísticos
Marco de trabajo EvoPreprocess
Algoritmos de optimización inspirados en la naturaleza

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 28

Citaciones: Sin citaciones


Descripción
La calidad de los modelos de aprendizaje automático puede verse afectada cuando se utilizan datos inapropiados, lo cual es especialmente común en conjuntos de datos de alta dimensionalidad y desequilibrados. La preparación y preprocesamiento de datos pueden mitigar algunos problemas y, por lo tanto, resultar en mejores modelos. El uso de métodos metaheurísticos e inspirados en la naturaleza para el preprocesamiento de datos se ha vuelto común, pero estos enfoques aún no están fácilmente disponibles para los profesionales con una interfaz de programación de aplicaciones (API) simple y extensible. En este documento se presenta el marco de trabajo de código abierto EvoPreprocess en Python, que preprocesa datos con el uso de algoritmos de optimización evolutiva e inspirados en la naturaleza. Los principales problemas abordados por el marco de trabajo son (muestreo excesivo y deficiente de instancias de datos simultáneamente), y para problemas de aprendizaje automático supervisado. El marco de trabajo de EvoPreprocess proporciona una API simple orientada a objetos y paralela de las tareas de preprocesamiento y puede utilizarse con las bibliotecas de aprendizaje automático en Python scikit-learn e imbalanced-learn. El marco de trabajo utiliza algoritmos metaheurísticos bien conocidos inspirados en la naturaleza autoadaptativos y puede ampliarse fácilmente con estrategias de optimización y evaluación personalizadas. El documento presenta la arquitectura del marco de trabajo, su uso, resultados de experimentos y comparación con otros enfoques comunes de preprocesamiento.

Otros recursos que podrían interesarte

Temas Virtualpro