Un metaheurístico inteligente de optimización binaria basado en palomas para selección de características y clasificación de Big Data en un entorno MapReduce
Autores: Abukhodair, Felwa; Alsaggaf, Wafaa; Jamal, Amani Tariq; Abdel-Khalek, Sayed; Mansour, Romany F.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un metaheurístico inteligente de optimización binaria basado en palomas para selección de características y clasificación de Big Data en un entorno MapReduce
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Grandes datos
Selección de características
Técnica MOBDC-MR
Optimización
Clasificación
MapReduce
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Los grandes datos son altamente efectivos para extraer y analizar sistemáticamente datos masivos. Puede ser útil para gestionar datos de manera competente sobre los enfoques convencionales de manejo de datos. Recientemente, se han desarrollado varios esquemas para manejar grandes conjuntos de datos con varias características. Al mismo tiempo, las metodologías de selección de características (FS) tienen la intención de eliminar características repetitivas, ruidosas y no deseadas que degradan los resultados del clasificador. Dado que los métodos convencionales han fallado en lograr escalabilidad bajo datos masivos, el diseño de nuevos modelos de clasificación de Big Data es esencial. En este aspecto, este estudio se centra en el diseño de optimización metaheurística basada en clasificación de grandes datos en un entorno de MapReduce (MOBDC-MR). La técnica MOBDC-MR tiene como objetivo elegir características óptimas y clasificar eficazmente grandes datos. Además, la técnica MOBDC-MR implica el diseño de una técnica de selección de características basada en el algoritmo de optimización de palomas binario (BPOA) para reducir la complejidad y aumentar la precisión. La búsqueda de antenas de escarabajo (BAS) con el modelo de memoria a corto y largo plazo (LSTM) se emplea para la clasificación de grandes datos. La técnica MOBDC-MR presentada se ha realizado en Hadoop con el modelo de programación MapReduce. El rendimiento efectivo de la técnica MOBDC-MR se validó utilizando un conjunto de datos de referencia y los resultados se investigaron bajo varias medidas. La técnica MOBDC-MR demostró un rendimiento prometedor sobre las otras técnicas existentes bajo diferentes dimensiones.
Descripción
Los grandes datos son altamente efectivos para extraer y analizar sistemáticamente datos masivos. Puede ser útil para gestionar datos de manera competente sobre los enfoques convencionales de manejo de datos. Recientemente, se han desarrollado varios esquemas para manejar grandes conjuntos de datos con varias características. Al mismo tiempo, las metodologías de selección de características (FS) tienen la intención de eliminar características repetitivas, ruidosas y no deseadas que degradan los resultados del clasificador. Dado que los métodos convencionales han fallado en lograr escalabilidad bajo datos masivos, el diseño de nuevos modelos de clasificación de Big Data es esencial. En este aspecto, este estudio se centra en el diseño de optimización metaheurística basada en clasificación de grandes datos en un entorno de MapReduce (MOBDC-MR). La técnica MOBDC-MR tiene como objetivo elegir características óptimas y clasificar eficazmente grandes datos. Además, la técnica MOBDC-MR implica el diseño de una técnica de selección de características basada en el algoritmo de optimización de palomas binario (BPOA) para reducir la complejidad y aumentar la precisión. La búsqueda de antenas de escarabajo (BAS) con el modelo de memoria a corto y largo plazo (LSTM) se emplea para la clasificación de grandes datos. La técnica MOBDC-MR presentada se ha realizado en Hadoop con el modelo de programación MapReduce. El rendimiento efectivo de la técnica MOBDC-MR se validó utilizando un conjunto de datos de referencia y los resultados se investigaron bajo varias medidas. La técnica MOBDC-MR demostró un rendimiento prometedor sobre las otras técnicas existentes bajo diferentes dimensiones.