Paralelización del algoritmo Bison aplicado a la clasificación de datos
Autores: Ludwig, Simone A.; Al-Sawwa, Jamil; Misquith, Aaron Mackenzie
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Paralelización del algoritmo Bison aplicado a la clasificación de datos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Ciencia de datos
Aprendizaje automático
Algoritmos de clasificación
Escalabilidad
Eficiencia
Algoritmo Bison
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
En ciencia de datos y aprendizaje automático, los algoritmos eficientes y escalables son fundamentales para manejar conjuntos de datos grandes y tareas complejas. Los algoritmos de clasificación, en particular, desempeñan un papel crucial en una amplia gama de aplicaciones, desde el reconocimiento de imágenes y el procesamiento de lenguaje natural hasta la detección de fraudes y el diagnóstico médico. Los métodos de clasificación tradicionales, aunque efectivos, a menudo tienen dificultades con la escalabilidad y la eficiencia cuando se aplican a conjuntos de datos masivos. Este desafío ha impulsado el desarrollo de enfoques innovadores que aprovechan los marcos computacionales modernos y las capacidades de procesamiento paralelo. Este documento presenta el Algoritmo Bison, aplicado a problemas de clasificación. El algoritmo, inspirado en el comportamiento social de los bisontes, tiene como objetivo mejorar la precisión de las tareas de clasificación. El Algoritmo Bison se implementa utilizando PySpark, aprovechando la potencia de cómputo distribuido para manejar conjuntos de datos grandes de manera eficiente. Este estudio compara el rendimiento del Algoritmo Bison en varios tamaños de conjunto de datos utilizando la aceleración y la ampliación como medida de rendimiento.
Descripción
En ciencia de datos y aprendizaje automático, los algoritmos eficientes y escalables son fundamentales para manejar conjuntos de datos grandes y tareas complejas. Los algoritmos de clasificación, en particular, desempeñan un papel crucial en una amplia gama de aplicaciones, desde el reconocimiento de imágenes y el procesamiento de lenguaje natural hasta la detección de fraudes y el diagnóstico médico. Los métodos de clasificación tradicionales, aunque efectivos, a menudo tienen dificultades con la escalabilidad y la eficiencia cuando se aplican a conjuntos de datos masivos. Este desafío ha impulsado el desarrollo de enfoques innovadores que aprovechan los marcos computacionales modernos y las capacidades de procesamiento paralelo. Este documento presenta el Algoritmo Bison, aplicado a problemas de clasificación. El algoritmo, inspirado en el comportamiento social de los bisontes, tiene como objetivo mejorar la precisión de las tareas de clasificación. El Algoritmo Bison se implementa utilizando PySpark, aprovechando la potencia de cómputo distribuido para manejar conjuntos de datos grandes de manera eficiente. Este estudio compara el rendimiento del Algoritmo Bison en varios tamaños de conjunto de datos utilizando la aceleración y la ampliación como medida de rendimiento.