logo móvil
Contáctanos

Análisis Comparativo de Técnicas de Agrupamiento Tradicionales y Avanzadas en Datos de Bioaerosoles: Evaluando la Eficacia de K-Means, HCA y GenieClust con y sin Integración de Autoencoders

Autores: Moss, Maxamillian A. N.; Hughes, Dagen D.; Crawford, Ian; Gallagher, Martin W.; Flynn, Michael J.; Topping, David O.

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Análisis Comparativo de Técnicas de Agrupamiento Tradicionales y Avanzadas en Datos de Bioaerosoles: Evaluando la Eficacia de K-Means, HCA y GenieClust con y sin Integración de Autoencoders


Categoría

Ciencias Naturales y Subdisciplinas

Subcategoría

Astronomía

Palabras clave

Estudio
Técnicas de agrupamiento
K-means
Algoritmo de agrupamiento jerárquico
GenieClust
Autoencoder

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 8

Citaciones: Sin citaciones


Descripción
En un estudio comparativo que contrasta las técnicas de agrupamiento nuevas y tradicionales, se examinaron las capacidades de K-means, el algoritmo de agrupamiento jerárquico (HCA) y GenieClust. Tanto K-means como HCA demostraron una fuerte consistencia en los perfiles y tamaños de los clústeres, enfatizando su efectividad en la diferenciación de tipos de partículas y confirmando que los patrones fundamentales dentro de los datos se capturaron de manera confiable. Una dimensión adicional del estudio fue la integración de un autoencoder (AE). Cuando se combinó con K-means, el AE mejoró la detección de valores atípicos, particularmente en la identificación de las cargas composicionales de cada clúster. Por el contrario, aunque la aplicación del AE a todos los métodos reveló un potencial para la reducción de ruido al eliminar partículas más grandes e infrecuentes, en el caso de HCA, esta distorsión de la información durante el proceso de codificación pudo haber afectado los resultados del agrupamiento al reducir el número de clústeres observablemente distintos. Los hallazgos de este estudio indican que GenieClust, cuando se aplica tanto con como sin un AE, fue efectivo en delinear un número notable de clústeres distintos. Además, las cargas composicionales de cada clúster exhibieron una mayor variabilidad interna, distinguiendo hasta 3 veces más tipos de partículas por clúster en comparación con los métodos tradicionales, subrayando así la capacidad de los algoritmos para diferenciar patrones sutiles en los datos. El trabajo aquí postula que la aplicación de GenieClust tanto con como sin un AE puede proporcionar información importante a través de la detección inicial de valores atípicos y una especiación enriquecida con un AE aplicado, evidenciada por un mayor número de clústeres distintos dentro del cuerpo principal de los datos.

Otros recursos que podrían interesarte

Temas Virtualpro