Reduciendo incertidumbre y aumentando confianza en el aprendizaje no supervisado
Autores: Christakis, Nicholas; Drikakis, Dimitris
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Reduciendo incertidumbre y aumentando confianza en el aprendizaje no supervisado
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Algoritmo
Aprendizaje no supervisado
RUN-ICON
Agrupamiento
Confiabilidad
Confianza
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 41
Citaciones: Sin citaciones
Este documento presenta el desarrollo de un nuevo algoritmo para el aprendizaje no supervisado llamado RUN-ICON (Reducir Incertidumbre y Aumentar Confianza). El objetivo principal del algoritmo es mejorar la fiabilidad y confianza del agrupamiento no supervisado. RUN-ICON aprovecha el método K-means++ para identificar los centros dominantes que ocurren con más frecuencia a través de múltiples repeticiones. Se distingue de las variantes existentes de K-means al introducir métricas novedosas, como el Índice de Dominancia de Agrupamiento e Incertidumbre, en lugar de depender únicamente de la Suma de Errores al Cuadrado, para identificar los clústeres más dominantes. El algoritmo exhibe características notables como robustez, agrupamiento de alta calidad, automatización y flexibilidad. Pruebas extensas en conjuntos de datos diversos con características variables demuestran su capacidad para determinar el número óptimo de clústeres bajo diferentes escenarios. El algoritmo pronto se implementará en escenarios del mundo real, donde se someterá a pruebas rigurosas contra conjuntos de datos basados en mediciones y simulaciones, demostrando aún más su efectividad.
Descripción
Este documento presenta el desarrollo de un nuevo algoritmo para el aprendizaje no supervisado llamado RUN-ICON (Reducir Incertidumbre y Aumentar Confianza). El objetivo principal del algoritmo es mejorar la fiabilidad y confianza del agrupamiento no supervisado. RUN-ICON aprovecha el método K-means++ para identificar los centros dominantes que ocurren con más frecuencia a través de múltiples repeticiones. Se distingue de las variantes existentes de K-means al introducir métricas novedosas, como el Índice de Dominancia de Agrupamiento e Incertidumbre, en lugar de depender únicamente de la Suma de Errores al Cuadrado, para identificar los clústeres más dominantes. El algoritmo exhibe características notables como robustez, agrupamiento de alta calidad, automatización y flexibilidad. Pruebas extensas en conjuntos de datos diversos con características variables demuestran su capacidad para determinar el número óptimo de clústeres bajo diferentes escenarios. El algoritmo pronto se implementará en escenarios del mundo real, donde se someterá a pruebas rigurosas contra conjuntos de datos basados en mediciones y simulaciones, demostrando aún más su efectividad.