logo móvil
Contáctanos

Árboles de Decisión No Supervisados para Clustering Unimodal en Ejes

Autores: Chasani, Paraskevi; Likas, Aristidis

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Árboles de Decisión No Supervisados para Clustering Unimodal en Ejes


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

árboles de decisión
Soluciones de agrupamiento
DTAUC
Agrupamiento unimodal en ejes
Unimodalidad
árboles de decisión alineados con el eje

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El uso de árboles de decisión para obtener y representar soluciones de agrupamiento es ventajoso, debido a su propiedad de interpretabilidad. Proponemos un método llamado Árboles de Decisión para Agrupamiento Unimodal en Ejes (DTAUC), que construye árboles de decisión binarios no supervisados para el agrupamiento aprovechando el concepto de unimodalidad. La unimodalidad es una propiedad clave que indica el comportamiento de agrupamiento de los datos alrededor de un único modo de densidad. Nuestro enfoque se basa en la noción de un clúster unimodal en ejes: un clúster donde todas las características son unimodales, es decir, el conjunto de valores de cada característica es unimodal según lo decidido por una prueba de unimodalidad. El método propuesto sigue el paradigma típico de división de arriba hacia abajo para construir árboles de decisión alineados con los ejes y tiene como objetivo particionar el conjunto de datos inicial en clústeres unimodales en ejes aplicando umbrales en características multimodales. Para determinar la regla de decisión en cada nodo, proponemos un criterio que combina unimodalidad y separación. El método termina automáticamente cuando todos los clústeres son unimodales en ejes. A diferencia de los métodos típicos de árboles de decisión, DTAUC no requiere hiperparámetros definidos por el usuario, como la profundidad máxima del árbol o el número mínimo de puntos por hoja, excepto por el nivel de significancia de la prueba de unimodalidad. Los resultados experimentales comparativos en varios conjuntos de datos sintéticos y reales indican la efectividad de nuestro método.

Otros recursos que podrían interesarte

Temas Virtualpro