Árboles de Decisión No Supervisados para Clustering Unimodal en Ejes
Autores: Chasani, Paraskevi; Likas, Aristidis
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Árboles de Decisión No Supervisados para Clustering Unimodal en Ejes
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
árboles de decisión
Soluciones de agrupamiento
DTAUC
Agrupamiento unimodal en ejes
Unimodalidad
árboles de decisión alineados con el eje
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El uso de árboles de decisión para obtener y representar soluciones de agrupamiento es ventajoso, debido a su propiedad de interpretabilidad. Proponemos un método llamado Árboles de Decisión para Agrupamiento Unimodal en Ejes (DTAUC), que construye árboles de decisión binarios no supervisados para el agrupamiento aprovechando el concepto de unimodalidad. La unimodalidad es una propiedad clave que indica el comportamiento de agrupamiento de los datos alrededor de un único modo de densidad. Nuestro enfoque se basa en la noción de un clúster unimodal en ejes: un clúster donde todas las características son unimodales, es decir, el conjunto de valores de cada característica es unimodal según lo decidido por una prueba de unimodalidad. El método propuesto sigue el paradigma típico de división de arriba hacia abajo para construir árboles de decisión alineados con los ejes y tiene como objetivo particionar el conjunto de datos inicial en clústeres unimodales en ejes aplicando umbrales en características multimodales. Para determinar la regla de decisión en cada nodo, proponemos un criterio que combina unimodalidad y separación. El método termina automáticamente cuando todos los clústeres son unimodales en ejes. A diferencia de los métodos típicos de árboles de decisión, DTAUC no requiere hiperparámetros definidos por el usuario, como la profundidad máxima del árbol o el número mínimo de puntos por hoja, excepto por el nivel de significancia de la prueba de unimodalidad. Los resultados experimentales comparativos en varios conjuntos de datos sintéticos y reales indican la efectividad de nuestro método.
Descripción
El uso de árboles de decisión para obtener y representar soluciones de agrupamiento es ventajoso, debido a su propiedad de interpretabilidad. Proponemos un método llamado Árboles de Decisión para Agrupamiento Unimodal en Ejes (DTAUC), que construye árboles de decisión binarios no supervisados para el agrupamiento aprovechando el concepto de unimodalidad. La unimodalidad es una propiedad clave que indica el comportamiento de agrupamiento de los datos alrededor de un único modo de densidad. Nuestro enfoque se basa en la noción de un clúster unimodal en ejes: un clúster donde todas las características son unimodales, es decir, el conjunto de valores de cada característica es unimodal según lo decidido por una prueba de unimodalidad. El método propuesto sigue el paradigma típico de división de arriba hacia abajo para construir árboles de decisión alineados con los ejes y tiene como objetivo particionar el conjunto de datos inicial en clústeres unimodales en ejes aplicando umbrales en características multimodales. Para determinar la regla de decisión en cada nodo, proponemos un criterio que combina unimodalidad y separación. El método termina automáticamente cuando todos los clústeres son unimodales en ejes. A diferencia de los métodos típicos de árboles de decisión, DTAUC no requiere hiperparámetros definidos por el usuario, como la profundidad máxima del árbol o el número mínimo de puntos por hoja, excepto por el nivel de significancia de la prueba de unimodalidad. Los resultados experimentales comparativos en varios conjuntos de datos sintéticos y reales indican la efectividad de nuestro método.