Resultados asintóticos para la estimación de la puntuación cuadrática de un agrupamiento
Autores: Coraggio, Luca; Coretto, Pietro
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Resultados asintóticos para la estimación de la puntuación cuadrática de un agrupamiento
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Análisis de agrupamiento
Particiones
Métodos de agrupamiento
Hiperparámetros
Selección de clústeres
Puntuación Cuadrática Bootstrap
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
En el análisis de conglomerados a menudo se encuentran varias particiones de un conjunto de datos utilizando diferentes métodos de agrupamiento y algoritmos configurados con una variedad de hiperparámetros y ajustes. El número de conglomerados es uno de los hiperparámetros más relevantes. La selección de conglomerados es la tarea de elegir las particiones deseadas. El Bootstrap Quadratic Scoring es un método introducido recientemente donde la selección de conglomerados se realiza optimizando una puntuación asignada a una partición basada en la función discriminante cuadrática. Anteriormente, propusimos la estimación de esta puntuación de conglomerado a través del remuestreo bootstrap e investigamos el estimador propuesto basado en experimentos numéricos y aplicaciones de datos reales. Sin embargo, ese trabajo anterior no proporcionó garantías teóricas. En este documento, llenamos ese vacío. Estudiamos el comportamiento asintótico del método de puntuación y mostramos que el estimador propuesto converge a contrapartes poblacionales bien definidas.
Descripción
En el análisis de conglomerados a menudo se encuentran varias particiones de un conjunto de datos utilizando diferentes métodos de agrupamiento y algoritmos configurados con una variedad de hiperparámetros y ajustes. El número de conglomerados es uno de los hiperparámetros más relevantes. La selección de conglomerados es la tarea de elegir las particiones deseadas. El Bootstrap Quadratic Scoring es un método introducido recientemente donde la selección de conglomerados se realiza optimizando una puntuación asignada a una partición basada en la función discriminante cuadrática. Anteriormente, propusimos la estimación de esta puntuación de conglomerado a través del remuestreo bootstrap e investigamos el estimador propuesto basado en experimentos numéricos y aplicaciones de datos reales. Sin embargo, ese trabajo anterior no proporcionó garantías teóricas. En este documento, llenamos ese vacío. Estudiamos el comportamiento asintótico del método de puntuación y mostramos que el estimador propuesto converge a contrapartes poblacionales bien definidas.