Selección de variables para agrupación significativa de datos territoriales multitópicos
Autores: Angerri, Xavier; Gibert, Karina
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Selección de variables para agrupación significativa de datos territoriales multitópicos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Propone
Metodología
Agrupación
Variables
Cohesión territorial
TFSM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Este documento propone una nueva metodología para mejorar la cohesión territorial en procesos de agrupamiento donde se consideran muchas variables de diferentes temas. Las técnicas de agrupamiento aportan valor añadido para identificar tipologías, pero aún existen desafíos no resueltos cuando los datos contienen un número desequilibrado de variables de diferentes temas. El método de selección de características territoriales (TFSM) se presenta como un método para seleccionar la variable representativa de cada tema de manera que se preserve la interpretabilidad de los grupos resultantes y se mejore la cohesión geográfica con respecto a enfoques clásicos. Este documento también introduce el termómetro como una nueva herramienta de adquisición de conocimientos que permite a los expertos transferir semántica al proceso de minería de datos. TFSM propone el índice de explicabilidad potencial () como criterio para seleccionar las variables más prometedoras para el agrupamiento. se basa en la combinación de pruebas inferenciales y métricas como el soporte. La propuesta se aplica con la base de datos INSESS-COVID19, donde se encontraron grupos territoriales de poblaciones vulnerables. Se utiliza un conjunto de 195 variables con 21 bloques temáticos desequilibrados para comparar los resultados con un análisis de agrupamiento multivista tradicional con resultados prometedores desde el punto de vista geográfico y temático, y la capacidad de respaldar la toma de decisiones futuras.
Descripción
Este documento propone una nueva metodología para mejorar la cohesión territorial en procesos de agrupamiento donde se consideran muchas variables de diferentes temas. Las técnicas de agrupamiento aportan valor añadido para identificar tipologías, pero aún existen desafíos no resueltos cuando los datos contienen un número desequilibrado de variables de diferentes temas. El método de selección de características territoriales (TFSM) se presenta como un método para seleccionar la variable representativa de cada tema de manera que se preserve la interpretabilidad de los grupos resultantes y se mejore la cohesión geográfica con respecto a enfoques clásicos. Este documento también introduce el termómetro como una nueva herramienta de adquisición de conocimientos que permite a los expertos transferir semántica al proceso de minería de datos. TFSM propone el índice de explicabilidad potencial () como criterio para seleccionar las variables más prometedoras para el agrupamiento. se basa en la combinación de pruebas inferenciales y métricas como el soporte. La propuesta se aplica con la base de datos INSESS-COVID19, donde se encontraron grupos territoriales de poblaciones vulnerables. Se utiliza un conjunto de 195 variables con 21 bloques temáticos desequilibrados para comparar los resultados con un análisis de agrupamiento multivista tradicional con resultados prometedores desde el punto de vista geográfico y temático, y la capacidad de respaldar la toma de decisiones futuras.