Clasificación de la importancia de variables en un análisis de frontera no paramétrico utilizando técnicas de aprendizaje automático no supervisado
Autores: Moragues, Raul; Aparicio, Juan; Esteve, Miriam
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Clasificación de la importancia de variables en un análisis de frontera no paramétrico utilizando técnicas de aprendizaje automático no supervisado
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Metodologías
Clasificación
Variables
Máquinas de vectores de soporte
Contexto de producción
Experimento computacional
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
En este documento, proponemos y comparamos nuevas metodologías para clasificar la importancia de las variables en procesos productivos a través de una adaptación de Máquinas de Vectores de Soporte de Clase Única. En particular, adaptamos dos metodologías inspiradas en la literatura de aprendizaje automático: una que implica la mezcla aleatoria de valores de una variable y otra que utiliza el valor objetivo de la formulación dual del modelo. Además, motivamos el uso de este tipo de algoritmos en el contexto de producción y comparamos su rendimiento a través de un experimento computacional. Observamos que la metodología basada en la mezcla de valores de una variable supera a la metodología basada en la formulación dual. Observamos que la metodología basada en la mezcla de valores clasifica correctamente las variables en el 94% de los escenarios con una entrada relevante y una entrada irrelevante. Además, clasifica correctamente cada variable en al menos el 65% de las replicaciones de un escenario con tres entradas relevantes y una entrada irrelevante.
Descripción
En este documento, proponemos y comparamos nuevas metodologías para clasificar la importancia de las variables en procesos productivos a través de una adaptación de Máquinas de Vectores de Soporte de Clase Única. En particular, adaptamos dos metodologías inspiradas en la literatura de aprendizaje automático: una que implica la mezcla aleatoria de valores de una variable y otra que utiliza el valor objetivo de la formulación dual del modelo. Además, motivamos el uso de este tipo de algoritmos en el contexto de producción y comparamos su rendimiento a través de un experimento computacional. Observamos que la metodología basada en la mezcla de valores de una variable supera a la metodología basada en la formulación dual. Observamos que la metodología basada en la mezcla de valores clasifica correctamente las variables en el 94% de los escenarios con una entrada relevante y una entrada irrelevante. Además, clasifica correctamente cada variable en al menos el 65% de las replicaciones de un escenario con tres entradas relevantes y una entrada irrelevante.