El método de Adaptive Lasso y Elastic Net de orden superior para clasificación en datos de alta dimensionalidad
Autores: Araveeporn, Autcha
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
El método de Adaptive Lasso y Elastic Net de orden superior para clasificación en datos de alta dimensionalidad
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Lasso
Red elástica
Lasso adaptativo
Red elástica adaptativa
Clasificación
Regresión logística.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 61
Citaciones: Sin citaciones
Los métodos de lazo y red elástica son técnicas populares para la estimación de parámetros y selección de variables. Además, los métodos de lazo adaptativo y red elástica utilizan pesos adaptativos en la función de penalización basados en las estimaciones de lazo y red elástica. El peso adaptativo está relacionado con el orden de potencia del estimador. Normalmente, estos métodos se centran en estimar parámetros en términos de modelos de regresión lineal que se basan en la variable dependiente y la variable independiente como una escala continua. En este artículo, comparamos los métodos de lazo y red elástica y el orden superior de los métodos de lazo adaptativo y red elástica adaptativa para la clasificación en datos de alta dimensionalidad. La clasificación se utiliza para clasificar los datos categóricos para la variable dependiente dependiente de las variables independientes, lo que se llama modelo de regresión logística. Los datos categóricos se consideran una variable binaria, y las variables independientes se utilizan como variable continua. Los datos de alta dimensionalidad se representan cuando el número de variables independientes es mayor que el tamaño de la muestra. Para esta investigación, la simulación de la regresión logística se considera como la variable dependiente binaria y 20, 30, 40 y 50 como las variables independientes cuando los tamaños de muestra son menores que el número de variables independientes. Las variables independientes se generan a partir de una distribución normal en varias varianzas, y las variables dependientes se obtienen a partir de la probabilidad de la función logit y se transforman para predecir los datos binarios. Para la aplicación en datos reales, expresamos la clasificación del tipo de leucemia como las variables dependientes y el subconjunto de expresión génica como las variables independientes. El criterio de estos métodos es comparar por el porcentaje promedio de valor de precisión predicho. Los resultados muestran que el método de lazo adaptativo de orden superior está satisfecho con una gran dispersión, pero el método de red elástica adaptativa de orden superior supera en dispersión pequeña.
Descripción
Los métodos de lazo y red elástica son técnicas populares para la estimación de parámetros y selección de variables. Además, los métodos de lazo adaptativo y red elástica utilizan pesos adaptativos en la función de penalización basados en las estimaciones de lazo y red elástica. El peso adaptativo está relacionado con el orden de potencia del estimador. Normalmente, estos métodos se centran en estimar parámetros en términos de modelos de regresión lineal que se basan en la variable dependiente y la variable independiente como una escala continua. En este artículo, comparamos los métodos de lazo y red elástica y el orden superior de los métodos de lazo adaptativo y red elástica adaptativa para la clasificación en datos de alta dimensionalidad. La clasificación se utiliza para clasificar los datos categóricos para la variable dependiente dependiente de las variables independientes, lo que se llama modelo de regresión logística. Los datos categóricos se consideran una variable binaria, y las variables independientes se utilizan como variable continua. Los datos de alta dimensionalidad se representan cuando el número de variables independientes es mayor que el tamaño de la muestra. Para esta investigación, la simulación de la regresión logística se considera como la variable dependiente binaria y 20, 30, 40 y 50 como las variables independientes cuando los tamaños de muestra son menores que el número de variables independientes. Las variables independientes se generan a partir de una distribución normal en varias varianzas, y las variables dependientes se obtienen a partir de la probabilidad de la función logit y se transforman para predecir los datos binarios. Para la aplicación en datos reales, expresamos la clasificación del tipo de leucemia como las variables dependientes y el subconjunto de expresión génica como las variables independientes. El criterio de estos métodos es comparar por el porcentaje promedio de valor de precisión predicho. Los resultados muestran que el método de lazo adaptativo de orden superior está satisfecho con una gran dispersión, pero el método de red elástica adaptativa de orden superior supera en dispersión pequeña.