Criterios de Información Normalizados y Selección de Modelo en Presencia de Datos Perdidos
Autores: Cohen, Nitzan; Berchenko, Yakir
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Criterios de Información Normalizados y Selección de Modelo en Presencia de Datos Perdidos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Criterios de información
Selección de modelos
Datos faltantes
Normalización
Tamaños de muestra
Complejidad computacional
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
Los criterios de información como el criterio de información de Akaike (AIC) y el criterio de información bayesiano (BIC) se utilizan comúnmente para la selección de modelos. Sin embargo, la teoría actual no respalda los datos no convencionales, por lo que el uso ingenuo de estos criterios no es adecuado para datos con valores faltantes. La imputación, en el núcleo de la mayoría de los métodos alternativos, es tanto distorsionada como computacionalmente exigente. Proponemos un nuevo enfoque que permite el uso de los clásicos y conocidos criterios de información para la selección de modelos cuando hay datos faltantes. Adaptamos la teoría actual de los criterios de información a través de la normalización, teniendo en cuenta los diferentes tamaños de muestra utilizados para cada modelo candidato (centrándonos en el AIC y el BIC). Interesantemente, cuando los tamaños de muestra son diferentes, nuestro análisis teórico encuentra que es la corrección adecuada para la que necesitamos optimizar (donde es el tamaño de muestra disponible para el modelo) mientras que es la corrección del BIC. Además, encontramos que la complejidad computacional de los métodos de criterios de información normalizados es exponencialmente mejor que la de los métodos de imputación. En una serie de estudios de simulación, encontramos que el AIC normalizado y el BIC normalizado superan a los métodos anteriores (es decir, el AIC normalizado es más eficiente y el BIC normalizado incluye solo variables importantes, aunque tiende a excluir algunas de ellas en casos de correlación grande). Proponemos tres métodos adicionales destinados a aumentar la eficiencia estadística del AIC normalizado: , , y . Este último tiene éxito en aumentar la eficiencia aún más.
Descripción
Los criterios de información como el criterio de información de Akaike (AIC) y el criterio de información bayesiano (BIC) se utilizan comúnmente para la selección de modelos. Sin embargo, la teoría actual no respalda los datos no convencionales, por lo que el uso ingenuo de estos criterios no es adecuado para datos con valores faltantes. La imputación, en el núcleo de la mayoría de los métodos alternativos, es tanto distorsionada como computacionalmente exigente. Proponemos un nuevo enfoque que permite el uso de los clásicos y conocidos criterios de información para la selección de modelos cuando hay datos faltantes. Adaptamos la teoría actual de los criterios de información a través de la normalización, teniendo en cuenta los diferentes tamaños de muestra utilizados para cada modelo candidato (centrándonos en el AIC y el BIC). Interesantemente, cuando los tamaños de muestra son diferentes, nuestro análisis teórico encuentra que es la corrección adecuada para la que necesitamos optimizar (donde es el tamaño de muestra disponible para el modelo) mientras que es la corrección del BIC. Además, encontramos que la complejidad computacional de los métodos de criterios de información normalizados es exponencialmente mejor que la de los métodos de imputación. En una serie de estudios de simulación, encontramos que el AIC normalizado y el BIC normalizado superan a los métodos anteriores (es decir, el AIC normalizado es más eficiente y el BIC normalizado incluye solo variables importantes, aunque tiende a excluir algunas de ellas en casos de correlación grande). Proponemos tres métodos adicionales destinados a aumentar la eficiencia estadística del AIC normalizado: , , y . Este último tiene éxito en aumentar la eficiencia aún más.