logo móvil
Contáctanos

Manejo de conjuntos de datos asimétricos superpuestos: un enfoque de penalización doble con P-spline

Autores: McTeer, Matthew; Henderson, Robin; Anstee, Quentin M.; Missier, Paolo

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Manejo de conjuntos de datos asimétricos superpuestos: un enfoque de penalización doble con P-spline


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Grupo de cohortes
Penalizado p-spline
Ajuste del modelo
Conjuntos de datos
Imputación de datos faltantes
Riesgo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 30

Citaciones: Sin citaciones


Descripción
Los conjuntos de datos asimétricos superpuestos son aquellos en los que una gran cohorte de observaciones tiene una pequeña cantidad de información registrada, y dentro de este grupo existe una cohorte más pequeña que tiene disponible información adicional extensa. La imputación de datos faltantes no es prudente si el tamaño de la cohorte difiere sustancialmente; por lo tanto, nuestro objetivo es desarrollar una forma de modelar la cohorte más pequeña considerando al mismo tiempo la más grande. Mediante la consideración de aproximaciones de P-Spline penalizadas tradicionalmente una vez, creamos un segundo término de penalización al observar discrepancias en el valor marginal de covariables que existen en ambas cohortes. Nuestro P-Spline ahora penalizado dos veces está diseñado para prevenir en primer lugar el sobreajuste/subajuste de la cohorte más pequeña y en segundo lugar considerar la cohorte más grande. A través de una serie de simulaciones de datos, ajustes de parámetros de penalización y adaptaciones de modelos, nuestro modelo penalizado dos veces ofrece hasta un 58% y un 46% de mejora en el ajuste del modelo sobre una respuesta continua y binaria, respectivamente, en comparación con los métodos existentes de B-Spline y P-Spline penalizado una vez. Aplicando nuestro modelo al riesgo de un individuo de desarrollar esteatohepatitis, informamos una mejora de más del 65% sobre los métodos existentes. Proponemos un método de P-Spline penalizado dos veces que puede mejorar significativamente el ajuste del modelo de conjuntos de datos asimétricos superpuestos sobre un punto final predictivo común, sin necesidad de imputación de datos faltantes.

Otros recursos que podrían interesarte

Temas Virtualpro