Manejo de conjuntos de datos asimétricos superpuestos: un enfoque de penalización doble con P-spline

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Manejo de conjuntos de datos asimétricos superpuestos: un enfoque de penalización doble con P-spline

Autores: McTeer, Matthew; Henderson, Robin; Anstee, Quentin M.; Missier, Paolo

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Manejo de conjuntos de datos asimétricos superpuestos: un enfoque de penalización doble con P-spline

Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Grupo de cohortes

Penalizado p-spline

Ajuste del modelo

Conjuntos de datos

Imputación de datos faltantes

Riesgo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 30

Citaciones: Sin citaciones

Los conjuntos de datos asimétricos superpuestos son aquellos en los que una gran cohorte de observaciones tiene una pequeña cantidad de información registrada, y dentro de este grupo existe una cohorte más pequeña que tiene disponible información adicional extensa. La imputación de datos faltantes no es prudente si el tamaño de la cohorte difiere sustancialmente; por lo tanto, nuestro objetivo es desarrollar una forma de modelar la cohorte más pequeña considerando al mismo tiempo la más grande. Mediante la consideración de aproximaciones de P-Spline penalizadas tradicionalmente una vez, creamos un segundo término de penalización al observar discrepancias en el valor marginal de covariables que existen en ambas cohortes. Nuestro P-Spline ahora penalizado dos veces está diseñado para prevenir en primer lugar el sobreajuste/subajuste de la cohorte más pequeña y en segundo lugar considerar la cohorte más grande. A través de una serie de simulaciones de datos, ajustes de parámetros de penalización y adaptaciones de modelos, nuestro modelo penalizado dos veces ofrece hasta un 58% y un 46% de mejora en el ajuste del modelo sobre una respuesta continua y binaria, respectivamente, en comparación con los métodos existentes de B-Spline y P-Spline penalizado una vez. Aplicando nuestro modelo al riesgo de un individuo de desarrollar esteatohepatitis, informamos una mejora de más del 65% sobre los métodos existentes. Proponemos un método de P-Spline penalizado dos veces que puede mejorar significativamente el ajuste del modelo de conjuntos de datos asimétricos superpuestos sobre un punto final predictivo común, sin necesidad de imputación de datos faltantes.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro