Modelo integrado de selección y escalabilidad en análisis de datos funcionales a través del aprendizaje bayesiano
Autores: Tao, Wenzheng; Joshi, Sarang; Whitaker, Ross
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Modelo integrado de selección y escalabilidad en análisis de datos funcionales a través del aprendizaje bayesiano
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Datos funcionales
Estructuras de covarianza
Marco bayesiano
Priori disperso
Selección de dimensionalidad
Solución escalable
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Los datos funcionales, que incluyen curvas unidimensionales y superficies de dimensiones superiores, se han vuelto cada vez más prominentes en diversas disciplinas científicas. Ofrecen una perspectiva continua que captura dinámicas sutiles y estructuras más ricas en comparación con representaciones discretas, preservando así información esencial y facilitando la modelización más natural de fenómenos del mundo real, especialmente en entornos de muestreo disperso o irregular. Un desafío clave radica en identificar representaciones de baja dimensión y estimar estructuras de covarianza que capturen de manera efectiva las estadísticas de la población. Proponemos un novedoso marco bayesiano con una expansión de kernel no paramétrica y una prioridad escasa, que permite la modelización directa de datos medidos y evita los sesgos artificiales de la rejerarquización. Nuestro método, Análisis Bayesiano de Datos Funcionales Escalables (BSFDA), selecciona automáticamente tanto las dimensionalidades de subespacio como las funciones de base, reduciendo la sobrecarga computacional a través de una estrategia eficiente de optimización variacional. Además, proponemos una variante aproximada más rápida que mantiene una precisión comparable pero acelera significativamente los cálculos en conjuntos de datos a gran escala. Estudios de simulación exhaustivos demuestran que nuestro marco supera a las técnicas convencionales en la estimación de covarianza y la selección de dimensionalidad, mostrando resistencia a la alta dimensionalidad y al muestreo irregular. La metodología propuesta resulta efectiva para datos funcionales multidimensionales y muestra una aplicabilidad práctica en conjuntos de datos biomédicos y meteorológicos. En general, BSFDA ofrece una solución adaptativa, continua y escalable para el análisis moderno de datos funcionales en diversos ámbitos científicos.
Descripción
Los datos funcionales, que incluyen curvas unidimensionales y superficies de dimensiones superiores, se han vuelto cada vez más prominentes en diversas disciplinas científicas. Ofrecen una perspectiva continua que captura dinámicas sutiles y estructuras más ricas en comparación con representaciones discretas, preservando así información esencial y facilitando la modelización más natural de fenómenos del mundo real, especialmente en entornos de muestreo disperso o irregular. Un desafío clave radica en identificar representaciones de baja dimensión y estimar estructuras de covarianza que capturen de manera efectiva las estadísticas de la población. Proponemos un novedoso marco bayesiano con una expansión de kernel no paramétrica y una prioridad escasa, que permite la modelización directa de datos medidos y evita los sesgos artificiales de la rejerarquización. Nuestro método, Análisis Bayesiano de Datos Funcionales Escalables (BSFDA), selecciona automáticamente tanto las dimensionalidades de subespacio como las funciones de base, reduciendo la sobrecarga computacional a través de una estrategia eficiente de optimización variacional. Además, proponemos una variante aproximada más rápida que mantiene una precisión comparable pero acelera significativamente los cálculos en conjuntos de datos a gran escala. Estudios de simulación exhaustivos demuestran que nuestro marco supera a las técnicas convencionales en la estimación de covarianza y la selección de dimensionalidad, mostrando resistencia a la alta dimensionalidad y al muestreo irregular. La metodología propuesta resulta efectiva para datos funcionales multidimensionales y muestra una aplicabilidad práctica en conjuntos de datos biomédicos y meteorológicos. En general, BSFDA ofrece una solución adaptativa, continua y escalable para el análisis moderno de datos funcionales en diversos ámbitos científicos.