Selección automatizada del modelo de dos capas de mezclas de regresiones funcionales de procesos gaussianos para agrupación y predicción de curvas
Autores: Gong, Chengxin; Ma, Jinwen
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Selección automatizada del modelo de dos capas de mezclas de regresiones funcionales de procesos gaussianos para agrupación y predicción de curvas
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Modelo
Análisis de agrupamiento de curvas
Proceso gaussiano
TMGPFR
Número de agrupaciones
Selección de modelo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Como un modelo de aprendizaje estadístico razonable para el análisis de agrupación de curvas, se ha desarrollado el modelo de dos capas de mezclas de regresiones funcionales de procesos gaussianos (TMGPFR) para ajustarse a los datos de curvas de muestra de una serie de fuentes de información independientes o procesos estocásticos. Dado que las curvas de muestra de cierto proceso estocástico forman naturalmente un grupo de curvas, la selección del modelo de TMGPFR, es decir, la selección del número de mezclas de regresiones funcionales de procesos gaussianos (MGPFRs) en la capa superior, corresponde al descubrimiento del número de grupos y la estructura de los datos de las curvas. De hecho, esto es bastante desafiante porque los criterios de selección de modelos convencionales, como el BIC y la validación cruzada, no pueden conducir a un resultado estable en la práctica, incluso con una carga pesada de cálculos repetitivos. En este artículo, mejoramos el modelo original de TMGPFR y proponemos un algoritmo de aprendizaje de templado Bayesian Ying-Yang (BYY) para el aprendizaje de parámetros del modelo mejorado con selección automática de modelos. Los resultados experimentales de conjuntos de datos sintéticos y realistas demuestran que nuestro algoritmo propuesto puede realizar la selección de modelos correcta automáticamente durante el aprendizaje de parámetros del modelo.
Descripción
Como un modelo de aprendizaje estadístico razonable para el análisis de agrupación de curvas, se ha desarrollado el modelo de dos capas de mezclas de regresiones funcionales de procesos gaussianos (TMGPFR) para ajustarse a los datos de curvas de muestra de una serie de fuentes de información independientes o procesos estocásticos. Dado que las curvas de muestra de cierto proceso estocástico forman naturalmente un grupo de curvas, la selección del modelo de TMGPFR, es decir, la selección del número de mezclas de regresiones funcionales de procesos gaussianos (MGPFRs) en la capa superior, corresponde al descubrimiento del número de grupos y la estructura de los datos de las curvas. De hecho, esto es bastante desafiante porque los criterios de selección de modelos convencionales, como el BIC y la validación cruzada, no pueden conducir a un resultado estable en la práctica, incluso con una carga pesada de cálculos repetitivos. En este artículo, mejoramos el modelo original de TMGPFR y proponemos un algoritmo de aprendizaje de templado Bayesian Ying-Yang (BYY) para el aprendizaje de parámetros del modelo mejorado con selección automática de modelos. Los resultados experimentales de conjuntos de datos sintéticos y realistas demuestran que nuestro algoritmo propuesto puede realizar la selección de modelos correcta automáticamente durante el aprendizaje de parámetros del modelo.