Un algoritmo novedoso de tipo EM para estimar mezclas semiparamétricas de modelos lineales parciales
Autores: Skhosana, Sphiwe B.; Millard, Salomon M.; Kanfer, Frans H. J.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un algoritmo novedoso de tipo EM para estimar mezclas semiparamétricas de modelos lineales parciales
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Mezcla
Modelos de regresión
No paramétrico
Estimación de la verosimilitud local
Algoritmo EM
Problema de etiquetado interchangeables
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
Los modelos de regresión normal mixtos semi y no paramétricos son una clase flexible de modelos de regresión mixtos. Estos modelos asumen que las proporciones de mezcla de los componentes, las funciones de regresión y/o las varianzas son funciones no paramétricas de los covariables. Dentro de esta clase de modelos, los modelos mixtos semiparamétricos de modelos lineales parcialmente lineales (SPMPLMs) combinan la interpretabilidad deseable de un modelo paramétrico y la flexibilidad de un modelo no paramétrico. Sin embargo, la estimación de la función no paramétrica mediante verosimilitud local plantea un desafío computacional. La optimización tradicional de EM de las funciones de verosimilitud local no es apropiada debido al problema de intercambio de etiquetas. Aplicar separadamente el algoritmo EM en cada función de verosimilitud local probablemente resultará en estimaciones de funciones no suaves. Esto se debe a que las responsabilidades locales calculadas en el paso E de cada EM local no están garantizadas para estar alineadas. Para evitar esto, el algoritmo EM debe modificarse para que se utilicen las mismas responsabilidades (globales) en cada paso M local. En este documento, proponemos un algoritmo tipo EM de retroajuste de un paso para estimar los SPMPLMs y abordar eficazmente el problema de intercambio de etiquetas. El algoritmo propuesto estima la función no paramétrica utilizando cada conjunto de responsabilidades locales a su vez y luego incorpora un paso de suavizado para obtener la estimación más suave. Además, para reducir la carga computacional impuesta por el uso del estimador de residuos parciales del término paramétrico, proponemos un estimador de inserción. La efectividad y utilidad práctica de los métodos propuestos se probó utilizando un conjunto de datos simulados y dos conjuntos de datos reales, respectivamente. Nuestro análisis de muestra finita reveló que los métodos propuestos son efectivos para resolver el problema de intercambio de etiquetas y producir resultados razonables e interpretables en un tiempo razonable.
Descripción
Los modelos de regresión normal mixtos semi y no paramétricos son una clase flexible de modelos de regresión mixtos. Estos modelos asumen que las proporciones de mezcla de los componentes, las funciones de regresión y/o las varianzas son funciones no paramétricas de los covariables. Dentro de esta clase de modelos, los modelos mixtos semiparamétricos de modelos lineales parcialmente lineales (SPMPLMs) combinan la interpretabilidad deseable de un modelo paramétrico y la flexibilidad de un modelo no paramétrico. Sin embargo, la estimación de la función no paramétrica mediante verosimilitud local plantea un desafío computacional. La optimización tradicional de EM de las funciones de verosimilitud local no es apropiada debido al problema de intercambio de etiquetas. Aplicar separadamente el algoritmo EM en cada función de verosimilitud local probablemente resultará en estimaciones de funciones no suaves. Esto se debe a que las responsabilidades locales calculadas en el paso E de cada EM local no están garantizadas para estar alineadas. Para evitar esto, el algoritmo EM debe modificarse para que se utilicen las mismas responsabilidades (globales) en cada paso M local. En este documento, proponemos un algoritmo tipo EM de retroajuste de un paso para estimar los SPMPLMs y abordar eficazmente el problema de intercambio de etiquetas. El algoritmo propuesto estima la función no paramétrica utilizando cada conjunto de responsabilidades locales a su vez y luego incorpora un paso de suavizado para obtener la estimación más suave. Además, para reducir la carga computacional impuesta por el uso del estimador de residuos parciales del término paramétrico, proponemos un estimador de inserción. La efectividad y utilidad práctica de los métodos propuestos se probó utilizando un conjunto de datos simulados y dos conjuntos de datos reales, respectivamente. Nuestro análisis de muestra finita reveló que los métodos propuestos son efectivos para resolver el problema de intercambio de etiquetas y producir resultados razonables e interpretables en un tiempo razonable.