Eficiente estimación de modelos generativos utilizando la profundidad de Tukey
Autores: Vo, Minh-Quan; Nguyen, Thu; Riegler, Michael A.; Hammer, Hugo L.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Eficiente estimación de modelos generativos utilizando la profundidad de Tukey
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Modelos generativos
Estimación sin verosimilitud
Parámetros del modelo
Estadísticas
Contornos de profundidad de Tukey
Parámetros desconocidos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Los modelos generativos han recibido recientemente mucha atención. Sin embargo, un desafío con tales modelos es que generalmente no es posible calcular la función de verosimilitud, lo que dificulta la estimación de parámetros o el entrenamiento de los modelos. La estrategia alternativa más comúnmente utilizada se llama estimación sin verosimilitud, basada en encontrar valores de los parámetros del modelo de manera que un conjunto de estadísticas seleccionadas tengan valores similares en el conjunto de datos y en las muestras generadas a partir del modelo. Sin embargo, un desafío es cómo seleccionar estadísticas que sean eficientes en la estimación de parámetros desconocidos. Las estadísticas más comúnmente utilizadas son el vector medio, las varianzas y las correlaciones entre variables, pero pueden ser menos relevantes en la estimación de los parámetros desconocidos. Sugerimos utilizar los contornos de profundidad de Tukey (TDCs) como estadísticas en la estimación sin verosimilitud. Los TDCs son altamente flexibles y pueden capturar casi cualquier propiedad de datos multivariados, además, parecen ser aún inexplorados para la estimación sin verosimilitud. Demostramos que las estadísticas TDC pueden estimar los parámetros desconocidos de manera más eficiente que la media, la varianza y la correlación en la estimación sin verosimilitud. Aplicamos además las estadísticas TDC para estimar las propiedades de las solicitudes a un sistema informático, demostrando su aplicabilidad en la vida real. El método sugerido es capaz de encontrar eficientemente los parámetros desconocidos de la distribución de solicitudes y cuantificar la incertidumbre de la estimación.
Descripción
Los modelos generativos han recibido recientemente mucha atención. Sin embargo, un desafío con tales modelos es que generalmente no es posible calcular la función de verosimilitud, lo que dificulta la estimación de parámetros o el entrenamiento de los modelos. La estrategia alternativa más comúnmente utilizada se llama estimación sin verosimilitud, basada en encontrar valores de los parámetros del modelo de manera que un conjunto de estadísticas seleccionadas tengan valores similares en el conjunto de datos y en las muestras generadas a partir del modelo. Sin embargo, un desafío es cómo seleccionar estadísticas que sean eficientes en la estimación de parámetros desconocidos. Las estadísticas más comúnmente utilizadas son el vector medio, las varianzas y las correlaciones entre variables, pero pueden ser menos relevantes en la estimación de los parámetros desconocidos. Sugerimos utilizar los contornos de profundidad de Tukey (TDCs) como estadísticas en la estimación sin verosimilitud. Los TDCs son altamente flexibles y pueden capturar casi cualquier propiedad de datos multivariados, además, parecen ser aún inexplorados para la estimación sin verosimilitud. Demostramos que las estadísticas TDC pueden estimar los parámetros desconocidos de manera más eficiente que la media, la varianza y la correlación en la estimación sin verosimilitud. Aplicamos además las estadísticas TDC para estimar las propiedades de las solicitudes a un sistema informático, demostrando su aplicabilidad en la vida real. El método sugerido es capaz de encontrar eficientemente los parámetros desconocidos de la distribución de solicitudes y cuantificar la incertidumbre de la estimación.