Estimación de densidad de probabilidad a través de particionamiento adaptativo no paramétrico y unión
Autores: Merino, Zach D.; Farmer, Jenny; Jacobs, Donald J.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Estimación de densidad de probabilidad a través de particionamiento adaptativo no paramétrico y unión
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Algoritmo
PDF
No paramétrico
Partición
Unión
Estimación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 43
Citaciones: Sin citaciones
Presentamos un novedoso algoritmo de partición y unión adaptativa no paramétrico (NAPS) para estimar una función de densidad de probabilidad (PDF) de una sola variable. Los datos muestreados se dividen en bloques utilizando un algoritmo de árbol de ramificación que minimiza las desviaciones de una densidad uniforme dentro de bloques de varios tamaños de muestra dispuestos en un formato escalonado. Los tamaños de los bloques están construidos para equilibrar la carga en computación paralela, ya que la PDF de cada bloque se estima de forma independiente utilizando el método de máxima entropía no paramétrico (NMEM) previamente desarrollado para análisis automatizado de alto rendimiento. Una vez que se calculan todas las PDF de los bloques, se unen para proporcionar una estimación suave en todo el rango de muestra. Cada unión es un proceso de promediado sobre factores de peso basados en la función de distribución acumulativa estimada (CDF) y una CDF complementaria que caracteriza cómo se superponen los datos de bloques adyacentes. Las pruebas en datos sintéticos muestran que nuestras estimaciones de PDF son rápidas y precisas para tamaños de muestra que van de a , en un conjunto diverso de distribuciones que incluyen distribuciones unimodales y multimodales con colas pesadas o singularidades. También generamos estimaciones reemplazando NMEM con la estimación de densidad de núcleo (KDE) dentro de bloques. Nuestros resultados indican que NAPS(NMEM) es el método de mejor rendimiento en general, mientras que NAPS(KDE) mejora las estimaciones cerca de los límites en comparación con KDE estándar.
Descripción
Presentamos un novedoso algoritmo de partición y unión adaptativa no paramétrico (NAPS) para estimar una función de densidad de probabilidad (PDF) de una sola variable. Los datos muestreados se dividen en bloques utilizando un algoritmo de árbol de ramificación que minimiza las desviaciones de una densidad uniforme dentro de bloques de varios tamaños de muestra dispuestos en un formato escalonado. Los tamaños de los bloques están construidos para equilibrar la carga en computación paralela, ya que la PDF de cada bloque se estima de forma independiente utilizando el método de máxima entropía no paramétrico (NMEM) previamente desarrollado para análisis automatizado de alto rendimiento. Una vez que se calculan todas las PDF de los bloques, se unen para proporcionar una estimación suave en todo el rango de muestra. Cada unión es un proceso de promediado sobre factores de peso basados en la función de distribución acumulativa estimada (CDF) y una CDF complementaria que caracteriza cómo se superponen los datos de bloques adyacentes. Las pruebas en datos sintéticos muestran que nuestras estimaciones de PDF son rápidas y precisas para tamaños de muestra que van de a , en un conjunto diverso de distribuciones que incluyen distribuciones unimodales y multimodales con colas pesadas o singularidades. También generamos estimaciones reemplazando NMEM con la estimación de densidad de núcleo (KDE) dentro de bloques. Nuestros resultados indican que NAPS(NMEM) es el método de mejor rendimiento en general, mientras que NAPS(KDE) mejora las estimaciones cerca de los límites en comparación con KDE estándar.