Quasar identification using multivariate probability density estimated from nonparametric conditional probabilities
Autores: Farmer, Jenny; Allen, Eve; Jacobs, Donald J.
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Quasar identification using multivariate probability density estimated from nonparametric conditional probabilities
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Estimación de densidad
Datos multivariados
Estimación de densidad de núcleo
No paramétrico
Entropía máxima
Probabilidad conjunta
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
La estimación no paramétrica de una función de densidad de probabilidad que describe datos multivariados típicamente ha sido abordada mediante la estimación de densidad de núcleo (KDE). Un nuevo estimador de densidad desarrollado recientemente por Farmer y Jacobs ofrece un enfoque automatizado de alto rendimiento alternativo para la estimación de densidad no paramétrica univariada basado en la entropía máxima y estadísticas de orden, mejorando la precisión sobre KDE univariado. Este artículo presenta una extensión del caso de variable única a múltiples variables. El estimador univariado se utiliza para calcular de forma recursiva una matriz de productos de probabilidades condicionales unidimensionales. En combinación con métodos de interpolación, se genera una estimación completa de densidad de probabilidad conjunta para múltiples variables. Se demuestra un buen rendimiento de precisión y velocidad en datos sintéticos mediante un estudio numérico utilizando distribuciones conocidas en un rango de tamaños de muestra de 100 a para dos a seis variables. El rendimiento en términos de velocidad y precisión se compara con KDE. La estimación de densidad multivariada desarrollada aquí tiende a funcionar mejor a medida que aumenta el número de muestras y/o variables. Como ejemplo de aplicación, se analizan mediciones sobre cinco filtros de datos fotométricos de la Sloan Digital Sky Survey Data Release 17. La estimación multivariada se utiliza como base para un clasificador binario que distingue cuásares de galaxias y estrellas con hasta un 94% de precisión.
Descripción
La estimación no paramétrica de una función de densidad de probabilidad que describe datos multivariados típicamente ha sido abordada mediante la estimación de densidad de núcleo (KDE). Un nuevo estimador de densidad desarrollado recientemente por Farmer y Jacobs ofrece un enfoque automatizado de alto rendimiento alternativo para la estimación de densidad no paramétrica univariada basado en la entropía máxima y estadísticas de orden, mejorando la precisión sobre KDE univariado. Este artículo presenta una extensión del caso de variable única a múltiples variables. El estimador univariado se utiliza para calcular de forma recursiva una matriz de productos de probabilidades condicionales unidimensionales. En combinación con métodos de interpolación, se genera una estimación completa de densidad de probabilidad conjunta para múltiples variables. Se demuestra un buen rendimiento de precisión y velocidad en datos sintéticos mediante un estudio numérico utilizando distribuciones conocidas en un rango de tamaños de muestra de 100 a para dos a seis variables. El rendimiento en términos de velocidad y precisión se compara con KDE. La estimación de densidad multivariada desarrollada aquí tiende a funcionar mejor a medida que aumenta el número de muestras y/o variables. Como ejemplo de aplicación, se analizan mediciones sobre cinco filtros de datos fotométricos de la Sloan Digital Sky Survey Data Release 17. La estimación multivariada se utiliza como base para un clasificador binario que distingue cuásares de galaxias y estrellas con hasta un 94% de precisión.