Un modelo estadístico para el análisis de datos de conteo y la estimación del tamaño de la población: Introducción de una distribución mixta Poisson-Lindley y su truncamiento en cero
Autores: Alomair, Gadir; Tajuddin, Razik Ridzuan Mohd; Bakouch, Hassan S.; Almohisen, Amal
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un modelo estadístico para el análisis de datos de conteo y la estimación del tamaño de la población: Introducción de una distribución mixta Poisson-Lindley y su truncamiento en cero
Categoría
Matemáticas
Subcategoría
Análisis matemático
Palabras clave
Datos de conteo
Sobredispersión
Distribución de Lindley de segundo grado mejorada de Poisson
Eventos no observados
Estimador del tamaño de la población
Distribución truncada
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Los datos de conteo consisten en eventos observados y no observados. El análisis de datos de conteo a menudo se encuentra con sobredispersión, donde los modelos de Poisson tradicionales pueden no ser adecuados. En este documento, presentamos una distribución de Poisson mixta de un parámetro manejable, que combina la distribución de Poisson con la distribución de Lindley de segundo grado mejorada. Esta distribución, llamada distribución de Poisson-Lindley de segundo grado mejorada, es capaz de modelar efectivamente datos de conteo estándar con sobredispersión. Sin embargo, si la frecuencia de los eventos no observados es desconocida, la distribución propuesta no se puede utilizar directamente para describir los eventos. Para abordar esta limitación, proponemos una modificación truncando la distribución a cero. Esto da como resultado una distribución truncada a cero manejable que abarca todos los tipos de dispersiones. Debido a la frecuencia desconocida de los eventos no observados, el tamaño de la población en su conjunto se vuelve desconocido y requiere estimación. Para estimar el tamaño de la población, desarrollamos un estimador tipo Horvitz-Thompson utilizando la distribución truncada. Tanto las distribuciones no truncadas como las truncadas exhiben propiedades estadísticas deseables. Los estimadores para ambas distribuciones, así como el tamaño de la población, son asintóticamente sesgados y consistentes. El estudio actual demuestra que tanto las distribuciones truncadas como las no truncadas explican adecuadamente los conjuntos de datos médicos considerados, que son el número de cromosomas dicéntricos después de ser expuestos a diferentes dosis de radiación y el número de Salmonella positiva. Además, el estimador del tamaño de la población propuesto proporciona estimaciones confiables.
Descripción
Los datos de conteo consisten en eventos observados y no observados. El análisis de datos de conteo a menudo se encuentra con sobredispersión, donde los modelos de Poisson tradicionales pueden no ser adecuados. En este documento, presentamos una distribución de Poisson mixta de un parámetro manejable, que combina la distribución de Poisson con la distribución de Lindley de segundo grado mejorada. Esta distribución, llamada distribución de Poisson-Lindley de segundo grado mejorada, es capaz de modelar efectivamente datos de conteo estándar con sobredispersión. Sin embargo, si la frecuencia de los eventos no observados es desconocida, la distribución propuesta no se puede utilizar directamente para describir los eventos. Para abordar esta limitación, proponemos una modificación truncando la distribución a cero. Esto da como resultado una distribución truncada a cero manejable que abarca todos los tipos de dispersiones. Debido a la frecuencia desconocida de los eventos no observados, el tamaño de la población en su conjunto se vuelve desconocido y requiere estimación. Para estimar el tamaño de la población, desarrollamos un estimador tipo Horvitz-Thompson utilizando la distribución truncada. Tanto las distribuciones no truncadas como las truncadas exhiben propiedades estadísticas deseables. Los estimadores para ambas distribuciones, así como el tamaño de la población, son asintóticamente sesgados y consistentes. El estudio actual demuestra que tanto las distribuciones truncadas como las no truncadas explican adecuadamente los conjuntos de datos médicos considerados, que son el número de cromosomas dicéntricos después de ser expuestos a diferentes dosis de radiación y el número de Salmonella positiva. Además, el estimador del tamaño de la población propuesto proporciona estimaciones confiables.