Robusto clasificación a través de mezclas finitas de distribuciones sesgadas de matriz variada
Autores: Mahdavi, Abbas; Balakrishnan, Narayanaswamy; Jamalizadeh, Ahad
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Robusto clasificación a través de mezclas finitas de distribuciones sesgadas de matriz variada
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Distribución
Matriz variada
Sesgo
Parámetros
Asimetría
Agrupamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
El análisis de datos de matriz variada se está volviendo cada vez más común en la literatura, especialmente en el campo de agrupamiento y clasificación. Es bien sabido que los datos reales, incluidos los datos de matriz variada reales, a menudo muestran altos niveles de asimetría. Para abordar este problema, un enfoque común es introducir un parámetro de cola o sesgo a una distribución simétrica. En este sentido, presentamos una nueva distribución llamada distribución de sesgo de matriz variada (MVST), que proporciona flexibilidad en términos de cola pesada y sesgo. Luego realizamos una investigación exhaustiva de varias caracterizaciones y propiedades probabilísticas de la distribución MVST. También exploramos extensiones de esta distribución a un modelo de mezcla finita. Para estimar los parámetros de la distribución MVST, desarrollamos un algoritmo de tipo EM que calcula estimaciones de máxima verosimilitud (ML) de los parámetros del modelo. Para validar la efectividad y utilidad de los modelos desarrollados y los métodos asociados, realizamos experimentos empíricos, utilizando datos simulados y tres ejemplos de datos reales, incluida una aplicación en la detección de cáncer de piel. Nuestros resultados demuestran la eficacia del enfoque desarrollado en el manejo de datos de matriz variada asimétricos.
Descripción
El análisis de datos de matriz variada se está volviendo cada vez más común en la literatura, especialmente en el campo de agrupamiento y clasificación. Es bien sabido que los datos reales, incluidos los datos de matriz variada reales, a menudo muestran altos niveles de asimetría. Para abordar este problema, un enfoque común es introducir un parámetro de cola o sesgo a una distribución simétrica. En este sentido, presentamos una nueva distribución llamada distribución de sesgo de matriz variada (MVST), que proporciona flexibilidad en términos de cola pesada y sesgo. Luego realizamos una investigación exhaustiva de varias caracterizaciones y propiedades probabilísticas de la distribución MVST. También exploramos extensiones de esta distribución a un modelo de mezcla finita. Para estimar los parámetros de la distribución MVST, desarrollamos un algoritmo de tipo EM que calcula estimaciones de máxima verosimilitud (ML) de los parámetros del modelo. Para validar la efectividad y utilidad de los modelos desarrollados y los métodos asociados, realizamos experimentos empíricos, utilizando datos simulados y tres ejemplos de datos reales, incluida una aplicación en la detección de cáncer de piel. Nuestros resultados demuestran la eficacia del enfoque desarrollado en el manejo de datos de matriz variada asimétricos.