Métodos multi-etapa para compresión de datos controlada por costos utilizando análisis de componentes principales
Autores: Banerjee, Swarnali; Chattopadhyay, Bhargab
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Métodos multi-etapa para compresión de datos controlada por costos utilizando análisis de componentes principales
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
En línea
Análisis de componentes principales
PCA
Minimización del riesgo de compresión
Costo-riesgo de compresión
Procedimiento de dos etapas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Varias metodologías de análisis de componentes principales (PCA, por sus siglas en inglés) en línea existen para datos que llegan secuencialmente y se centran únicamente en la minimización del riesgo de compresión. El trabajo reciente en este ámbito gira en torno a minimizar el riesgo de compresión de costos, que tiene en cuenta la pérdida de compresión y los costos de muestreo utilizando un procedimiento de PCA de dos etapas. Aunque el procedimiento goza de eficiencia de primer orden, los autores no pudieron verificar matemáticamente la existencia de la propiedad de eficiencia de segundo orden. En este artículo, minimizamos el riesgo de compresión de costos utilizando un procedimiento de PCA de dos etapas modificado, que tiene en cuenta la pérdida de compresión de datos, así como el costo de muestreo cuando se conoce el menor valor propio de la matriz de varianza-covarianza de la población o su límite inferior positivo cuando se asume que los datos siguen una distribución normal multivariante. Se muestra que el procedimiento de PCA de dos etapas modificado posee la propiedad de eficiencia de segundo orden, entre otras, incluida la propiedad de eficiencia de riesgo de segundo orden bajo ciertas condiciones. El método propuesto es novedoso pero también rápido y eficiente, como se ilustra mediante análisis extensos de datos a través de simulaciones y análisis de datos reales.
Descripción
Varias metodologías de análisis de componentes principales (PCA, por sus siglas en inglés) en línea existen para datos que llegan secuencialmente y se centran únicamente en la minimización del riesgo de compresión. El trabajo reciente en este ámbito gira en torno a minimizar el riesgo de compresión de costos, que tiene en cuenta la pérdida de compresión y los costos de muestreo utilizando un procedimiento de PCA de dos etapas. Aunque el procedimiento goza de eficiencia de primer orden, los autores no pudieron verificar matemáticamente la existencia de la propiedad de eficiencia de segundo orden. En este artículo, minimizamos el riesgo de compresión de costos utilizando un procedimiento de PCA de dos etapas modificado, que tiene en cuenta la pérdida de compresión de datos, así como el costo de muestreo cuando se conoce el menor valor propio de la matriz de varianza-covarianza de la población o su límite inferior positivo cuando se asume que los datos siguen una distribución normal multivariante. Se muestra que el procedimiento de PCA de dos etapas modificado posee la propiedad de eficiencia de segundo orden, entre otras, incluida la propiedad de eficiencia de riesgo de segundo orden bajo ciertas condiciones. El método propuesto es novedoso pero también rápido y eficiente, como se ilustra mediante análisis extensos de datos a través de simulaciones y análisis de datos reales.