Relleno de Datos de Calidad del Aire a Largo Plazo Basado en Aprendizaje Contrastivo
Autores: Liu, Zihe; Hu, Keyong; Zhang, Jingxuan; Ren, Xingchen; Wang, Xi
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Relleno de Datos de Calidad del Aire a Largo Plazo Basado en Aprendizaje Contrastivo
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Datos faltantes continuos
Monitoreo de la calidad del aire
ConFill
Aprendizaje contrastivo
Imputación
Aumento de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los datos continuos faltantes son un desafío prevalente en el monitoreo de la calidad del aire a largo plazo, socavando la fiabilidad de la protección de la salud pública y el desarrollo urbano sostenible. En este artículo, proponemos ConFill, un novedoso marco basado en el aprendizaje contrastivo para reconstruir datos continuos faltantes en series temporales de calidad del aire. Al aprovechar la continuidad temporal como una señal de supervisión, nuestro método construye pares de muestras positivas a partir de subsecuencias adyacentes y pares negativos a partir de segmentos distantes y desordenados. A través del aprendizaje contrastivo, el modelo aprende representaciones robustas que preservan las dinámicas temporales intrínsecas y permiten una imputación precisa de segmentos continuos faltantes. Se propone una nueva estrategia de aumento de datos para integrar la inyección de ruido, el enmascaramiento de subsecuencias y la distorsión temporal para mejorar la diversidad y representatividad de las muestras de entrenamiento. Se realizan experimentos extensos en un conjunto de datos del mundo real a gran escala que comprende observaciones de múltiples contaminantes de 209 estaciones de monitoreo en toda China durante un período de tres años. Los resultados muestran que ConFill supera a los métodos de imputación de referencia en varios escenarios de datos faltantes, especialmente en la reconstrucción de largos intervalos consecutivos. Los estudios de ablación confirman la efectividad tanto del módulo de aprendizaje contrastivo como de la técnica de aumento propuesta.
Descripción
Los datos continuos faltantes son un desafío prevalente en el monitoreo de la calidad del aire a largo plazo, socavando la fiabilidad de la protección de la salud pública y el desarrollo urbano sostenible. En este artículo, proponemos ConFill, un novedoso marco basado en el aprendizaje contrastivo para reconstruir datos continuos faltantes en series temporales de calidad del aire. Al aprovechar la continuidad temporal como una señal de supervisión, nuestro método construye pares de muestras positivas a partir de subsecuencias adyacentes y pares negativos a partir de segmentos distantes y desordenados. A través del aprendizaje contrastivo, el modelo aprende representaciones robustas que preservan las dinámicas temporales intrínsecas y permiten una imputación precisa de segmentos continuos faltantes. Se propone una nueva estrategia de aumento de datos para integrar la inyección de ruido, el enmascaramiento de subsecuencias y la distorsión temporal para mejorar la diversidad y representatividad de las muestras de entrenamiento. Se realizan experimentos extensos en un conjunto de datos del mundo real a gran escala que comprende observaciones de múltiples contaminantes de 209 estaciones de monitoreo en toda China durante un período de tres años. Los resultados muestran que ConFill supera a los métodos de imputación de referencia en varios escenarios de datos faltantes, especialmente en la reconstrucción de largos intervalos consecutivos. Los estudios de ablación confirman la efectividad tanto del módulo de aprendizaje contrastivo como de la técnica de aumento propuesta.