Modelo de predicción de distorsión apenas perceptible para compresión de video con una red espacial-temporal
Autores: Liu, Huanhua; Liu, Shengzong; Xiao, Jianyu; Xu, Dandan; Fan, Xiaoping
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Modelo de predicción de distorsión apenas perceptible para compresión de video con una red espacial-temporal
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Diferencia apenas perceptible
Compresión de imagen/video
Decisión binaria
Aprendizaje profundo
Predictor perceptualmente con pérdida/sin pérdida
Basado en red espacial-temporal
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La Diferencia Apenas Perceptible (JND) en una imagen/video se refiere a la diferencia máxima que el sistema visual humano no puede percibir, lo cual ha sido ampliamente aplicado en la compresión de imagen/video guiada por la percepción. En este trabajo, proponemos un Método de Predicción de Diferencia Apenas Perceptible Basado en Decisión Binaria para Video a Nivel de Video (BD-VW-JND-PM) con aprendizaje profundo. En primer lugar, modelamos el problema de predicción de VW-JND como un proceso de decisión binaria para reducir la complejidad de inferencia. Luego, proponemos un Predictor de Pérdida/Pérdida Perceptual para Video Comprimido (PLLP-CV) para identificar si la distorsión puede ser percibida o no. En el PLLP-CV, se propone un predictor Pérdida/Pérdida perceptual basado en Red Espacial-Temporal (ST-Network-PLLP) para fotogramas clave mediante el aprendizaje de las características de distorsión espacial y temporal, y se propone una estrategia de integración basada en umbral para obtener los resultados finales. Los resultados experimentales evaluados en la base de datos VideoSet muestran que la precisión promedio de predicción de PLLP-CV es aproximadamente del 95.6%, y el error promedio de predicción de JND es de 1.46 en QP y 0.74 en Relación Pico a Ruido (PSNR), lo cual logra mejoras del 15% y 14.9%, respectivamente.
Descripción
La Diferencia Apenas Perceptible (JND) en una imagen/video se refiere a la diferencia máxima que el sistema visual humano no puede percibir, lo cual ha sido ampliamente aplicado en la compresión de imagen/video guiada por la percepción. En este trabajo, proponemos un Método de Predicción de Diferencia Apenas Perceptible Basado en Decisión Binaria para Video a Nivel de Video (BD-VW-JND-PM) con aprendizaje profundo. En primer lugar, modelamos el problema de predicción de VW-JND como un proceso de decisión binaria para reducir la complejidad de inferencia. Luego, proponemos un Predictor de Pérdida/Pérdida Perceptual para Video Comprimido (PLLP-CV) para identificar si la distorsión puede ser percibida o no. En el PLLP-CV, se propone un predictor Pérdida/Pérdida perceptual basado en Red Espacial-Temporal (ST-Network-PLLP) para fotogramas clave mediante el aprendizaje de las características de distorsión espacial y temporal, y se propone una estrategia de integración basada en umbral para obtener los resultados finales. Los resultados experimentales evaluados en la base de datos VideoSet muestran que la precisión promedio de predicción de PLLP-CV es aproximadamente del 95.6%, y el error promedio de predicción de JND es de 1.46 en QP y 0.74 en Relación Pico a Ruido (PSNR), lo cual logra mejoras del 15% y 14.9%, respectivamente.