logo móvil
Contáctanos

Modelo de predicción de distorsión apenas perceptible para compresión de video con una red espacial-temporal

Autores: Liu, Huanhua; Liu, Shengzong; Xiao, Jianyu; Xu, Dandan; Fan, Xiaoping

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Modelo de predicción de distorsión apenas perceptible para compresión de video con una red espacial-temporal


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Diferencia apenas perceptible
Compresión de imagen/video
Decisión binaria
Aprendizaje profundo
Predictor perceptualmente con pérdida/sin pérdida
Basado en red espacial-temporal

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 28

Citaciones: Sin citaciones


Descripción
La Diferencia Apenas Perceptible (JND) en una imagen/video se refiere a la diferencia máxima que el sistema visual humano no puede percibir, lo cual ha sido ampliamente aplicado en la compresión de imagen/video guiada por la percepción. En este trabajo, proponemos un Método de Predicción de Diferencia Apenas Perceptible Basado en Decisión Binaria para Video a Nivel de Video (BD-VW-JND-PM) con aprendizaje profundo. En primer lugar, modelamos el problema de predicción de VW-JND como un proceso de decisión binaria para reducir la complejidad de inferencia. Luego, proponemos un Predictor de Pérdida/Pérdida Perceptual para Video Comprimido (PLLP-CV) para identificar si la distorsión puede ser percibida o no. En el PLLP-CV, se propone un predictor Pérdida/Pérdida perceptual basado en Red Espacial-Temporal (ST-Network-PLLP) para fotogramas clave mediante el aprendizaje de las características de distorsión espacial y temporal, y se propone una estrategia de integración basada en umbral para obtener los resultados finales. Los resultados experimentales evaluados en la base de datos VideoSet muestran que la precisión promedio de predicción de PLLP-CV es aproximadamente del 95.6%, y el error promedio de predicción de JND es de 1.46 en QP y 0.74 en Relación Pico a Ruido (PSNR), lo cual logra mejoras del 15% y 14.9%, respectivamente.

Otros recursos que podrían interesarte

Temas Virtualpro