Modelo de predicción de distorsión apenas perceptible para compresión de video con una red espacial-temporal

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Modelo de predicción de distorsión apenas perceptible para compresión de video con una red espacial-temporal

Autores: Liu, Huanhua; Liu, Shengzong; Xiao, Jianyu; Xu, Dandan; Fan, Xiaoping

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Modelo de predicción de distorsión apenas perceptible para compresión de video con una red espacial-temporal

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Diferencia apenas perceptible

Compresión de imagen/video

Decisión binaria

Aprendizaje profundo

Predictor perceptualmente con pérdida/sin pérdida

Basado en red espacial-temporal

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 28

Citaciones: Sin citaciones

La Diferencia Apenas Perceptible (JND) en una imagen/video se refiere a la diferencia máxima que el sistema visual humano no puede percibir, lo cual ha sido ampliamente aplicado en la compresión de imagen/video guiada por la percepción. En este trabajo, proponemos un Método de Predicción de Diferencia Apenas Perceptible Basado en Decisión Binaria para Video a Nivel de Video (BD-VW-JND-PM) con aprendizaje profundo. En primer lugar, modelamos el problema de predicción de VW-JND como un proceso de decisión binaria para reducir la complejidad de inferencia. Luego, proponemos un Predictor de Pérdida/Pérdida Perceptual para Video Comprimido (PLLP-CV) para identificar si la distorsión puede ser percibida o no. En el PLLP-CV, se propone un predictor Pérdida/Pérdida perceptual basado en Red Espacial-Temporal (ST-Network-PLLP) para fotogramas clave mediante el aprendizaje de las características de distorsión espacial y temporal, y se propone una estrategia de integración basada en umbral para obtener los resultados finales. Los resultados experimentales evaluados en la base de datos VideoSet muestran que la precisión promedio de predicción de PLLP-CV es aproximadamente del 95.6%, y el error promedio de predicción de JND es de 1.46 en QP y 0.74 en Relación Pico a Ruido (PSNR), lo cual logra mejoras del 15% y 14.9%, respectivamente.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro