Particionamiento de Unidad de Codificación Habilitado por Saliencia y Control de Cuantización para Codificación de Video Versátil
Autores: Li, Wei; Jiang, Xiantao; Jin, Jiayuan; Song, Tian; Yu, Fei Richard
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Particionamiento de Unidad de Codificación Habilitado por Saliencia y Control de Cuantización para Codificación de Video Versátil
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Estándar de codificación de video
VVC
Eficiencia de codificación
Codificación de video perceptual
Modelo de saliencia visual
Algoritmo de control de cuantización
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El último estándar de codificación de video, la codificación de video versátil (VVC), ha mejorado enormemente la eficiencia de codificación en comparación con su estándar predecesor, la codificación de video de alta eficiencia (HEVC), pero a expensas de una complejidad significativamente aumentada. En el contexto de la codificación de video perceptual (PVC), el modelo de saliencia visual que utiliza las características del sistema visual humano para mejorar la eficiencia de codificación se ha convertido en un método confiable gracias a los avances en el rendimiento de las computadoras y los algoritmos visuales. En este documento, se propone un nuevo esquema de optimización de VVC que cumple con el marco de PVC, que consiste en un algoritmo de partición de unidad de codificación (CU) rápido y un algoritmo de control de cuantización. En primer lugar, basado en el modelo de saliencia visual, proponemos un esquema de división de CU rápido, que incluye la redeterminación de la profundidad de división de CU mediante el cálculo del operador Scharr y la varianza, así como la decisión ejecutiva para sub-particiones intra (ISP), para reducir la complejidad de codificación. En segundo lugar, se propone un algoritmo de control de cuantización ajustando el parámetro de cuantización basado en la clasificación de múltiples niveles de valores de saliencia a nivel de CU para reducir la tasa de bits. En comparación con el modelo de referencia, los resultados experimentales indican que el método propuesto puede reducir aproximadamente un 47.19% de la complejidad computacional y lograr un ahorro de tasa de bits del 3.68% en promedio. Mientras tanto, el algoritmo propuesto tiene pérdidas razonables en la relación señal-ruido de pico y casi la misma calidad perceptual subjetiva.
Descripción
El último estándar de codificación de video, la codificación de video versátil (VVC), ha mejorado enormemente la eficiencia de codificación en comparación con su estándar predecesor, la codificación de video de alta eficiencia (HEVC), pero a expensas de una complejidad significativamente aumentada. En el contexto de la codificación de video perceptual (PVC), el modelo de saliencia visual que utiliza las características del sistema visual humano para mejorar la eficiencia de codificación se ha convertido en un método confiable gracias a los avances en el rendimiento de las computadoras y los algoritmos visuales. En este documento, se propone un nuevo esquema de optimización de VVC que cumple con el marco de PVC, que consiste en un algoritmo de partición de unidad de codificación (CU) rápido y un algoritmo de control de cuantización. En primer lugar, basado en el modelo de saliencia visual, proponemos un esquema de división de CU rápido, que incluye la redeterminación de la profundidad de división de CU mediante el cálculo del operador Scharr y la varianza, así como la decisión ejecutiva para sub-particiones intra (ISP), para reducir la complejidad de codificación. En segundo lugar, se propone un algoritmo de control de cuantización ajustando el parámetro de cuantización basado en la clasificación de múltiples niveles de valores de saliencia a nivel de CU para reducir la tasa de bits. En comparación con el modelo de referencia, los resultados experimentales indican que el método propuesto puede reducir aproximadamente un 47.19% de la complejidad computacional y lograr un ahorro de tasa de bits del 3.68% en promedio. Mientras tanto, el algoritmo propuesto tiene pérdidas razonables en la relación señal-ruido de pico y casi la misma calidad perceptual subjetiva.