Un método de reducción de complejidad para la predicción intra de VVC basado en análisis estadístico y SAE-CNN
Autores: Zhao, Jinchao; Dai, Pu; Zhang, Qiuwen
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un método de reducción de complejidad para la predicción intra de VVC basado en análisis estadístico y SAE-CNN
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Introducción
Estándar de Codificación de Video Versátil
Esquema QTMT
Calidad de codificación
Optimización de tasa-distorsión
Algoritmo de reducción de complejidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
En comparación con High Efficiency Video Coding (HEVC), el último estándar de codificación de video Versatile Video Coding Standard (VVC), debido a la introducción de muchas tecnologías novedosas y la introducción del esquema de división Quad-tree con árbol de múltiples tipos anidados (QTMT) en el método de división de bloques, la calidad de codificación ha mejorado considerablemente. Debido a la introducción del esquema QTMT, el codificador necesita realizar una optimización de tasa-distorsión para cada modo de división durante la división de la Unidad de Codificación (CU), para seleccionar el mejor modo de división, lo que también conlleva un aumento en el tiempo de codificación y la complejidad de la codificación. Por lo tanto, proponemos un algoritmo de reducción de complejidad de predicción intra de VVC basado en teoría estadística y la Red Neuronal Convolucional de Tamaño-adaptativo (SAE-CNN). El algoritmo combina el establecimiento de un diccionario de pre-decisión basado en teoría estadística y un modelo de Red Neuronal Convolucional (CNN) basado en ajustar de forma adaptativa el tamaño de la capa de agrupación para formar un proceso de decisión de división de tamaño de CU adaptativo. El algoritmo puede tomar una decisión sobre si dividir CUs de diferentes tamaños, evitando así la Optimización de Tasa-Distorsión (RDO) innecesaria y reduciendo el tiempo de codificación. Los resultados experimentales muestran que en comparación con el algoritmo original, nuestro algoritmo propuesto puede ahorrar un 35.60% del tiempo de codificación y solo aumenta el Bit Rate Delta de Bjøntegaard (BD-BR) en un 0.91%.
Descripción
En comparación con High Efficiency Video Coding (HEVC), el último estándar de codificación de video Versatile Video Coding Standard (VVC), debido a la introducción de muchas tecnologías novedosas y la introducción del esquema de división Quad-tree con árbol de múltiples tipos anidados (QTMT) en el método de división de bloques, la calidad de codificación ha mejorado considerablemente. Debido a la introducción del esquema QTMT, el codificador necesita realizar una optimización de tasa-distorsión para cada modo de división durante la división de la Unidad de Codificación (CU), para seleccionar el mejor modo de división, lo que también conlleva un aumento en el tiempo de codificación y la complejidad de la codificación. Por lo tanto, proponemos un algoritmo de reducción de complejidad de predicción intra de VVC basado en teoría estadística y la Red Neuronal Convolucional de Tamaño-adaptativo (SAE-CNN). El algoritmo combina el establecimiento de un diccionario de pre-decisión basado en teoría estadística y un modelo de Red Neuronal Convolucional (CNN) basado en ajustar de forma adaptativa el tamaño de la capa de agrupación para formar un proceso de decisión de división de tamaño de CU adaptativo. El algoritmo puede tomar una decisión sobre si dividir CUs de diferentes tamaños, evitando así la Optimización de Tasa-Distorsión (RDO) innecesaria y reduciendo el tiempo de codificación. Los resultados experimentales muestran que en comparación con el algoritmo original, nuestro algoritmo propuesto puede ahorrar un 35.60% del tiempo de codificación y solo aumenta el Bit Rate Delta de Bjøntegaard (BD-BR) en un 0.91%.