Algoritmo rápido de decisión de partición CU para codificación intra VVC utilizando un MET-CNN
Autores: Wang, Yanjun; Dai, Pu; Zhao, Jinchao; Zhang, Qiuwen
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Algoritmo rápido de decisión de partición CU para codificación intra VVC utilizando un MET-CNN
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Estándar de codificación de video
VVC/H.266
Estructura de división de bloques
árbol de cuadrantes con árbol multi-tipo anidado (QTMT)
Complejidad computacional
Red neuronal convolucional de terminación temprana (MET-CNN)
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
El estándar de codificación de video más nuevo, el estándar de codificación de video versátil (VVC/H.266), entró en vigor en noviembre de 2020. Diferente del estándar de la generación anterior de codificación de video de alta eficiencia (HEVC/H.265), VVC adopta una estructura de división de bloques más flexible, el árbol cuádruple con árbol de múltiples tipos anidados (QTMT), que mejora su rendimiento de codificación en un 24%. Sin embargo, también causa un aumento sustancial en la complejidad computacional. Por lo tanto, este documento primero propone el concepto de un mapa de cuadrícula de etapas, que divide la división general de una unidad de codificación de 32 x 32 (CU) en cuatro etapas y la representa como una salida estructurada. En segundo lugar, se diseña un modelo de red neuronal convolucional de terminación temprana de múltiples etapas (MET-CNN) para predecir la información de partición completa de una CU con un tamaño de 32 x 32. Finalmente, se propone un algoritmo de decisión de partición de CU rápido para la codificación intra de VVC basado en un MET-CNN. El algoritmo puede predecir toda la información de partición de una CU con un tamaño de 32 x 32 y sus sub-CUs en una sola ejecución, reemplazando completamente el complejo proceso de optimización de tasa-distorsión (RDO). También tiene un mecanismo de salida temprana, lo que reduce en gran medida el tiempo de codificación. Los resultados experimentales ilustran que el esquema propuesto en este documento reduce el tiempo de codificación en un 49.24% en promedio, mientras que la Tasa de Bits Delta de Bjøntegaard (BDBR) solo aumenta en un 0.97%.
Descripción
El estándar de codificación de video más nuevo, el estándar de codificación de video versátil (VVC/H.266), entró en vigor en noviembre de 2020. Diferente del estándar de la generación anterior de codificación de video de alta eficiencia (HEVC/H.265), VVC adopta una estructura de división de bloques más flexible, el árbol cuádruple con árbol de múltiples tipos anidados (QTMT), que mejora su rendimiento de codificación en un 24%. Sin embargo, también causa un aumento sustancial en la complejidad computacional. Por lo tanto, este documento primero propone el concepto de un mapa de cuadrícula de etapas, que divide la división general de una unidad de codificación de 32 x 32 (CU) en cuatro etapas y la representa como una salida estructurada. En segundo lugar, se diseña un modelo de red neuronal convolucional de terminación temprana de múltiples etapas (MET-CNN) para predecir la información de partición completa de una CU con un tamaño de 32 x 32. Finalmente, se propone un algoritmo de decisión de partición de CU rápido para la codificación intra de VVC basado en un MET-CNN. El algoritmo puede predecir toda la información de partición de una CU con un tamaño de 32 x 32 y sus sub-CUs en una sola ejecución, reemplazando completamente el complejo proceso de optimización de tasa-distorsión (RDO). También tiene un mecanismo de salida temprana, lo que reduce en gran medida el tiempo de codificación. Los resultados experimentales ilustran que el esquema propuesto en este documento reduce el tiempo de codificación en un 49.24% en promedio, mientras que la Tasa de Bits Delta de Bjøntegaard (BDBR) solo aumenta en un 0.97%.