Algoritmo de decisión de partición rápida de CTU de extremo a extremo basado en árboles empaquetados y ResNet para codificación intra de video
Autores: Li, Yixiao; Li, Lixiang; Fang, Yuan; Peng, Haipeng; Ling, Nam
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Algoritmo de decisión de partición rápida de CTU de extremo a extremo basado en árboles empaquetados y ResNet para codificación intra de video
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Normas de codificación de video
HEVC
VVC
AV2
Rendimiento de codificación
Unidad de codificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Los estándares de codificación de video, como la codificación de video de alta eficiencia (HEVC), la codificación de video versátil (VVC) y el video 2 de AOMedia (AV2), logran un rendimiento de codificación óptimo al recorrer todas las posibles combinaciones de partición de la unidad de codificación (CU) y seleccionar la combinación con el costo de codificación mínimo. Todavía es necesario reducir aún más el tiempo de codificación de HEVC, porque HEVC es uno de los estándares de codificación más ampliamente utilizados. En HEVC, el proceso de búsqueda del mejor rendimiento es la fuente de la mayor parte de la complejidad de codificación. Para reducir la complejidad de la partición de bloques de codificación en HEVC, se presenta un nuevo algoritmo rápido de extremo a extremo para ayudar en las decisiones de estructura de partición de la unidad de árbol de codificación (CTU) en la codificación intra. En el método propuesto, el problema de decisión de estructura de partición de un CTU se resuelve mediante una novedosa estrategia de dos etapas. En la primera etapa, se emplea un modelo de árbol ensacado para predecir la división de un CTU. En la segunda etapa, el problema de partición de un CU de tamaño 32 x 32 se modela como una tarea de clasificación de 17 salidas por primera vez, de modo que puede resolverse mediante una sola predicción. Para lograr una alta precisión de predicción, se emplea una red residual (ResNet) con 34 capas. Utilizando conjuntamente el árbol ensacado y ResNet, el algoritmo de partición de CTU rápido propuesto es capaz de generar la estructura de árbol de partición de un CTU a través de un proceso de predicción de extremo a extremo, que abandona el esquema tradicional de tomar múltiples decisiones en varios niveles de profundidad. Además, en este documento se utilizan varios conjuntos de datos para sentar las bases de una alta precisión de predicción. En comparación con el codificador HM16.7 original, los resultados experimentales muestran que el algoritmo propuesto puede reducir el tiempo de codificación en un 60.29% en promedio, mientras que la pérdida de tasa delta de Bjøntegaard (BD-rate) es tan baja como 2.03%, lo que supera los resultados de la mayoría de los enfoques de vanguardia en el campo de la rápida partición de CU intra.
Descripción
Los estándares de codificación de video, como la codificación de video de alta eficiencia (HEVC), la codificación de video versátil (VVC) y el video 2 de AOMedia (AV2), logran un rendimiento de codificación óptimo al recorrer todas las posibles combinaciones de partición de la unidad de codificación (CU) y seleccionar la combinación con el costo de codificación mínimo. Todavía es necesario reducir aún más el tiempo de codificación de HEVC, porque HEVC es uno de los estándares de codificación más ampliamente utilizados. En HEVC, el proceso de búsqueda del mejor rendimiento es la fuente de la mayor parte de la complejidad de codificación. Para reducir la complejidad de la partición de bloques de codificación en HEVC, se presenta un nuevo algoritmo rápido de extremo a extremo para ayudar en las decisiones de estructura de partición de la unidad de árbol de codificación (CTU) en la codificación intra. En el método propuesto, el problema de decisión de estructura de partición de un CTU se resuelve mediante una novedosa estrategia de dos etapas. En la primera etapa, se emplea un modelo de árbol ensacado para predecir la división de un CTU. En la segunda etapa, el problema de partición de un CU de tamaño 32 x 32 se modela como una tarea de clasificación de 17 salidas por primera vez, de modo que puede resolverse mediante una sola predicción. Para lograr una alta precisión de predicción, se emplea una red residual (ResNet) con 34 capas. Utilizando conjuntamente el árbol ensacado y ResNet, el algoritmo de partición de CTU rápido propuesto es capaz de generar la estructura de árbol de partición de un CTU a través de un proceso de predicción de extremo a extremo, que abandona el esquema tradicional de tomar múltiples decisiones en varios niveles de profundidad. Además, en este documento se utilizan varios conjuntos de datos para sentar las bases de una alta precisión de predicción. En comparación con el codificador HM16.7 original, los resultados experimentales muestran que el algoritmo propuesto puede reducir el tiempo de codificación en un 60.29% en promedio, mientras que la pérdida de tasa delta de Bjøntegaard (BD-rate) es tan baja como 2.03%, lo que supera los resultados de la mayoría de los enfoques de vanguardia en el campo de la rápida partición de CU intra.