Estrategia de particionamiento QTMTT rápida basada en aprendizaje automático para el codificador VVenC en codificación intra
Autores: Taabane, Ibrahim; Menard, Daniel; Mansouri, Anass; Ahaitouf, Ali
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Estrategia de particionamiento QTMTT rápida basada en aprendizaje automático para el codificador VVenC en codificación intra
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Estándar de compresión de video
Codificación de Video Versátil
VVC
Codificación de Video de Alta Eficiencia
HEVC
Máquina de Refuerzo de Gradiente Ligero
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
El estándar de compresión de video más nuevo, Versatile Video Coding (VVC), fue finalizado en julio de 2020 por el Equipo Conjunto de Expertos en Video (JVET). Su principal objetivo es reducir la tasa de bits en un 50% respecto a su predecesor, el estándar de codificación de video High Efficiency Video Coding (HEVC). Debido a las nuevas herramientas avanzadas y características incluidas en VVC, en realidad proporciona altas actuaciones de codificación, por ejemplo, el Quad Tree con Nested Multi-Type Tree (QTMTT) involucrado en la partición de bloques. Además, VVC introduce varias técnicas que permiten un rendimiento superior en comparación con HEVC, pero con un aumento en la complejidad computacional. Para abordar esta complejidad, en este trabajo se propone un algoritmo de partición de Unidad de Codificación rápida basado en aprendizaje automático para la configuración intra en VVC. El algoritmo propuesto está formado por cinco clasificadores binarios Light Gradient Boosting Machine (LightGBM), que pueden predecir directamente el modo de división más probable para cada unidad de codificación sin pasar por el proceso exhaustivo conocido como Optimización de Distorsión de Tasa (RDO). Estos clasificadores LightGBM fueron entrenados offline en un gran conjunto de datos; luego, fueron incorporados en la implementación optimizada de VVC conocida como VVenC. Los resultados de nuestro experimento muestran que nuestro enfoque propuesto tiene buenos compromisos en términos de ahorro de tiempo y eficiencia de codificación. Dependiendo de la configuración elegida, nuestro enfoque logra un ahorro de tiempo promedio del 30.21% al 82.46% en comparación con el codificador ancla de VVenC, y un aumento de la tasa de bits de Bjøntegaard Delta (BDBR) del 0.67% al 3.01%, respectivamente.
Descripción
El estándar de compresión de video más nuevo, Versatile Video Coding (VVC), fue finalizado en julio de 2020 por el Equipo Conjunto de Expertos en Video (JVET). Su principal objetivo es reducir la tasa de bits en un 50% respecto a su predecesor, el estándar de codificación de video High Efficiency Video Coding (HEVC). Debido a las nuevas herramientas avanzadas y características incluidas en VVC, en realidad proporciona altas actuaciones de codificación, por ejemplo, el Quad Tree con Nested Multi-Type Tree (QTMTT) involucrado en la partición de bloques. Además, VVC introduce varias técnicas que permiten un rendimiento superior en comparación con HEVC, pero con un aumento en la complejidad computacional. Para abordar esta complejidad, en este trabajo se propone un algoritmo de partición de Unidad de Codificación rápida basado en aprendizaje automático para la configuración intra en VVC. El algoritmo propuesto está formado por cinco clasificadores binarios Light Gradient Boosting Machine (LightGBM), que pueden predecir directamente el modo de división más probable para cada unidad de codificación sin pasar por el proceso exhaustivo conocido como Optimización de Distorsión de Tasa (RDO). Estos clasificadores LightGBM fueron entrenados offline en un gran conjunto de datos; luego, fueron incorporados en la implementación optimizada de VVC conocida como VVenC. Los resultados de nuestro experimento muestran que nuestro enfoque propuesto tiene buenos compromisos en términos de ahorro de tiempo y eficiencia de codificación. Dependiendo de la configuración elegida, nuestro enfoque logra un ahorro de tiempo promedio del 30.21% al 82.46% en comparación con el codificador ancla de VVenC, y un aumento de la tasa de bits de Bjøntegaard Delta (BDBR) del 0.67% al 3.01%, respectivamente.