Rdnet: red de partición de unidades de codificación basada en tasa-distorsión para intra-predicción
Autores: Yao, Chao; Xu, Chenming; Liu, Meiqin
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Rdnet: red de partición de unidades de codificación basada en tasa-distorsión para intra-predicción
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Codificación de video
HEVC
Partición de unidad de codificación
RDNet
Basado en tasa-distorsión
Subred de predicción
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
La codificación de video de alta eficiencia (HEVC) se ha finalizado como el estándar de codificación de video más ampliamente utilizado, desarrollado conjuntamente por ITU-T, VCEG y MPEG. En HEVC, la estructura de árbol cuádruple de la partición de la unidad de codificación es uno de los módulos más sustanciales y proporciona ganancias de codificación significativas tras un gran tiempo de codificación. En este documento, se propone una red de partición de unidades de codificación basada en tasa-distorsión (RDNet) para tomar decisiones de partición basadas en las características estadísticas. RDNet está compuesto por una subred de predicción y una subred de objetivo, donde la subred de predicción se utiliza para predecir los modos de partición de la unidad de codificación de la intra-predicción y la subred de objetivo está diseñada para optimizar los parámetros de la red evaluando el costo de tasa-distorsión, respectivamente. Para equilibrar la precisión de la predicción y la pérdida de tasa-distorsión, se aplica una estrategia de intercambio de parámetros para controlar el intercambio de parámetros entre las dos redes. Los resultados experimentales demuestran que nuestro modelo puede reducir el tiempo de codificación de HEVC en un 55.83~71.72% con un eficiente BD-BR de 2.876~3.347%, y el estudio de ablación evalúa la capacidad de nuestra estrategia para equilibrar la compensación entre la precisión de codificación y la velocidad de inferencia.
Descripción
La codificación de video de alta eficiencia (HEVC) se ha finalizado como el estándar de codificación de video más ampliamente utilizado, desarrollado conjuntamente por ITU-T, VCEG y MPEG. En HEVC, la estructura de árbol cuádruple de la partición de la unidad de codificación es uno de los módulos más sustanciales y proporciona ganancias de codificación significativas tras un gran tiempo de codificación. En este documento, se propone una red de partición de unidades de codificación basada en tasa-distorsión (RDNet) para tomar decisiones de partición basadas en las características estadísticas. RDNet está compuesto por una subred de predicción y una subred de objetivo, donde la subred de predicción se utiliza para predecir los modos de partición de la unidad de codificación de la intra-predicción y la subred de objetivo está diseñada para optimizar los parámetros de la red evaluando el costo de tasa-distorsión, respectivamente. Para equilibrar la precisión de la predicción y la pérdida de tasa-distorsión, se aplica una estrategia de intercambio de parámetros para controlar el intercambio de parámetros entre las dos redes. Los resultados experimentales demuestran que nuestro modelo puede reducir el tiempo de codificación de HEVC en un 55.83~71.72% con un eficiente BD-BR de 2.876~3.347%, y el estudio de ablación evalúa la capacidad de nuestra estrategia para equilibrar la compensación entre la precisión de codificación y la velocidad de inferencia.