Jerárquico aprendizaje por refuerzo basado en selección adaptativa inicial de QP y control de tasa para H.266/VVC
Autores: He, Shuqian; Jin, Biao; Tian, Shangneng; Liu, Jiayu; Deng, Zhengjie; Shi, Chun
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Jerárquico aprendizaje por refuerzo basado en selección adaptativa inicial de QP y control de tasa para H.266/VVC
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Codificación de video
Control de tasa
Parámetro de cuantización inicial
Selección adaptativa
Aprendizaje por refuerzo
Condiciones de red
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 42
Citaciones: Sin citaciones
En el control de tasa de codificación de video, la selección adaptativa del parámetro de cuantificación inicial (QP) es un factor crítico que afecta tanto la calidad de codificación como la precisión del control de tasa. Debido a la diversidad de contenido de video y la naturaleza dinámica de las condiciones de red, determinar de manera precisa y eficiente el QP inicial sigue siendo un desafío significativo. La configuración óptima del QP inicial no solo influye en las estrategias de asignación de bitrate, sino que también impacta en la eficiencia de codificación y la calidad de salida del codificador. Para abordar este problema en el estándar H.266/VVC, este documento propone un método novedoso basado en aprendizaje por refuerzo jerárquico para la selección adaptativa del QP inicial. El método propuesto introduce un marco de aprendizaje por refuerzo jerárquico que descompone la tarea de selección de QP inicial en estrategias de alto y bajo nivel, manejando decisiones de QP a nivel grueso y fino, respectivamente. La estrategia de alto nivel determina rápidamente un rango de QP aproximado basado en características globales del video y condiciones de red, mientras que la estrategia de bajo nivel perfecciona el valor específico de QP dentro de este rango para mejorar la precisión de la decisión. Este marco integra complejidad de video espacio-temporal, condiciones de red y objetivos de control de tasa para formar un modelo optimizado para la selección adaptativa del QP inicial. Los resultados experimentales demuestran que el método propuesto mejora significativamente la calidad de codificación y la precisión del control de tasa en comparación con métodos tradicionales, confirmando su efectividad en el manejo de contenido de video complejo y entornos de red dinámicos.
Descripción
En el control de tasa de codificación de video, la selección adaptativa del parámetro de cuantificación inicial (QP) es un factor crítico que afecta tanto la calidad de codificación como la precisión del control de tasa. Debido a la diversidad de contenido de video y la naturaleza dinámica de las condiciones de red, determinar de manera precisa y eficiente el QP inicial sigue siendo un desafío significativo. La configuración óptima del QP inicial no solo influye en las estrategias de asignación de bitrate, sino que también impacta en la eficiencia de codificación y la calidad de salida del codificador. Para abordar este problema en el estándar H.266/VVC, este documento propone un método novedoso basado en aprendizaje por refuerzo jerárquico para la selección adaptativa del QP inicial. El método propuesto introduce un marco de aprendizaje por refuerzo jerárquico que descompone la tarea de selección de QP inicial en estrategias de alto y bajo nivel, manejando decisiones de QP a nivel grueso y fino, respectivamente. La estrategia de alto nivel determina rápidamente un rango de QP aproximado basado en características globales del video y condiciones de red, mientras que la estrategia de bajo nivel perfecciona el valor específico de QP dentro de este rango para mejorar la precisión de la decisión. Este marco integra complejidad de video espacio-temporal, condiciones de red y objetivos de control de tasa para formar un modelo optimizado para la selección adaptativa del QP inicial. Los resultados experimentales demuestran que el método propuesto mejora significativamente la calidad de codificación y la precisión del control de tasa en comparación con métodos tradicionales, confirmando su efectividad en el manejo de contenido de video complejo y entornos de red dinámicos.