logo móvil
Contáctanos

Jerárquico aprendizaje por refuerzo basado en selección adaptativa inicial de QP y control de tasa para H.266/VVC

Autores: He, Shuqian; Jin, Biao; Tian, Shangneng; Liu, Jiayu; Deng, Zhengjie; Shi, Chun

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Jerárquico aprendizaje por refuerzo basado en selección adaptativa inicial de QP y control de tasa para H.266/VVC


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Codificación de video
Control de tasa
Parámetro de cuantización inicial
Selección adaptativa
Aprendizaje por refuerzo
Condiciones de red

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 42

Citaciones: Sin citaciones


Descripción
En el control de tasa de codificación de video, la selección adaptativa del parámetro de cuantificación inicial (QP) es un factor crítico que afecta tanto la calidad de codificación como la precisión del control de tasa. Debido a la diversidad de contenido de video y la naturaleza dinámica de las condiciones de red, determinar de manera precisa y eficiente el QP inicial sigue siendo un desafío significativo. La configuración óptima del QP inicial no solo influye en las estrategias de asignación de bitrate, sino que también impacta en la eficiencia de codificación y la calidad de salida del codificador. Para abordar este problema en el estándar H.266/VVC, este documento propone un método novedoso basado en aprendizaje por refuerzo jerárquico para la selección adaptativa del QP inicial. El método propuesto introduce un marco de aprendizaje por refuerzo jerárquico que descompone la tarea de selección de QP inicial en estrategias de alto y bajo nivel, manejando decisiones de QP a nivel grueso y fino, respectivamente. La estrategia de alto nivel determina rápidamente un rango de QP aproximado basado en características globales del video y condiciones de red, mientras que la estrategia de bajo nivel perfecciona el valor específico de QP dentro de este rango para mejorar la precisión de la decisión. Este marco integra complejidad de video espacio-temporal, condiciones de red y objetivos de control de tasa para formar un modelo optimizado para la selección adaptativa del QP inicial. Los resultados experimentales demuestran que el método propuesto mejora significativamente la calidad de codificación y la precisión del control de tasa en comparación con métodos tradicionales, confirmando su efectividad en el manejo de contenido de video complejo y entornos de red dinámicos.

Otros recursos que podrían interesarte

Temas Virtualpro