Jerárquico aprendizaje por refuerzo basado en selección adaptativa inicial de QP y control de tasa para H.266/VVC

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Jerárquico aprendizaje por refuerzo basado en selección adaptativa inicial de QP y control de tasa para H.266/VVC

Autores: He, Shuqian; Jin, Biao; Tian, Shangneng; Liu, Jiayu; Deng, Zhengjie; Shi, Chun

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Jerárquico aprendizaje por refuerzo basado en selección adaptativa inicial de QP y control de tasa para H.266/VVC

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Codificación de video

Control de tasa

Parámetro de cuantización inicial

Selección adaptativa

Aprendizaje por refuerzo

Condiciones de red

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 42

Citaciones: Sin citaciones

En el control de tasa de codificación de video, la selección adaptativa del parámetro de cuantificación inicial (QP) es un factor crítico que afecta tanto la calidad de codificación como la precisión del control de tasa. Debido a la diversidad de contenido de video y la naturaleza dinámica de las condiciones de red, determinar de manera precisa y eficiente el QP inicial sigue siendo un desafío significativo. La configuración óptima del QP inicial no solo influye en las estrategias de asignación de bitrate, sino que también impacta en la eficiencia de codificación y la calidad de salida del codificador. Para abordar este problema en el estándar H.266/VVC, este documento propone un método novedoso basado en aprendizaje por refuerzo jerárquico para la selección adaptativa del QP inicial. El método propuesto introduce un marco de aprendizaje por refuerzo jerárquico que descompone la tarea de selección de QP inicial en estrategias de alto y bajo nivel, manejando decisiones de QP a nivel grueso y fino, respectivamente. La estrategia de alto nivel determina rápidamente un rango de QP aproximado basado en características globales del video y condiciones de red, mientras que la estrategia de bajo nivel perfecciona el valor específico de QP dentro de este rango para mejorar la precisión de la decisión. Este marco integra complejidad de video espacio-temporal, condiciones de red y objetivos de control de tasa para formar un modelo optimizado para la selección adaptativa del QP inicial. Los resultados experimentales demuestran que el método propuesto mejora significativamente la calidad de codificación y la precisión del control de tasa en comparación con métodos tradicionales, confirmando su efectividad en el manejo de contenido de video complejo y entornos de red dinámicos.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro