logo móvil
Contáctanos

Estimación de escalera de tasa de bits adaptativa al contenido en codificación de video de alta eficiencia utilizando resoluciones espacio-temporales

Autores: uljug, Jelena; Rimac-Drlje, Snjeana

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Estimación de escalera de tasa de bits adaptativa al contenido en codificación de video de alta eficiencia utilizando resoluciones espacio-temporales


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Transmisión de video
Escalera de bits
Transmisión adaptativa de HTTP
Características espacio-temporales
Red neuronal
Aumento de datos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 48

Citaciones: Sin citaciones


Descripción
El constante aumento en el tráfico de Internet multimedia en forma de transmisión de video requiere nuevas soluciones para una codificación de video eficiente que ahorre ancho de banda y recursos de red. La transmisión adaptativa de HTTP (HAS), la solución más ampliamente utilizada para la transmisión de video, permite al cliente seleccionar de forma adaptativa la velocidad de bits de acuerdo a las condiciones de transmisión. Con este fin, se generan múltiples presentaciones del mismo contenido de video en el servidor de video, que contiene secuencias de video codificadas a diferentes velocidades de bits con ajuste de resolución para lograr la mejor Calidad de Experiencia (QoE). Este conjunto de pares de velocidad de bits y resolución se llama escalera de velocidad de bits. Además del esquema tradicional de talla única para la escalera de velocidad de bits, recientemente se han propuesto soluciones sensibles al contexto que permiten pares óptimos de velocidad de bits y resolución para secuencias de video de diferente complejidad. Sin embargo, estas soluciones solo utilizan la resolución espacial para la optimización, mientras que la selección de la combinación óptima de resolución espacial y temporal para una velocidad de bits dada no ha sido suficientemente investigada. Este documento propone la optimización de la escalera de bits considerando características espacio-temporales de las secuencias de video y el uso de resolución espacial y temporal óptima relacionada con la complejidad del contenido de video. La optimización a lo largo de dos dimensiones de resolución aumenta significativamente la complejidad del problema y el enfoque de codificación intensiva para todas las resoluciones espaciales y temporales en un amplio rango de velocidades de bits, para cada secuencia de video, no es factible en tiempo real. Con el fin de reducir el nivel de complejidad, proponemos una ampliación de datos utilizando un modelo basado en una red neuronal (NN). Para entrenar el modelo NN, utilizamos siete secuencias de video de diferente complejidad de contenido, codificadas con el codificador HEVC a cinco resoluciones espaciales diferentes (SR) de hasta 4K. Además, todas las secuencias de video se codificaron utilizando cuatro velocidades de fotogramas de hasta 120 fps, presentando diferentes resoluciones temporales (TR). El Índice de Similitud Estructural (SSIM) se utiliza como una métrica objetiva de calidad de video. Después de la ampliación de datos, proponemos modelos NN que estiman los valores óptimos de TR y velocidad de bits como puntos de cambio a una SR más alta. Estos resultados pueden ser utilizados posteriormente como parámetros de entrada para la construcción de la escalera de velocidad de bits para secuencias de video de una cierta complejidad.

Otros recursos que podrían interesarte

Temas Virtualpro