Determinando umbrales para la transformación discreta del coseno adaptativa óptima
Autores: Khanov, Alexander; Shulzhenko, Anastasija; Voroshilova, Anzhelika; Zubarev, Alexander; Karimov, Timur; Fahmi, Shakeeb
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Determinando umbrales para la transformación discreta del coseno adaptativa óptima
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Transformada discreta del coseno
Compresión de imagen
DCT adaptativa
Algoritmos de búsqueda de umbrales
Distribución tonal
Ratio de compresión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
La transformada discreta del coseno (DCT) se utiliza ampliamente para la compresión de imágenes y videos. Algoritmos con pérdida como JPEG, WebP, BPG y muchos otros se basan en ella. Se han desarrollado múltiples modificaciones de la DCT para mejorar su rendimiento. Una de ellas es la DCT adaptativa (ADCT) diseñada para manejar la estructura heterogénea de la imagen y puede encontrarse, por ejemplo, en el códec de video HEVC. La adaptabilidad significa que la imagen se divide en una cuadrícula desigual de cuadrados: los más pequeños retienen mejor la información sobre los detalles, mientras que los cuadrados más grandes son eficientes para los fondos homogéneos. El uso práctico de los algoritmos de DCT adaptativos se ve complicado por la falta de algoritmos de búsqueda de umbral óptimos para los procedimientos de partición de imágenes. En este documento, proponemos un método novedoso para la búsqueda de umbral óptimo en ADCT utilizando una métrica basada en la distribución tonal. Definimos dos umbrales: , el umbral que define el color sólido medio, y , que define la división de fragmentos del quadtree. En nuestro algoritmo, los valores de estos umbrales se calculan mediante funciones polinómicas de la distribución tonal de una imagen o fragmento en particular. Los coeficientes polinómicos se determinan utilizando el procedimiento de optimización dedicado en el conjunto de datos que contiene imágenes del dominio específico, escenas de carreteras urbanas en nuestro caso. En la parte experimental del estudio, mostramos que ADCT permite una mayor relación de compresión en comparación con la DCT no adaptativa al mismo nivel de pérdida de calidad, hasta un 66% para una calidad aceptable. El algoritmo propuesto puede utilizarse directamente para la compresión de imágenes, o como núcleo de un marco de compresión de video en aplicaciones con alta demanda de tráfico, como sistemas de videovigilancia urbanos.
Descripción
La transformada discreta del coseno (DCT) se utiliza ampliamente para la compresión de imágenes y videos. Algoritmos con pérdida como JPEG, WebP, BPG y muchos otros se basan en ella. Se han desarrollado múltiples modificaciones de la DCT para mejorar su rendimiento. Una de ellas es la DCT adaptativa (ADCT) diseñada para manejar la estructura heterogénea de la imagen y puede encontrarse, por ejemplo, en el códec de video HEVC. La adaptabilidad significa que la imagen se divide en una cuadrícula desigual de cuadrados: los más pequeños retienen mejor la información sobre los detalles, mientras que los cuadrados más grandes son eficientes para los fondos homogéneos. El uso práctico de los algoritmos de DCT adaptativos se ve complicado por la falta de algoritmos de búsqueda de umbral óptimos para los procedimientos de partición de imágenes. En este documento, proponemos un método novedoso para la búsqueda de umbral óptimo en ADCT utilizando una métrica basada en la distribución tonal. Definimos dos umbrales: , el umbral que define el color sólido medio, y , que define la división de fragmentos del quadtree. En nuestro algoritmo, los valores de estos umbrales se calculan mediante funciones polinómicas de la distribución tonal de una imagen o fragmento en particular. Los coeficientes polinómicos se determinan utilizando el procedimiento de optimización dedicado en el conjunto de datos que contiene imágenes del dominio específico, escenas de carreteras urbanas en nuestro caso. En la parte experimental del estudio, mostramos que ADCT permite una mayor relación de compresión en comparación con la DCT no adaptativa al mismo nivel de pérdida de calidad, hasta un 66% para una calidad aceptable. El algoritmo propuesto puede utilizarse directamente para la compresión de imágenes, o como núcleo de un marco de compresión de video en aplicaciones con alta demanda de tráfico, como sistemas de videovigilancia urbanos.