Técnicas avanzadas de aprendizaje profundo para la generación de imágenes térmicas sintéticas de alta calidad
Autores: Pavez, Vicente; Hermosilla, Gabriel; Silva, Manuel; Farias, Gonzalo
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Técnicas avanzadas de aprendizaje profundo para la generación de imágenes térmicas sintéticas de alta calidad
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Metodologías de aprendizaje profundo
Imágenes faciales térmicas sintéticas
Modelo de Difusión Estable
Transformador de Visión
Diseñador de Indicaciones
Base de datos de imágenes faciales térmicas sintéticas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
En este documento, presentamos un sistema de vanguardia que aprovecha metodologías de aprendizaje profundo de última generación para generar imágenes faciales térmicas sintéticas de alta calidad. Nuestro enfoque único integra un Modelo de Difusión Estable ajustado térmicamente con un clasificador Vision Transformer (ViT), complementado por un Diseñador de Indicaciones y una Base de Datos de Indicaciones para un control preciso de la generación de imágenes. A través de pruebas rigurosas en varios escenarios, el sistema demuestra su capacidad para producir imágenes térmicas precisas y de alta calidad. Una contribución clave de nuestro trabajo es el desarrollo de una base de datos de imágenes faciales térmicas sintéticas, que ofrece utilidad práctica para entrenar modelos de detección térmica. La eficacia de nuestras imágenes sintéticas fue validada utilizando un modelo de detección facial, logrando resultados comparables a imágenes faciales térmicas reales. Específicamente, un detector ajustado con imágenes térmicas reales logró una tasa de precisión del 97% cuando se probó con nuestras imágenes sintéticas, mientras que un detector entrenado exclusivamente con nuestros datos sintéticos logró una precisión del 98%. Esta investigación marca un avance significativo en la síntesis de imágenes térmicas, allanando el camino para su aplicación más amplia en diversos escenarios del mundo real.
Descripción
En este documento, presentamos un sistema de vanguardia que aprovecha metodologías de aprendizaje profundo de última generación para generar imágenes faciales térmicas sintéticas de alta calidad. Nuestro enfoque único integra un Modelo de Difusión Estable ajustado térmicamente con un clasificador Vision Transformer (ViT), complementado por un Diseñador de Indicaciones y una Base de Datos de Indicaciones para un control preciso de la generación de imágenes. A través de pruebas rigurosas en varios escenarios, el sistema demuestra su capacidad para producir imágenes térmicas precisas y de alta calidad. Una contribución clave de nuestro trabajo es el desarrollo de una base de datos de imágenes faciales térmicas sintéticas, que ofrece utilidad práctica para entrenar modelos de detección térmica. La eficacia de nuestras imágenes sintéticas fue validada utilizando un modelo de detección facial, logrando resultados comparables a imágenes faciales térmicas reales. Específicamente, un detector ajustado con imágenes térmicas reales logró una tasa de precisión del 97% cuando se probó con nuestras imágenes sintéticas, mientras que un detector entrenado exclusivamente con nuestros datos sintéticos logró una precisión del 98%. Esta investigación marca un avance significativo en la síntesis de imágenes térmicas, allanando el camino para su aplicación más amplia en diversos escenarios del mundo real.