La atención cruzada y la sustitución perfecta de indicaciones latentes para la edición de video impulsada por imágenes de alta definición
Autores: Zhao, Liangbing; Zhang, Zicheng; Nie, Xuecheng; Liu, Luoqi; Liu, Si
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
La atención cruzada y la sustitución perfecta de indicaciones latentes para la edición de video impulsada por imágenes de alta definición
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Edición de video impulsada por texto
Modelo de texto a imagen
Edición de video impulsada por imagen de indicación latente (LIVE)
Códigos latentes
Imágenes de referencia
Detalles visuales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Recientemente, la edición de video basada en texto ha recibido cada vez más atención debido al sorprendente éxito del modelo de texto a imagen en la mejora de la calidad del video. Sin embargo, la edición de video basada en la indicación de texto enfrenta enormes desafíos para lograr una edición precisa y controlable. Por lo tanto, LIVE puede generar eficientemente varios videos editados con consistencia visual reemplazando sin problemas los objetos en cada fotograma con objetivos especificados por el usuario.
Descripción
Recientemente, la edición de video basada en texto ha recibido cada vez más atención debido al sorprendente éxito del modelo de texto a imagen en la mejora de la calidad del video. Sin embargo, la edición de video basada en la indicación de texto enfrenta enormes desafíos para lograr una edición precisa y controlable. Por lo tanto, LIVE puede generar eficientemente varios videos editados con consistencia visual reemplazando sin problemas los objetos en cada fotograma con objetivos especificados por el usuario.