logo móvil
Contáctanos

Una encuesta completa de transformadores para la visión por computadora

Autores: Jamil, Sonain; Jalil Piran, Md.; Kwon, Oh-Jin

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Una encuesta completa de transformadores para la visión por computadora


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Transformador
Visión
Aplicaciones
Redes neuronales convolucionales
ViTs
Clasificación de imágenes

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Como un tipo especial de transformador, los transformadores de visión (ViTs) se pueden utilizar para diversas aplicaciones de visión por computadora (CV). Las redes neuronales convolucionales (CNNs) tienen varios problemas potenciales que pueden resolverse con ViTs. Para tareas de codificación de imágenes como compresión, superresolución, segmentación y eliminación de ruido, se utilizan diferentes variantes de ViTs. En nuestra encuesta, determinamos las muchas aplicaciones de CV a las que son aplicables los ViTs. Las aplicaciones de CV revisadas incluyeron clasificación de imágenes, detección de objetos, segmentación de imágenes, compresión de imágenes, superresolución de imágenes, eliminación de ruido de imágenes, detección de anomalías e imágenes de drones. Revisamos el estado del arte y compilamos una lista de modelos disponibles y discutimos los pros y los contras de cada modelo.

Otros recursos que podrían interesarte

Temas Virtualpro