Una encuesta completa de transformadores para la visión por computadora
Autores: Jamil, Sonain; Jalil Piran, Md.; Kwon, Oh-Jin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Una encuesta completa de transformadores para la visión por computadora
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Transformador
Visión
Aplicaciones
Redes neuronales convolucionales
ViTs
Clasificación de imágenes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Como un tipo especial de transformador, los transformadores de visión (ViTs) se pueden utilizar para diversas aplicaciones de visión por computadora (CV). Las redes neuronales convolucionales (CNNs) tienen varios problemas potenciales que pueden resolverse con ViTs. Para tareas de codificación de imágenes como compresión, superresolución, segmentación y eliminación de ruido, se utilizan diferentes variantes de ViTs. En nuestra encuesta, determinamos las muchas aplicaciones de CV a las que son aplicables los ViTs. Las aplicaciones de CV revisadas incluyeron clasificación de imágenes, detección de objetos, segmentación de imágenes, compresión de imágenes, superresolución de imágenes, eliminación de ruido de imágenes, detección de anomalías e imágenes de drones. Revisamos el estado del arte y compilamos una lista de modelos disponibles y discutimos los pros y los contras de cada modelo.
Descripción
Como un tipo especial de transformador, los transformadores de visión (ViTs) se pueden utilizar para diversas aplicaciones de visión por computadora (CV). Las redes neuronales convolucionales (CNNs) tienen varios problemas potenciales que pueden resolverse con ViTs. Para tareas de codificación de imágenes como compresión, superresolución, segmentación y eliminación de ruido, se utilizan diferentes variantes de ViTs. En nuestra encuesta, determinamos las muchas aplicaciones de CV a las que son aplicables los ViTs. Las aplicaciones de CV revisadas incluyeron clasificación de imágenes, detección de objetos, segmentación de imágenes, compresión de imágenes, superresolución de imágenes, eliminación de ruido de imágenes, detección de anomalías e imágenes de drones. Revisamos el estado del arte y compilamos una lista de modelos disponibles y discutimos los pros y los contras de cada modelo.