ConVision Benchmark: un marco contemporáneo para comparar modelos CNN y ViT
Autores: Bangalore Vijayakumar, Shreyas; Chitty-Venkata, Krishna Teja; Arya, Kanishk; Somani, Arun K.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
ConVision Benchmark: un marco contemporáneo para comparar modelos CNN y ViT
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Redes neuronales convolucionales
Transformadores de visión
Visión por computadora
Evaluación comparativa
Marcos de aprendizaje profundo
Clasificación de imágenes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Las Redes Neuronales Convolucionales (CNNs) y los Transformadores de Visión (ViTs) han mostrado un rendimiento notable en tareas de visión por computadora, incluyendo la detección de objetos y el reconocimiento de imágenes.
Descripción
Las Redes Neuronales Convolucionales (CNNs) y los Transformadores de Visión (ViTs) han mostrado un rendimiento notable en tareas de visión por computadora, incluyendo la detección de objetos y el reconocimiento de imágenes.