Cnn variantes para visión por computadora: historia, arquitectura, aplicación, desafíos y alcance futuro
Autores: Bhatt, Dulari; Patel, Chirag; Talsania, Hardik; Patel, Jigar; Vaghela, Rasmika; Pandya, Sharnil; Modi, Kirit; Ghayvat, Hemant
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Cnn variantes para visión por computadora: historia, arquitectura, aplicación, desafíos y alcance futuro
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Visión por computadora
Cnn profunda
Reconocimiento de objetos
Arquitectura
Información espacial
Aplicaciones de cnn
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
La visión por computadora se está convirtiendo en una palabra cada vez más de moda en el área del procesamiento de imágenes. Con la aparición de aplicaciones de visión por computadora, hay una demanda significativa para reconocer objetos automáticamente. La CNN profunda (red neuronal convolucional) ha beneficiado a la comunidad de visión por computadora al producir excelentes resultados en el procesamiento de video, reconocimiento de objetos, clasificación y segmentación de imágenes, procesamiento del lenguaje natural, reconocimiento de voz y muchos otros campos. Además, la introducción de grandes cantidades de datos y hardware fácilmente disponible ha abierto nuevas vías para el estudio de las CNN. Se han investigado varios conceptos inspiradores para el progreso de las CNN, incluidas funciones de activación alternativas, regularización, optimización de parámetros y avances arquitectónicos. Además, lograr innovaciones en la arquitectura resulta en una mejora tremenda en la capacidad de la CNN profunda. Se ha dado un énfasis significativo a aprovechar la información de canal y espacial, con una profundidad de arquitectura y procesamiento de información a través de múltiples vías. Este artículo de revisión se centra principalmente en la taxonomía primaria y las arquitecturas de CNN profundas recientemente lanzadas, y divide numerosos desarrollos recientes en arquitecturas de CNN en ocho grupos. La explotación espacial, multipath, profundidad, amplitud, dimensión, impulso de canal, explotación de mapas de características y CNN basada en atención son las ocho categorías. La principal contribución de este manuscrito está en comparar varias evoluciones arquitectónicas en CNN por su cambio arquitectónico, fortalezas y debilidades. Además, también incluye una explicación de los componentes de la CNN, las fortalezas y debilidades de varias variantes de CNN, brechas de investigación o desafíos abiertos, aplicaciones de CNN y la dirección futura de la investigación.
Descripción
La visión por computadora se está convirtiendo en una palabra cada vez más de moda en el área del procesamiento de imágenes. Con la aparición de aplicaciones de visión por computadora, hay una demanda significativa para reconocer objetos automáticamente. La CNN profunda (red neuronal convolucional) ha beneficiado a la comunidad de visión por computadora al producir excelentes resultados en el procesamiento de video, reconocimiento de objetos, clasificación y segmentación de imágenes, procesamiento del lenguaje natural, reconocimiento de voz y muchos otros campos. Además, la introducción de grandes cantidades de datos y hardware fácilmente disponible ha abierto nuevas vías para el estudio de las CNN. Se han investigado varios conceptos inspiradores para el progreso de las CNN, incluidas funciones de activación alternativas, regularización, optimización de parámetros y avances arquitectónicos. Además, lograr innovaciones en la arquitectura resulta en una mejora tremenda en la capacidad de la CNN profunda. Se ha dado un énfasis significativo a aprovechar la información de canal y espacial, con una profundidad de arquitectura y procesamiento de información a través de múltiples vías. Este artículo de revisión se centra principalmente en la taxonomía primaria y las arquitecturas de CNN profundas recientemente lanzadas, y divide numerosos desarrollos recientes en arquitecturas de CNN en ocho grupos. La explotación espacial, multipath, profundidad, amplitud, dimensión, impulso de canal, explotación de mapas de características y CNN basada en atención son las ocho categorías. La principal contribución de este manuscrito está en comparar varias evoluciones arquitectónicas en CNN por su cambio arquitectónico, fortalezas y debilidades. Además, también incluye una explicación de los componentes de la CNN, las fortalezas y debilidades de varias variantes de CNN, brechas de investigación o desafíos abiertos, aplicaciones de CNN y la dirección futura de la investigación.