Un estudio sobre el aprendizaje profundo en la detección de polaridad de imágenes: equilibrando el rendimiento de generalización y los costos computacionales
Autores: Ragusa, Edoardo; Cambria, Erik; Zunino, Rodolfo; Gastaldo, Paolo
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Un estudio sobre el aprendizaje profundo en la detección de polaridad de imágenes: equilibrando el rendimiento de generalización y los costos computacionales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Redes neuronales convolucionales
Detección de polaridad de imágenes
Técnicas de aprendizaje por transferencia
CNN pre-entrenadas
Unidad de clasificación
Ajuste fino
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
Las redes neuronales convolucionales profundas (CNNs) proporcionan una herramienta efectiva para extraer información compleja de las imágenes. En el área de detección de polaridad de imágenes, las CNNs suelen utilizarse en combinación con técnicas de aprendizaje por transferencia para abordar un problema importante: la falta de conjuntos grandes de datos etiquetados. Por lo tanto, los predictores de polaridad en general explotan una CNN pre-entrenada como extractor de características que a su vez alimenta a una unidad de clasificación. Mientras que esta última unidad se entrena desde cero, la CNN pre-entrenada está sujeta a un ajuste fino. Como resultado, la arquitectura específica de la CNN empleada como extractor de características afecta significativamente el rendimiento general del modelo. Este documento analiza la literatura de vanguardia sobre detección de polaridad de imágenes e identifica las arquitecturas de CNN más confiables. Además, el documento proporciona un protocolo experimental que debería permitir evaluar el papel desempeñado por la arquitectura base en la tarea de detección de polaridad. El rendimiento se evalúa en términos de habilidades de generalización y complejidad computacional. Este último atributo se vuelve crítico ya que los predictores de polaridad, en la era de las redes sociales, podrían necesitar ser actualizados en cuestión de horas o incluso minutos. En este sentido, el documento ofrece consejos prácticos sobre las ventajas y desventajas de las arquitecturas examinadas tanto en términos de generalización como de costo computacional.
Descripción
Las redes neuronales convolucionales profundas (CNNs) proporcionan una herramienta efectiva para extraer información compleja de las imágenes. En el área de detección de polaridad de imágenes, las CNNs suelen utilizarse en combinación con técnicas de aprendizaje por transferencia para abordar un problema importante: la falta de conjuntos grandes de datos etiquetados. Por lo tanto, los predictores de polaridad en general explotan una CNN pre-entrenada como extractor de características que a su vez alimenta a una unidad de clasificación. Mientras que esta última unidad se entrena desde cero, la CNN pre-entrenada está sujeta a un ajuste fino. Como resultado, la arquitectura específica de la CNN empleada como extractor de características afecta significativamente el rendimiento general del modelo. Este documento analiza la literatura de vanguardia sobre detección de polaridad de imágenes e identifica las arquitecturas de CNN más confiables. Además, el documento proporciona un protocolo experimental que debería permitir evaluar el papel desempeñado por la arquitectura base en la tarea de detección de polaridad. El rendimiento se evalúa en términos de habilidades de generalización y complejidad computacional. Este último atributo se vuelve crítico ya que los predictores de polaridad, en la era de las redes sociales, podrían necesitar ser actualizados en cuestión de horas o incluso minutos. En este sentido, el documento ofrece consejos prácticos sobre las ventajas y desventajas de las arquitecturas examinadas tanto en términos de generalización como de costo computacional.