Reconocimiento Semántico de Escenas Basado en Modelo de Tema de Probabilidad
Autores: Feng, Jiangfan; Fu, Amin
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Reconocimiento Semántico de Escenas Basado en Modelo de Tema de Probabilidad
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Reconocimiento semántico de escenas
Reconocimiento semántico de imágenes
Asignación de Dirichlet latente
Redes neuronales convolucionales
Características profundas
DF-LDA
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En los últimos años, el reconocimiento semántico de escenas se ha convertido en el tema de investigación más emocionante y de más rápido crecimiento. Por lo tanto, se han propuesto muchos métodos de análisis semántico de escenas para una mejor interpretación del contenido de las escenas. Al utilizar la asignación de Dirichlet latente (LDA) para deducir las características temáticas efectivas, la precisión del reconocimiento semántico de imágenes ha mejorado significativamente. Además, el método de extracción de características profundas mediante un cálculo iterativo capa por capa utilizando redes neuronales convolucionales (CNN) ha logrado un gran éxito en el reconocimiento de imágenes. El artículo propone un método llamado DF-LDA, que es un método híbrido supervisado-no supervisado que combina CNN con LDA para extraer temas de imágenes. Este método utiliza CNN para explorar características visuales que son más adecuadas para imágenes de escenas y agrupa las características de semánticas salientes en temas visuales a través de modelos temáticos. En contraste con la LDA como herramienta para simplemente extraer semánticas de imágenes, nuestro enfoque logra un mejor rendimiento en tres conjuntos de datos que contienen varias categorías de escenas.
Descripción
En los últimos años, el reconocimiento semántico de escenas se ha convertido en el tema de investigación más emocionante y de más rápido crecimiento. Por lo tanto, se han propuesto muchos métodos de análisis semántico de escenas para una mejor interpretación del contenido de las escenas. Al utilizar la asignación de Dirichlet latente (LDA) para deducir las características temáticas efectivas, la precisión del reconocimiento semántico de imágenes ha mejorado significativamente. Además, el método de extracción de características profundas mediante un cálculo iterativo capa por capa utilizando redes neuronales convolucionales (CNN) ha logrado un gran éxito en el reconocimiento de imágenes. El artículo propone un método llamado DF-LDA, que es un método híbrido supervisado-no supervisado que combina CNN con LDA para extraer temas de imágenes. Este método utiliza CNN para explorar características visuales que son más adecuadas para imágenes de escenas y agrupa las características de semánticas salientes en temas visuales a través de modelos temáticos. En contraste con la LDA como herramienta para simplemente extraer semánticas de imágenes, nuestro enfoque logra un mejor rendimiento en tres conjuntos de datos que contienen varias categorías de escenas.