Un método de segmentación de imágenes híbridas para una medición precisa de entornos urbanos
Autores: Kim, Hyungjoon; Lee, Jae Ho; Lee, Suan
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un método de segmentación de imágenes híbridas para una medición precisa de entornos urbanos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Campo
Análisis del entorno urbano
Tecnología de segmentación de imágenes
Conjunto de datos
Modelo híbrido
Mapa de segmentación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 55
Citaciones: Sin citaciones
En el campo de la investigación del análisis del entorno urbano, la tecnología de segmentación de imágenes que agrupa objetos importantes en la imagen del paisaje urbano en unidades de píxeles ha sido objeto de una mayor atención. Sin embargo, dado que se requiere un conjunto de datos que consista en una gran cantidad de pares de imágenes y etiquetas para utilizar esta tecnología, en la mayoría de los casos, se utiliza un modelo entrenado con un conjunto de datos que tenga características similares para el análisis, y como resultado, la calidad de la segmentación es pobre. Para superar esta limitación, proponemos un modelo híbrido para aprovechar las fortalezas de cada modelo en la predicción de clases específicas. En particular, primero introducimos una operación de preprocesamiento para reducir las diferencias entre el conjunto de datos urbano recopilado y el conjunto de datos público. Posteriormente, entrenamos varios modelos de segmentación con un conjunto de datos preprocesado y, basándonos en la regla de pesos, fusionamos los resultados de segmentación para crear un mapa de segmentación. Para evaluar nuestra propuesta, recopilamos imágenes de Google Street View que no tienen etiquetas y entrenamos un modelo utilizando el conjunto de datos de cityscapes que contiene primeros planos similares a las imágenes recopiladas. Evaluamos cuantitativamente su rendimiento utilizando el conjunto de datos de cityscapes con verdades de terreno y evaluamos cualitativamente los resultados de la segmentación de datos de GSV a través de estudios de usuarios. Nuestro enfoque superó a los métodos existentes y demostró el potencial para un análisis preciso y eficiente del entorno urbano utilizando la tecnología de visión por computadora.
Descripción
En el campo de la investigación del análisis del entorno urbano, la tecnología de segmentación de imágenes que agrupa objetos importantes en la imagen del paisaje urbano en unidades de píxeles ha sido objeto de una mayor atención. Sin embargo, dado que se requiere un conjunto de datos que consista en una gran cantidad de pares de imágenes y etiquetas para utilizar esta tecnología, en la mayoría de los casos, se utiliza un modelo entrenado con un conjunto de datos que tenga características similares para el análisis, y como resultado, la calidad de la segmentación es pobre. Para superar esta limitación, proponemos un modelo híbrido para aprovechar las fortalezas de cada modelo en la predicción de clases específicas. En particular, primero introducimos una operación de preprocesamiento para reducir las diferencias entre el conjunto de datos urbano recopilado y el conjunto de datos público. Posteriormente, entrenamos varios modelos de segmentación con un conjunto de datos preprocesado y, basándonos en la regla de pesos, fusionamos los resultados de segmentación para crear un mapa de segmentación. Para evaluar nuestra propuesta, recopilamos imágenes de Google Street View que no tienen etiquetas y entrenamos un modelo utilizando el conjunto de datos de cityscapes que contiene primeros planos similares a las imágenes recopiladas. Evaluamos cuantitativamente su rendimiento utilizando el conjunto de datos de cityscapes con verdades de terreno y evaluamos cualitativamente los resultados de la segmentación de datos de GSV a través de estudios de usuarios. Nuestro enfoque superó a los métodos existentes y demostró el potencial para un análisis preciso y eficiente del entorno urbano utilizando la tecnología de visión por computadora.