Generación de Modelos 3D para la Detección Basada en UAV de Residuos de Botellas de Plástico PET Riparias: Integrando Redes Sociales Locales e InstantMesh
Autores: Pan, Shijun; Yoshida, Keisuke; Shimoe, Daichi; Kojima, Takashi; Nishiyama, Satoshi
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Generación de Modelos 3D para la Detección Basada en UAV de Residuos de Botellas de Plástico PET Riparias: Integrando Redes Sociales Locales e InstantMesh
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Contaminación por desechos
Algoritmos de aprendizaje profundo
Enfoque de generación de datos
Modelos de detección de objetos
Datos de entrenamiento
Contenido generado por inteligencia artificial
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En los últimos años, la contaminación por residuos se ha convertido en una grave amenaza para los entornos ribereños en todo el mundo. Junto con el avance de los algoritmos de aprendizaje profundo (DL) (es decir, modelos de detección de objetos), las técnicas relacionadas se han vuelto útiles para aplicaciones prácticas. Este trabajo intenta desarrollar un enfoque de generación de datos para generar conjuntos de datos para el reconocimiento de pequeños objetivos, especialmente para el reconocimiento en imágenes de teledetección. Un punto relevante es que la similitud entre los datos utilizados para el entrenamiento del modelo y los datos utilizados para las pruebas es crucialmente importante para el rendimiento del modelo de detección de objetos. Por lo tanto, obtener datos de entrenamiento con alta similitud a los objetos monitoreados es un objetivo clave de este estudio. Actualmente, el Contenido Generado por Inteligencia Artificial (AIGC), como los objetos de un solo objetivo generados por Luma AI, es una fuente de datos prometedora para modelos de detección de objetos basados en DL. Sin embargo, la mayoría de los datos de entrenamiento que respaldan los resultados generados no provienen de Japón. En consecuencia, los datos generados son menos similares a los objetos monitoreados en Japón, teniendo, por ejemplo, diferentes colores de etiquetas, formas y diseños. Para este estudio, los autores desarrollaron un enfoque de generación de datos combinando redes sociales (Clean-Up Okayama) y algoritmos de generación de modelos 3D basados en imágenes individuales (por ejemplo, InstantMesh) para proporcionar una referencia confiable para futuras generaciones de datos localizados. El modelo YOLOv8 entrenado en esta investigación, obtenido del conjunto de datos AIGC S2PS (Similar to Practical Situation), produjo resultados alentadores (altas puntuaciones F1, aproximadamente 0.9) en tareas de identificación de residuos de botellas PET ribereñas basadas en UAV en escenarios controlados. Los resultados de este estudio muestran el potencial del AIGC para complementar o reemplazar la recolección de datos del mundo real y reducir la carga de trabajo en el sitio.
Descripción
En los últimos años, la contaminación por residuos se ha convertido en una grave amenaza para los entornos ribereños en todo el mundo. Junto con el avance de los algoritmos de aprendizaje profundo (DL) (es decir, modelos de detección de objetos), las técnicas relacionadas se han vuelto útiles para aplicaciones prácticas. Este trabajo intenta desarrollar un enfoque de generación de datos para generar conjuntos de datos para el reconocimiento de pequeños objetivos, especialmente para el reconocimiento en imágenes de teledetección. Un punto relevante es que la similitud entre los datos utilizados para el entrenamiento del modelo y los datos utilizados para las pruebas es crucialmente importante para el rendimiento del modelo de detección de objetos. Por lo tanto, obtener datos de entrenamiento con alta similitud a los objetos monitoreados es un objetivo clave de este estudio. Actualmente, el Contenido Generado por Inteligencia Artificial (AIGC), como los objetos de un solo objetivo generados por Luma AI, es una fuente de datos prometedora para modelos de detección de objetos basados en DL. Sin embargo, la mayoría de los datos de entrenamiento que respaldan los resultados generados no provienen de Japón. En consecuencia, los datos generados son menos similares a los objetos monitoreados en Japón, teniendo, por ejemplo, diferentes colores de etiquetas, formas y diseños. Para este estudio, los autores desarrollaron un enfoque de generación de datos combinando redes sociales (Clean-Up Okayama) y algoritmos de generación de modelos 3D basados en imágenes individuales (por ejemplo, InstantMesh) para proporcionar una referencia confiable para futuras generaciones de datos localizados. El modelo YOLOv8 entrenado en esta investigación, obtenido del conjunto de datos AIGC S2PS (Similar to Practical Situation), produjo resultados alentadores (altas puntuaciones F1, aproximadamente 0.9) en tareas de identificación de residuos de botellas PET ribereñas basadas en UAV en escenarios controlados. Los resultados de este estudio muestran el potencial del AIGC para complementar o reemplazar la recolección de datos del mundo real y reducir la carga de trabajo en el sitio.