YOLOv10 Mejorado para Personas con Discapacidad Visual: Equilibrando la Precisión del Modelo y la Eficiencia en el Caso del Transporte Público
Autores: Arifando, Rio; Eto, Shinji; Tibyani, Tibyani; Wada, Chikamune
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
YOLOv10 Mejorado para Personas con Discapacidad Visual: Equilibrando la Precisión del Modelo y la Eficiencia en el Caso del Transporte Público
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Avances
Automatización
Inteligencia artificial
Detección de autobuses
Clasificación de POV
Improved-YOLOv10
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los avances en automatización e inteligencia artificial han impactado significativamente la accesibilidad para las personas con discapacidades visuales, particularmente en el ámbito del transporte público en autobús. La detección efectiva de autobuses y la clasificación del punto de vista (POV) del autobús son cruciales para mejorar la independencia de las personas con discapacidad visual. Este estudio presenta el Improved-YOLOv10, un modelo novedoso diseñado para abordar los desafíos en la identificación de autobuses y la clasificación de POV al integrar la Atención por Coordenadas (CA) y la Convolución de Núcleo Adaptativo (AKConv) en el marco de YOLOv10. El Improved YOLOv10 avanza la arquitectura de YOLOv10 mediante la incorporación de CA, que mejora el modelado de dependencia a largo alcance y la conciencia espacial, y AKConv, que ajusta dinámicamente los núcleos de convolución para una extracción de características superior. Estas mejoras tienen como objetivo mejorar tanto la precisión de detección como la eficiencia, esenciales para aplicaciones en tiempo real en tecnologías asistivas. Los resultados de la evaluación demuestran que el Improved-YOLOv10 ofrece mejoras significativas en el rendimiento de detección, incluyendo mejor precisión, exactitud y recuperación en comparación con YOLOv10. El modelo también exhibe una complejidad computacional y requisitos de almacenamiento reducidos, destacando su eficiencia. Si bien los resultados de clasificación muestran algunos compromisos, con una ligera disminución en la puntuación F1 general, la complejidad de las Operaciones de Punto Flotante Giga (GFLOPs), Parámetros y Peso/MB en el Improved-YOLOv10 sigue siendo ventajosa para tareas de clasificación. Las mejoras arquitectónicas del modelo contribuyen a su robustez y eficiencia, lo que lo convierte en una opción adecuada para aplicaciones en tiempo real y tecnologías asistivas.
Descripción
Los avances en automatización e inteligencia artificial han impactado significativamente la accesibilidad para las personas con discapacidades visuales, particularmente en el ámbito del transporte público en autobús. La detección efectiva de autobuses y la clasificación del punto de vista (POV) del autobús son cruciales para mejorar la independencia de las personas con discapacidad visual. Este estudio presenta el Improved-YOLOv10, un modelo novedoso diseñado para abordar los desafíos en la identificación de autobuses y la clasificación de POV al integrar la Atención por Coordenadas (CA) y la Convolución de Núcleo Adaptativo (AKConv) en el marco de YOLOv10. El Improved YOLOv10 avanza la arquitectura de YOLOv10 mediante la incorporación de CA, que mejora el modelado de dependencia a largo alcance y la conciencia espacial, y AKConv, que ajusta dinámicamente los núcleos de convolución para una extracción de características superior. Estas mejoras tienen como objetivo mejorar tanto la precisión de detección como la eficiencia, esenciales para aplicaciones en tiempo real en tecnologías asistivas. Los resultados de la evaluación demuestran que el Improved-YOLOv10 ofrece mejoras significativas en el rendimiento de detección, incluyendo mejor precisión, exactitud y recuperación en comparación con YOLOv10. El modelo también exhibe una complejidad computacional y requisitos de almacenamiento reducidos, destacando su eficiencia. Si bien los resultados de clasificación muestran algunos compromisos, con una ligera disminución en la puntuación F1 general, la complejidad de las Operaciones de Punto Flotante Giga (GFLOPs), Parámetros y Peso/MB en el Improved-YOLOv10 sigue siendo ventajosa para tareas de clasificación. Las mejoras arquitectónicas del modelo contribuyen a su robustez y eficiencia, lo que lo convierte en una opción adecuada para aplicaciones en tiempo real y tecnologías asistivas.