Un nueva función de pérdida para la localización y clasificación simultáneas de objetos
Autores: Sanchez-Chica, Ander; Ugartemendia-Telleria, Beñat; Zulueta, Ekaitz; Fernandez-Gamiz, Unai; Gomez-Hidalgo, Javier Maria
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un nueva función de pérdida para la localización y clasificación simultáneas de objetos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Robots
Visión por computadora
Redes neuronales convolucionales
Detección de objetos
Localización
Funciones de pérdida
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
Los robots desempeñan un papel fundamental en la industria manufacturera. Esto ha llevado al desarrollo de la visión por computadora. Desde que AlexNet ganó el ILSVRC, las redes neuronales convolucionales (CNN) han logrado un estado de vanguardia en esta área. En este trabajo, se propone un método novedoso para detectar y predecir simultáneamente la localización de objetos utilizando un método de bucle personalizado y una CNN, realizando dos de las tareas más importantes en visión por computadora con un solo método. Se proponen dos funciones de pérdida diferentes para evaluar el método y comparar los resultados. Los resultados obtenidos muestran que la red es capaz de realizar ambas tareas con precisión, clasificando imágenes correctamente y localizando objetos con precisión. En cuanto a las funciones de pérdida, cuando se calculan los valores de clasificación objetivo, la red se desempeña mejor en la tarea de localización. A raíz de este trabajo, se esperan mejoras en la tarea de localización de redes al refinar los procesos de entrenamiento de las redes y las funciones de pérdida.
Descripción
Los robots desempeñan un papel fundamental en la industria manufacturera. Esto ha llevado al desarrollo de la visión por computadora. Desde que AlexNet ganó el ILSVRC, las redes neuronales convolucionales (CNN) han logrado un estado de vanguardia en esta área. En este trabajo, se propone un método novedoso para detectar y predecir simultáneamente la localización de objetos utilizando un método de bucle personalizado y una CNN, realizando dos de las tareas más importantes en visión por computadora con un solo método. Se proponen dos funciones de pérdida diferentes para evaluar el método y comparar los resultados. Los resultados obtenidos muestran que la red es capaz de realizar ambas tareas con precisión, clasificando imágenes correctamente y localizando objetos con precisión. En cuanto a las funciones de pérdida, cuando se calculan los valores de clasificación objetivo, la red se desempeña mejor en la tarea de localización. A raíz de este trabajo, se esperan mejoras en la tarea de localización de redes al refinar los procesos de entrenamiento de las redes y las funciones de pérdida.