Aprendizaje con pocos ejemplos con un nuevo método de aumento de imágenes basado en teselación de Voronoi para la detección de parálisis facial
Autores: Abayomi-Alli, Olusola Oluwakemi; Damaeviius, Robertas; Maskelinas, Rytis; Misra, Sanjay
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Aprendizaje con pocos ejemplos con un nuevo método de aumento de imágenes basado en teselación de Voronoi para la detección de parálisis facial
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Parálisis facial
Métodos de aprendizaje profundo
Aumento de datos
Descomposición de Voronoi
Aumento de imagen
Red neuronal
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La parálisis facial tiene efectos adversos en la apariencia de una persona y tiene consecuencias sociales y funcionales negativas en el paciente. Los métodos de aprendizaje profundo pueden mejorar la tasa de detección de la parálisis facial, pero su eficiencia está limitada por datos insuficientes, desequilibrio de clases y alta tasa de clasificación errónea. Para aliviar la falta de datos y mejorar el rendimiento de los modelos de aprendizaje profundo para la detección de parálisis facial, se pueden utilizar métodos de aumento de datos. En este artículo, proponemos un nuevo método de aumento de imágenes basado en la descomposición de Voronoi y el borrado de regiones aleatorias (VDRRE) que consiste en dividir las imágenes en celdas de Voronoi definidas aleatoriamente como alternativa al método de borrado aleatorio basado en rectángulos. El método propuesto aumenta el conjunto de datos de imágenes con nuevas imágenes, que se utilizan para entrenar la red neuronal profunda. Logramos una precisión del 99.34% utilizando aprendizaje de dos tomas con aumento VDRRE en caras con parálisis del conjunto de datos Youtube Face Palsy (YFP), mientras que las caras normales se toman de la Base de Datos de Caras de Caltech. Nuestro modelo muestra una mejora sobre los métodos de vanguardia en la detección de la parálisis facial a partir de un pequeño conjunto de datos de imágenes faciales.
Descripción
La parálisis facial tiene efectos adversos en la apariencia de una persona y tiene consecuencias sociales y funcionales negativas en el paciente. Los métodos de aprendizaje profundo pueden mejorar la tasa de detección de la parálisis facial, pero su eficiencia está limitada por datos insuficientes, desequilibrio de clases y alta tasa de clasificación errónea. Para aliviar la falta de datos y mejorar el rendimiento de los modelos de aprendizaje profundo para la detección de parálisis facial, se pueden utilizar métodos de aumento de datos. En este artículo, proponemos un nuevo método de aumento de imágenes basado en la descomposición de Voronoi y el borrado de regiones aleatorias (VDRRE) que consiste en dividir las imágenes en celdas de Voronoi definidas aleatoriamente como alternativa al método de borrado aleatorio basado en rectángulos. El método propuesto aumenta el conjunto de datos de imágenes con nuevas imágenes, que se utilizan para entrenar la red neuronal profunda. Logramos una precisión del 99.34% utilizando aprendizaje de dos tomas con aumento VDRRE en caras con parálisis del conjunto de datos Youtube Face Palsy (YFP), mientras que las caras normales se toman de la Base de Datos de Caras de Caltech. Nuestro modelo muestra una mejora sobre los métodos de vanguardia en la detección de la parálisis facial a partir de un pequeño conjunto de datos de imágenes faciales.