El Espectro Caligráfico: Cuantificando la Calidad de la Generación de Caracteres Manuscritos de Niños Árabes Usando CWGAN-GP y Evaluación Multimétrica
Autores: Alshahrani, Shafia; Alharbi, Hajar
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
El Espectro Caligráfico: Cuantificando la Calidad de la Generación de Caracteres Manuscritos de Niños Árabes Usando CWGAN-GP y Evaluación Multimétrica
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Reconocimiento de escritura árabe
Aumento de datos
Red neuronal convolucional
Redes generativas antagónicas
Bloques de compresión y excitación
Reconocimiento de caracteres
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Debido a la alta variabilidad intraclase y a las sutiles diferencias intercaracteres, el reconocimiento automático de escritura a mano en árabe sigue siendo una tarea desafiante, particularmente para la escritura de los niños. Este estudio propone un marco híbrido que combina redes generativas adversariales Wasserstein condicionales por clase con penalización de gradiente (CWGAN-GP) para la augmentación de datos y una red neuronal convolucional (CNN) mejorada con bloques de compresión y excitación (SE) para una mejor discriminación de características. Los experimentos se restringieron a caracteres desconectados (aislados) del conjunto de datos Hijja, que comprendía 12,355 muestras divididas de la siguiente manera: 80% para entrenamiento (9884), 10% para validación (1236) y 10% para prueba (1235). Entrenar la CNN solo con datos reales produjo una precisión del 93.47%, mientras que la incorporación de muestras generadas por CWGAN-GP mejoró el rendimiento al 96.27%. Notablemente, la SE-CNN propuesta entrenada con los datos aumentados por CWGAN-GP logró la mayor precisión del 99.27%. Este resultado demuestra que la combinación de una avanzada augmentación de datos generativa y un refinamiento arquitectónico mejora significativamente el rendimiento del reconocimiento de caracteres escritos a mano en árabe.
Descripción
Debido a la alta variabilidad intraclase y a las sutiles diferencias intercaracteres, el reconocimiento automático de escritura a mano en árabe sigue siendo una tarea desafiante, particularmente para la escritura de los niños. Este estudio propone un marco híbrido que combina redes generativas adversariales Wasserstein condicionales por clase con penalización de gradiente (CWGAN-GP) para la augmentación de datos y una red neuronal convolucional (CNN) mejorada con bloques de compresión y excitación (SE) para una mejor discriminación de características. Los experimentos se restringieron a caracteres desconectados (aislados) del conjunto de datos Hijja, que comprendía 12,355 muestras divididas de la siguiente manera: 80% para entrenamiento (9884), 10% para validación (1236) y 10% para prueba (1235). Entrenar la CNN solo con datos reales produjo una precisión del 93.47%, mientras que la incorporación de muestras generadas por CWGAN-GP mejoró el rendimiento al 96.27%. Notablemente, la SE-CNN propuesta entrenada con los datos aumentados por CWGAN-GP logró la mayor precisión del 99.27%. Este resultado demuestra que la combinación de una avanzada augmentación de datos generativa y un refinamiento arquitectónico mejora significativamente el rendimiento del reconocimiento de caracteres escritos a mano en árabe.