Reconocimiento de dígitos árabes escritos a mano basado en Máquina de Boltzmann Restringida y Redes Neuronales Convolucionales
Autores: Alani, Ali A.
Idioma: Inglés
Editor: MDPI
Año: 2017
Acceso abierto
Artículo científico
2017
Reconocimiento de dígitos árabes escritos a mano basado en Máquina de Boltzmann Restringida y Redes Neuronales Convolucionales
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Reconocimiento de dígitos manuscritos
Visión por computadora
Algoritmos de aprendizaje profundo
Reconocimiento de dígitos manuscritos en árabe
Máquina de Boltzmann restringida
Red neuronal convolucional
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El reconocimiento de dígitos manuscritos es un problema abierto en visión por computadora y reconocimiento de patrones, y resolver este problema ha suscitado un interés creciente. El principal desafío de este problema es el diseño de un método eficiente que pueda reconocer los dígitos manuscritos que el usuario envía a través de dispositivos digitales. Se han propuesto numerosos estudios en el pasado y en años recientes para mejorar el reconocimiento de dígitos manuscritos en varios idiomas. La investigación sobre el reconocimiento de dígitos manuscritos en árabe es limitada. En la actualidad, los algoritmos de aprendizaje profundo son extremadamente populares en visión por computadora y se utilizan para resolver y abordar problemas importantes, como la clasificación de imágenes, el procesamiento del lenguaje natural y el reconocimiento de voz, para proporcionar a las computadoras capacidades sensoriales que alcanzan la capacidad de los humanos. En este estudio, proponemos un nuevo enfoque para el reconocimiento de dígitos manuscritos árabes mediante el uso de máquinas de Boltzmann restringidas (RBM) y algoritmos de redes neuronales convolucionales (CNN). En particular, proponemos un enfoque de reconocimiento de dígitos manuscritos árabes que funciona en dos fases. Primero, utilizamos la RBM, que es una técnica de aprendizaje profundo que puede extraer características altamente útiles de datos en bruto, y que se ha utilizado en varios problemas de clasificación como técnica de extracción de características en la fase de extracción de características. Luego, las características extraídas se alimentan a una arquitectura CNN eficiente con una arquitectura de aprendizaje supervisado profundo para el proceso de entrenamiento y prueba. En el experimento, utilizamos el conjunto de datos de dígitos manuscritos árabes CMATERDB 3.3.1 para entrenar y probar el método propuesto. Los resultados experimentales muestran que el método propuesto mejora significativamente la tasa de precisión, alcanzando una precisión del 98.59%. Finalmente, la comparación de nuestros resultados con los de otros estudios sobre el conjunto de datos de dígitos manuscritos árabes CMATERDB 3.3.1 muestra que nuestro enfoque logra la tasa de precisión más alta.
Descripción
El reconocimiento de dígitos manuscritos es un problema abierto en visión por computadora y reconocimiento de patrones, y resolver este problema ha suscitado un interés creciente. El principal desafío de este problema es el diseño de un método eficiente que pueda reconocer los dígitos manuscritos que el usuario envía a través de dispositivos digitales. Se han propuesto numerosos estudios en el pasado y en años recientes para mejorar el reconocimiento de dígitos manuscritos en varios idiomas. La investigación sobre el reconocimiento de dígitos manuscritos en árabe es limitada. En la actualidad, los algoritmos de aprendizaje profundo son extremadamente populares en visión por computadora y se utilizan para resolver y abordar problemas importantes, como la clasificación de imágenes, el procesamiento del lenguaje natural y el reconocimiento de voz, para proporcionar a las computadoras capacidades sensoriales que alcanzan la capacidad de los humanos. En este estudio, proponemos un nuevo enfoque para el reconocimiento de dígitos manuscritos árabes mediante el uso de máquinas de Boltzmann restringidas (RBM) y algoritmos de redes neuronales convolucionales (CNN). En particular, proponemos un enfoque de reconocimiento de dígitos manuscritos árabes que funciona en dos fases. Primero, utilizamos la RBM, que es una técnica de aprendizaje profundo que puede extraer características altamente útiles de datos en bruto, y que se ha utilizado en varios problemas de clasificación como técnica de extracción de características en la fase de extracción de características. Luego, las características extraídas se alimentan a una arquitectura CNN eficiente con una arquitectura de aprendizaje supervisado profundo para el proceso de entrenamiento y prueba. En el experimento, utilizamos el conjunto de datos de dígitos manuscritos árabes CMATERDB 3.3.1 para entrenar y probar el método propuesto. Los resultados experimentales muestran que el método propuesto mejora significativamente la tasa de precisión, alcanzando una precisión del 98.59%. Finalmente, la comparación de nuestros resultados con los de otros estudios sobre el conjunto de datos de dígitos manuscritos árabes CMATERDB 3.3.1 muestra que nuestro enfoque logra la tasa de precisión más alta.