Lectores Artificialmente Inteligentes: Un Marco Adaptativo para el Reconocimiento de Dígitos Numéricos Manuscritos Originales con Métodos OCR
Autores: Jain, Parth Hasmukh; Kumar, Vivek; Samuel, Jim; Singh, Sushmita; Mannepalli, Abhinay; Anderson, Richard
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Lectores Artificialmente Inteligentes: Un Marco Adaptativo para el Reconocimiento de Dígitos Numéricos Manuscritos Originales con Métodos OCR
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Avanzada
Inteligencia artificial
OCR
Texto manuscrito
Texto codificado por máquina
Red neuronal convolucional
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las técnicas avanzadas de inteligencia artificial (IA) han llevado a desarrollos significativos en las tecnologías de reconocimiento óptico de caracteres (OCR). Las aplicaciones de OCR, que utilizan técnicas de IA para transformar imágenes de texto mecanografiado, texto manuscrito u otras formas de texto en texto codificado por máquina, ofrecen un grado razonable de precisión para el texto general. Sin embargo, incluso después de décadas de investigación intensiva, crear OCR con habilidades similares a las humanas ha seguido siendo evasivo. Uno de los desafíos ha sido que los modelos de OCR entrenados en texto general no funcionan bien con texto manuscrito localizado o personalizado debido a las diferencias en el estilo de escritura de los alfabetos y dígitos. Este estudio tiene como objetivo discutir los pasos necesarios para crear un marco adaptativo para los modelos de OCR, con la intención de explorar un método razonable para personalizar una solución de OCR para un conjunto de datos único de dígitos numéricos en inglés que se desarrolló para este estudio. Desarrollamos un reconocedor de dígitos entrenando nuestro modelo en el conjunto de datos MNIST con una red neuronal convolucional y lo contrastamos con múltiples modelos entrenados en combinaciones de los dígitos MNIST y personalizados. Usando nuestros métodos, observamos resultados comparables con la línea base y proporcionamos recomendaciones para mejorar la precisión de OCR para texto manuscrito localizado o personalizado. Este estudio también ofrece una perspectiva alternativa para generar datos utilizando métodos convencionales, que pueden servir como un estándar de oro para la augmentación de datos personalizados para ayudar a abordar los desafíos de la escasez de datos y el desequilibrio de datos.
Descripción
Las técnicas avanzadas de inteligencia artificial (IA) han llevado a desarrollos significativos en las tecnologías de reconocimiento óptico de caracteres (OCR). Las aplicaciones de OCR, que utilizan técnicas de IA para transformar imágenes de texto mecanografiado, texto manuscrito u otras formas de texto en texto codificado por máquina, ofrecen un grado razonable de precisión para el texto general. Sin embargo, incluso después de décadas de investigación intensiva, crear OCR con habilidades similares a las humanas ha seguido siendo evasivo. Uno de los desafíos ha sido que los modelos de OCR entrenados en texto general no funcionan bien con texto manuscrito localizado o personalizado debido a las diferencias en el estilo de escritura de los alfabetos y dígitos. Este estudio tiene como objetivo discutir los pasos necesarios para crear un marco adaptativo para los modelos de OCR, con la intención de explorar un método razonable para personalizar una solución de OCR para un conjunto de datos único de dígitos numéricos en inglés que se desarrolló para este estudio. Desarrollamos un reconocedor de dígitos entrenando nuestro modelo en el conjunto de datos MNIST con una red neuronal convolucional y lo contrastamos con múltiples modelos entrenados en combinaciones de los dígitos MNIST y personalizados. Usando nuestros métodos, observamos resultados comparables con la línea base y proporcionamos recomendaciones para mejorar la precisión de OCR para texto manuscrito localizado o personalizado. Este estudio también ofrece una perspectiva alternativa para generar datos utilizando métodos convencionales, que pueden servir como un estándar de oro para la augmentación de datos personalizados para ayudar a abordar los desafíos de la escasez de datos y el desequilibrio de datos.