logo móvil
Contáctanos

Lectores Artificialmente Inteligentes: Un Marco Adaptativo para el Reconocimiento de Dígitos Numéricos Manuscritos Originales con Métodos OCR

Autores: Jain, Parth Hasmukh; Kumar, Vivek; Samuel, Jim; Singh, Sushmita; Mannepalli, Abhinay; Anderson, Richard

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Lectores Artificialmente Inteligentes: Un Marco Adaptativo para el Reconocimiento de Dígitos Numéricos Manuscritos Originales con Métodos OCR


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Avanzada
Inteligencia artificial
OCR
Texto manuscrito
Texto codificado por máquina
Red neuronal convolucional

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Las técnicas avanzadas de inteligencia artificial (IA) han llevado a desarrollos significativos en las tecnologías de reconocimiento óptico de caracteres (OCR). Las aplicaciones de OCR, que utilizan técnicas de IA para transformar imágenes de texto mecanografiado, texto manuscrito u otras formas de texto en texto codificado por máquina, ofrecen un grado razonable de precisión para el texto general. Sin embargo, incluso después de décadas de investigación intensiva, crear OCR con habilidades similares a las humanas ha seguido siendo evasivo. Uno de los desafíos ha sido que los modelos de OCR entrenados en texto general no funcionan bien con texto manuscrito localizado o personalizado debido a las diferencias en el estilo de escritura de los alfabetos y dígitos. Este estudio tiene como objetivo discutir los pasos necesarios para crear un marco adaptativo para los modelos de OCR, con la intención de explorar un método razonable para personalizar una solución de OCR para un conjunto de datos único de dígitos numéricos en inglés que se desarrolló para este estudio. Desarrollamos un reconocedor de dígitos entrenando nuestro modelo en el conjunto de datos MNIST con una red neuronal convolucional y lo contrastamos con múltiples modelos entrenados en combinaciones de los dígitos MNIST y personalizados. Usando nuestros métodos, observamos resultados comparables con la línea base y proporcionamos recomendaciones para mejorar la precisión de OCR para texto manuscrito localizado o personalizado. Este estudio también ofrece una perspectiva alternativa para generar datos utilizando métodos convencionales, que pueden servir como un estándar de oro para la augmentación de datos personalizados para ayudar a abordar los desafíos de la escasez de datos y el desequilibrio de datos.

Otros recursos que podrían interesarte

Temas Virtualpro