Aprovechando el modelo OCR basado en Transformer con aumento generativo de datos para el reconocimiento de documentos de ingeniería
Autores: Khallouli, Wael; Uddin, Mohammad Shahab; Sousa-Poza, Andres; Li, Jiang; Kovacic, Samuel
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Aprovechando el modelo OCR basado en Transformer con aumento generativo de datos para el reconocimiento de documentos de ingeniería
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Documentos de ingeniería
Digitalización
Reconocimiento óptico de caracteres
Modelos basados en transformadores
Aprendizaje por transferencia
Reconocimiento de texto
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
La práctica de larga data de la ingeniería basada en documentos ha resultado en la acumulación de un gran número de documentos de ingeniería en diversas industrias. Los documentos de ingeniería, como los dibujos 2D, siguen desempeñando un papel significativo en el intercambio de información y el compartir conocimientos en múltiples procesos de ingeniería. Sin embargo, estos documentos suelen almacenarse en formatos no digitalizados, como papel y archivos en formato de documento portátil (PDF), lo que dificulta la automatización. A medida que la ingeniería digital transforma procesos en muchas industrias, la digitalización de documentos de ingeniería presenta un desafío crucial que requiere métodos avanzados. Esta investigación aborda el problema de extraer automáticamente el contenido textual de documentos de ingeniería heredados no digitalizados. Introdujimos un sistema de reconocimiento óptico de caracteres (OCR) para la detección y reconocimiento de texto que aprovecha modelos generativos de aprendizaje profundo basados en transformadores y enfoques de aprendizaje por transferencia para mejorar la precisión de reconocimiento de texto en documentos de ingeniería. El sistema propuesto fue evaluado en un conjunto de datos recopilado de dibujos de ingeniería de barcos proporcionados por una agencia de EE. UU. Los resultados experimentales demostraron que el modelo OCR basado en transformadores propuesto superó significativamente a los modelos OCR preentrenados listos para usar.
Descripción
La práctica de larga data de la ingeniería basada en documentos ha resultado en la acumulación de un gran número de documentos de ingeniería en diversas industrias. Los documentos de ingeniería, como los dibujos 2D, siguen desempeñando un papel significativo en el intercambio de información y el compartir conocimientos en múltiples procesos de ingeniería. Sin embargo, estos documentos suelen almacenarse en formatos no digitalizados, como papel y archivos en formato de documento portátil (PDF), lo que dificulta la automatización. A medida que la ingeniería digital transforma procesos en muchas industrias, la digitalización de documentos de ingeniería presenta un desafío crucial que requiere métodos avanzados. Esta investigación aborda el problema de extraer automáticamente el contenido textual de documentos de ingeniería heredados no digitalizados. Introdujimos un sistema de reconocimiento óptico de caracteres (OCR) para la detección y reconocimiento de texto que aprovecha modelos generativos de aprendizaje profundo basados en transformadores y enfoques de aprendizaje por transferencia para mejorar la precisión de reconocimiento de texto en documentos de ingeniería. El sistema propuesto fue evaluado en un conjunto de datos recopilado de dibujos de ingeniería de barcos proporcionados por una agencia de EE. UU. Los resultados experimentales demostraron que el modelo OCR basado en transformadores propuesto superó significativamente a los modelos OCR preentrenados listos para usar.