logo móvil
Contáctanos

Aprovechando el modelo OCR basado en Transformer con aumento generativo de datos para el reconocimiento de documentos de ingeniería

Autores: Khallouli, Wael; Uddin, Mohammad Shahab; Sousa-Poza, Andres; Li, Jiang; Kovacic, Samuel

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Aprovechando el modelo OCR basado en Transformer con aumento generativo de datos para el reconocimiento de documentos de ingeniería


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Documentos de ingeniería
Digitalización
Reconocimiento óptico de caracteres
Modelos basados en transformadores
Aprendizaje por transferencia
Reconocimiento de texto

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones


Descripción
La práctica de larga data de la ingeniería basada en documentos ha resultado en la acumulación de un gran número de documentos de ingeniería en diversas industrias. Los documentos de ingeniería, como los dibujos 2D, siguen desempeñando un papel significativo en el intercambio de información y el compartir conocimientos en múltiples procesos de ingeniería. Sin embargo, estos documentos suelen almacenarse en formatos no digitalizados, como papel y archivos en formato de documento portátil (PDF), lo que dificulta la automatización. A medida que la ingeniería digital transforma procesos en muchas industrias, la digitalización de documentos de ingeniería presenta un desafío crucial que requiere métodos avanzados. Esta investigación aborda el problema de extraer automáticamente el contenido textual de documentos de ingeniería heredados no digitalizados. Introdujimos un sistema de reconocimiento óptico de caracteres (OCR) para la detección y reconocimiento de texto que aprovecha modelos generativos de aprendizaje profundo basados en transformadores y enfoques de aprendizaje por transferencia para mejorar la precisión de reconocimiento de texto en documentos de ingeniería. El sistema propuesto fue evaluado en un conjunto de datos recopilado de dibujos de ingeniería de barcos proporcionados por una agencia de EE. UU. Los resultados experimentales demostraron que el modelo OCR basado en transformadores propuesto superó significativamente a los modelos OCR preentrenados listos para usar.

Otros recursos que podrían interesarte

Temas Virtualpro