Utilizando las razones cruzadas para la detección y corrección de dígitos faltantes en el reconocimiento de dígitos de instrumentos
Autores: Huang, Jui-Hua; Chen, Yong-Han; Tsai, Yen-Lung
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Utilizando las razones cruzadas para la detección y corrección de dígitos faltantes en el reconocimiento de dígitos de instrumentos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Tecnologías de lectura automática de medidores existentes
Reconocimiento de dígitos
Modelos de aprendizaje profundo
Entrenamiento de medidores de gas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Este documento tiene como objetivo mejorar las tecnologías existentes de Lectura Automática de Medidores (AMR) para servicios públicos en el sector de servicios públicos, como agua, electricidad y gas, al permitir a los usuarios cargar regularmente imágenes de sus medidores, que luego son procesadas automáticamente por máquinas para el reconocimiento de dígitos. Proponemos un enfoque AMR de extremo a extremo diseñado específicamente para entornos no restringidos, ofreciendo soluciones prácticas a fallas comunes encontradas durante el proceso de reconocimiento automático, como desenfoque de imagen, distorsión de perspectiva, reflejo parcial, iluminación deficiente, dígitos faltantes y estados de dígitos intermedios, para reducir la tasa de fallas de lecturas automáticas de medidores. La primera etapa del sistema implica verificar la calidad de las imágenes cargadas por el usuario a través del método SVM y solicitar nuevas cargas para imágenes no aptas para la extracción y reconocimiento de dígitos. La segunda etapa emplea modelos de aprendizaje profundo para la localización y reconocimiento de dígitos, detectando y corrigiendo automáticamente problemas como dígitos faltantes e intermedios para mejorar la precisión de las lecturas automáticas de medidores. Nuestra investigación estableció un conjunto de datos de entrenamiento de medidores de gas que comprende 52,000 imágenes, ampliamente anotadas en varios grados, para entrenar los modelos de aprendizaje profundo para el reconocimiento de dígitos de alta precisión. Los resultados experimentales demuestran que, con el modelo SVM simple, se logra una precisión del 87.03% para la clasificación de tipos de imágenes borrosas. Además, el reconocimiento de dígitos del medidor (incluidos los estados de dígitos intermedios) puede alcanzar el 97.6% (mAP), y la detección y corrección de dígitos faltantes puede ser tan alta como el 63.64%, mostrando el valor de aplicación práctica del sistema desarrollado en este estudio.
Descripción
Este documento tiene como objetivo mejorar las tecnologías existentes de Lectura Automática de Medidores (AMR) para servicios públicos en el sector de servicios públicos, como agua, electricidad y gas, al permitir a los usuarios cargar regularmente imágenes de sus medidores, que luego son procesadas automáticamente por máquinas para el reconocimiento de dígitos. Proponemos un enfoque AMR de extremo a extremo diseñado específicamente para entornos no restringidos, ofreciendo soluciones prácticas a fallas comunes encontradas durante el proceso de reconocimiento automático, como desenfoque de imagen, distorsión de perspectiva, reflejo parcial, iluminación deficiente, dígitos faltantes y estados de dígitos intermedios, para reducir la tasa de fallas de lecturas automáticas de medidores. La primera etapa del sistema implica verificar la calidad de las imágenes cargadas por el usuario a través del método SVM y solicitar nuevas cargas para imágenes no aptas para la extracción y reconocimiento de dígitos. La segunda etapa emplea modelos de aprendizaje profundo para la localización y reconocimiento de dígitos, detectando y corrigiendo automáticamente problemas como dígitos faltantes e intermedios para mejorar la precisión de las lecturas automáticas de medidores. Nuestra investigación estableció un conjunto de datos de entrenamiento de medidores de gas que comprende 52,000 imágenes, ampliamente anotadas en varios grados, para entrenar los modelos de aprendizaje profundo para el reconocimiento de dígitos de alta precisión. Los resultados experimentales demuestran que, con el modelo SVM simple, se logra una precisión del 87.03% para la clasificación de tipos de imágenes borrosas. Además, el reconocimiento de dígitos del medidor (incluidos los estados de dígitos intermedios) puede alcanzar el 97.6% (mAP), y la detección y corrección de dígitos faltantes puede ser tan alta como el 63.64%, mostrando el valor de aplicación práctica del sistema desarrollado en este estudio.