Filtrado de imagen de fórmula matemática basado en mejora de correlación de características
Autores: Liu, Hongyuan; Yang, Fang; Wang, Xue; Si, Jianhui
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Filtrado de imagen de fórmula matemática basado en mejora de correlación de características
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Fórmulas matemáticas
Imágenes
Documentos científicos
Técnicos
Mejora de correlación de características
Modelo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Hay imágenes de fórmulas matemáticas u otras imágenes en documentos científicos y técnicos o en páginas web, y las imágenes de fórmulas matemáticas se clasifican como conteniendo solo fórmulas matemáticas o fórmulas intercaladas con otros elementos, como texto y diagramas de coordenadas. Para filtrar y recopilar imágenes que contienen fórmulas matemáticas para que otros las estudien o para investigaciones posteriores, se propone un modelo para filtrar imágenes de fórmulas matemáticas basado en la mejora de la correlación de características. Primero, se diseñó el módulo de Mejora de la Correlación de Características (FCE) para mejorar el grado de correlación de las características de las fórmulas matemáticas y debilitar otras características. Luego, se diseñó el módulo de agrupación multi-escala de franjas (SMP) para resolver el problema del tamaño no uniforme de la imagen, al tiempo que se potencia el enfoque en las características horizontales de las fórmulas. Finalmente, se mejoró la función de pérdida para equilibrar el conjunto de datos. La precisión del experimento fue del 89.50%, superando al modelo existente. El uso del modelo para filtrar imágenes permite al usuario seleccionar imágenes que contienen fórmulas matemáticas. La selección de imágenes que contienen fórmulas matemáticas ayuda a acelerar la creación de una base de datos de imágenes de fórmulas matemáticas.
Descripción
Hay imágenes de fórmulas matemáticas u otras imágenes en documentos científicos y técnicos o en páginas web, y las imágenes de fórmulas matemáticas se clasifican como conteniendo solo fórmulas matemáticas o fórmulas intercaladas con otros elementos, como texto y diagramas de coordenadas. Para filtrar y recopilar imágenes que contienen fórmulas matemáticas para que otros las estudien o para investigaciones posteriores, se propone un modelo para filtrar imágenes de fórmulas matemáticas basado en la mejora de la correlación de características. Primero, se diseñó el módulo de Mejora de la Correlación de Características (FCE) para mejorar el grado de correlación de las características de las fórmulas matemáticas y debilitar otras características. Luego, se diseñó el módulo de agrupación multi-escala de franjas (SMP) para resolver el problema del tamaño no uniforme de la imagen, al tiempo que se potencia el enfoque en las características horizontales de las fórmulas. Finalmente, se mejoró la función de pérdida para equilibrar el conjunto de datos. La precisión del experimento fue del 89.50%, superando al modelo existente. El uso del modelo para filtrar imágenes permite al usuario seleccionar imágenes que contienen fórmulas matemáticas. La selección de imágenes que contienen fórmulas matemáticas ayuda a acelerar la creación de una base de datos de imágenes de fórmulas matemáticas.