logo móvil
Contáctanos

Reconocimiento óptico de música medieval utilizando conocimiento previo

Autores: Hartelt, Alexander; Puppe, Frank

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Reconocimiento óptico de música medieval utilizando conocimiento previo


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Explotando el conocimiento previo
Tubería de aprendizaje profundo omr
Música medieval
Neumas
Arquitecturas codificador/decodificador
Paso de post-procesamiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 22

Citaciones: Sin citaciones


Descripción
Este documento trata sobre el efecto de explotar el conocimiento previo para mejorar un pipeline de aprendizaje profundo de reconocimiento óptico de música (OMR) para transcribir música monofónica manuscrita medieval del siglo XII-XIV, cuyo uso ha sido descuidado en la literatura. Se utilizaron y evaluaron varios tipos de conocimiento previo sobre notas y texto superpuestos, claves, conexiones gráficas (neumas) y sus implicaciones en la posición de las notas en el pentagrama. Además, se evaluó el efecto de diferentes arquitecturas de codificador/decodificador y de diferentes conjuntos de datos para entrenar un modelo mixto y para el ajuste fino específico del documento basado en un pipeline OMR extendido con un paso de postprocesamiento adicional. El uso de modelos de conocimiento previo mejora todas las métricas y en particular la tasa de precisión de la melodía (mAR), que se basa en las operaciones de inserción, eliminación y reemplazo necesarias para convertir la melodía generada en la melodía correcta. Al utilizar un modelo mixto y evaluar en un conjunto de datos diferente, nuestro mejor modelo logra sin ajuste fino y sin postprocesamiento un mAR del 90.4%, que se eleva en casi un 30% a un mAR del 93.2% utilizando el conocimiento previo. Con un ajuste fino adicional, la contribución del postprocesamiento es aún mayor: el mAR básico del 90.5% se eleva en más del 50% a un mAR del 95.8%.

Otros recursos que podrían interesarte

Temas Virtualpro