Enfoque basado en transformadores para el diagnóstico de patología utilizando espectrogramas de audio
Autores: Tami, Mohammad; Masri, Sari; Hasasneh, Ahmad; Tadj, Chakib
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Enfoque basado en transformadores para el diagnóstico de patología utilizando espectrogramas de audio
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Detección
Infante
Llanto
Análisis de audio
Aprendizaje automático
Algoritmos basados en transformadores
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La detección temprana de patologías infantiles por medios no invasivos es un aspecto crítico de la atención pediátrica. El análisis de audio del llanto infantil ha surgido como un método prometedor para identificar diversas condiciones de salud sin intervención médica directa. En este estudio, presentamos un modelo de aprendizaje automático de vanguardia que emplea espectrogramas de audio y algoritmos basados en transformadores para clasificar el llanto infantil en distintas categorías patológicas. Nuestro modelo innovador elude el extenso preprocesamiento típicamente asociado con los datos de audio al aprovechar los mecanismos de autoatención del transformador, preservando así la integridad de las características diagnósticas del audio. Al compararse con modelos establecidos de aprendizaje automático y aprendizaje profundo, nuestro enfoque demostró una notable precisión del 98.69%, una precisión del 98.73%, un recall del 98.71% y una puntuación F1 del 98.71%, superando el rendimiento tanto de los modelos tradicionales de aprendizaje automático como de las redes neuronales convolucionales. Esta investigación no solo proporciona una herramienta de diagnóstico novedosa que es escalable y eficiente, sino que también abre vías para mejorar la atención pediátrica a través de la detección temprana y precisa de patologías.
Descripción
La detección temprana de patologías infantiles por medios no invasivos es un aspecto crítico de la atención pediátrica. El análisis de audio del llanto infantil ha surgido como un método prometedor para identificar diversas condiciones de salud sin intervención médica directa. En este estudio, presentamos un modelo de aprendizaje automático de vanguardia que emplea espectrogramas de audio y algoritmos basados en transformadores para clasificar el llanto infantil en distintas categorías patológicas. Nuestro modelo innovador elude el extenso preprocesamiento típicamente asociado con los datos de audio al aprovechar los mecanismos de autoatención del transformador, preservando así la integridad de las características diagnósticas del audio. Al compararse con modelos establecidos de aprendizaje automático y aprendizaje profundo, nuestro enfoque demostró una notable precisión del 98.69%, una precisión del 98.73%, un recall del 98.71% y una puntuación F1 del 98.71%, superando el rendimiento tanto de los modelos tradicionales de aprendizaje automático como de las redes neuronales convolucionales. Esta investigación no solo proporciona una herramienta de diagnóstico novedosa que es escalable y eficiente, sino que también abre vías para mejorar la atención pediátrica a través de la detección temprana y precisa de patologías.