Análisis de sonido de producto industrial aplicando medidas de similitud de imagen
Autores: iri, Dejan G.; Peri, Zoran H.; Vui, Nikola J.; Mileti, Miljan P.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Análisis de sonido de producto industrial aplicando medidas de similitud de imagen
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Productos industriales
Sonido
Clasificación
Detección de fallas
Mel-espectrogramas
Procesamiento de imágenes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Los sonidos de ciertos productos industriales (máquinas) contienen información importante sobre estos productos. La clasificación del producto o la detección de fallas pueden realizarse utilizando el sonido del producto. En este sentido, el sonido puede ser utilizado tal cual o puede ser mapeado a características o imágenes. Esto último permite la implementación de mejoras de rendimiento recientemente logradas con respecto al procesamiento de imágenes. En este documento, los sonidos de siete productos industriales son mapeados en mel-espectrogramas. Se investigan las similitudes de estas imágenes dentro de la misma clase (tipo de máquina) y entre clases, representando las similitudes intraclase e interclase, respectivamente. Se aplican tres medidas de similitud de imagen comúnmente utilizadas: distancia euclidiana (ED), el coeficiente de correlación de Pearson (PCC) y el índice de similitud estructural (SSIM). Estas medidas se comparan mutuamente para analizar sus comportamientos en un caso de uso particular. Según los resultados obtenidos, los mel-espectrogramas de cinco clases son similares, mientras que dos clases tienen propiedades únicas manifestadas en una similitud intraclase considerablemente mayor en comparación con la interclase. Las medidas de similitud de imagen aplicadas conducen a resultados generales similares mostrando las mismas tendencias principales, pero existen diferencias entre ellas en cuanto a la relación mutua de similitud entre clases. Las diferencias entre las imágenes son más difusas cuando se aplica el SSIM que al usar ED y el PCC.
Descripción
Los sonidos de ciertos productos industriales (máquinas) contienen información importante sobre estos productos. La clasificación del producto o la detección de fallas pueden realizarse utilizando el sonido del producto. En este sentido, el sonido puede ser utilizado tal cual o puede ser mapeado a características o imágenes. Esto último permite la implementación de mejoras de rendimiento recientemente logradas con respecto al procesamiento de imágenes. En este documento, los sonidos de siete productos industriales son mapeados en mel-espectrogramas. Se investigan las similitudes de estas imágenes dentro de la misma clase (tipo de máquina) y entre clases, representando las similitudes intraclase e interclase, respectivamente. Se aplican tres medidas de similitud de imagen comúnmente utilizadas: distancia euclidiana (ED), el coeficiente de correlación de Pearson (PCC) y el índice de similitud estructural (SSIM). Estas medidas se comparan mutuamente para analizar sus comportamientos en un caso de uso particular. Según los resultados obtenidos, los mel-espectrogramas de cinco clases son similares, mientras que dos clases tienen propiedades únicas manifestadas en una similitud intraclase considerablemente mayor en comparación con la interclase. Las medidas de similitud de imagen aplicadas conducen a resultados generales similares mostrando las mismas tendencias principales, pero existen diferencias entre ellas en cuanto a la relación mutua de similitud entre clases. Las diferencias entre las imágenes son más difusas cuando se aplica el SSIM que al usar ED y el PCC.