Scms: modelos conglomerados sistemáticos para la clasificación de señales de tos de audio
Autores: Prabhakar, Sunil Kumar; Won, Dong-Ok
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Scms: modelos conglomerados sistemáticos para la clasificación de señales de tos de audio
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Respuesta fisiológica
Tos
Factores ambientales
Enfermedades
Sonido
Clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Una característica común y natural de la respuesta fisiológica del cuerpo humano es la tos, que intenta expulsar el aire y otros desechos completamente de las vías respiratorias. Debido a factores ambientales, respuestas alérgicas, contaminación o algunas enfermedades, se produce la tos. Una tos puede ser seca o húmeda dependiendo de la cantidad de moco producido. Una característica distintiva de la tos es el sonido, que es principalmente un sonido de graznido. Los sonidos de la tos humana pueden ser monitoreados continuamente, y por lo tanto, la clasificación de sonidos de tos ha atraído mucho interés en la comunidad de investigación en la última década. En esta investigación, se proponen tres modelos conglomerados sistemáticos (SCMs) para la clasificación de señales de tos de audio. La primera técnica conglomerada utiliza el concepto de modelos robustos como la Función de Correlación Cruzada (CCF) y la Función de Correlación Cruzada Parcial (PCCF), modelo de Contracción y Selección Absoluta Mínima (LASSO), modelo de regularización de red elástica con análisis de diccionario Gabor y técnicas eficientes de aprendizaje de máquina de conjunto, la segunda técnica utiliza el concepto de autoencoders condicionales apilados (SAEs) y la tercera técnica utiliza el concepto de utilizar algunos esquemas eficientes de extracción de características como Transformada de Onda Q Ajustable (TQWT), TQWT dispersa, Coeficiente de Información Máxima (MIC), Coeficiente de Correlación a Distancia (DCC) y algunas técnicas de selección de características como el Algoritmo de Enjambre de Tunicados Binario (BTSA), funciones de agregación (AFs), análisis factorial (FA), análisis factorial explicativo (EFA) clasificado con clasificadores de aprendizaje de máquina, máquina de aprendizaje extremo de núcleo (KELM), ELM de arcocoseno, KELM basado en Optimización de Enjambre de Ratas (RSO), etc. Las técnicas se utilizan en conjuntos de datos disponibles públicamente, y los resultados muestran que la precisión de clasificación más alta del 98.99% se obtuvo cuando TQWT dispersa con AF se implementó con un clasificador de ELM de arcocoseno.
Descripción
Una característica común y natural de la respuesta fisiológica del cuerpo humano es la tos, que intenta expulsar el aire y otros desechos completamente de las vías respiratorias. Debido a factores ambientales, respuestas alérgicas, contaminación o algunas enfermedades, se produce la tos. Una tos puede ser seca o húmeda dependiendo de la cantidad de moco producido. Una característica distintiva de la tos es el sonido, que es principalmente un sonido de graznido. Los sonidos de la tos humana pueden ser monitoreados continuamente, y por lo tanto, la clasificación de sonidos de tos ha atraído mucho interés en la comunidad de investigación en la última década. En esta investigación, se proponen tres modelos conglomerados sistemáticos (SCMs) para la clasificación de señales de tos de audio. La primera técnica conglomerada utiliza el concepto de modelos robustos como la Función de Correlación Cruzada (CCF) y la Función de Correlación Cruzada Parcial (PCCF), modelo de Contracción y Selección Absoluta Mínima (LASSO), modelo de regularización de red elástica con análisis de diccionario Gabor y técnicas eficientes de aprendizaje de máquina de conjunto, la segunda técnica utiliza el concepto de autoencoders condicionales apilados (SAEs) y la tercera técnica utiliza el concepto de utilizar algunos esquemas eficientes de extracción de características como Transformada de Onda Q Ajustable (TQWT), TQWT dispersa, Coeficiente de Información Máxima (MIC), Coeficiente de Correlación a Distancia (DCC) y algunas técnicas de selección de características como el Algoritmo de Enjambre de Tunicados Binario (BTSA), funciones de agregación (AFs), análisis factorial (FA), análisis factorial explicativo (EFA) clasificado con clasificadores de aprendizaje de máquina, máquina de aprendizaje extremo de núcleo (KELM), ELM de arcocoseno, KELM basado en Optimización de Enjambre de Ratas (RSO), etc. Las técnicas se utilizan en conjuntos de datos disponibles públicamente, y los resultados muestran que la precisión de clasificación más alta del 98.99% se obtuvo cuando TQWT dispersa con AF se implementó con un clasificador de ELM de arcocoseno.