Generación de series temporales sintéticas no lineales para datos de electroencefalograma utilizando modelos de memoria a largo plazo y corto plazo
Autores: Alqaysi, Bakr Rashid; Rosa-Zurera, Manuel; Aldujaili, Ali Abdulameer
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Generación de series temporales sintéticas no lineales para datos de electroencefalograma utilizando modelos de memoria a largo plazo y corto plazo
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Implementación
Inteligencia artificial
Detección de enfermedades
Señales de EEG
Aprendizaje profundo
Redes LSTM
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
La implementación de sistemas basados en inteligencia artificial para la detección de enfermedades mediante señales biomédicas es un desafío debido a la disponibilidad limitada de datos de entrenamiento. Este documento trata sobre la generación de señales EEG sintéticas utilizando modelos basados en aprendizaje profundo, para ser utilizadas en futuras investigaciones para el entrenamiento de sistemas de detección de la enfermedad de Parkinson. Los modelos lineales, como AR, MA y ARMA, a menudo son inadecuados debido a la no linealidad inherente de las series temporales. Para superar esta limitación, se proponen redes LSTM (memoria a corto y largo plazo) para aprender dependencias a largo plazo en series temporales EEG no lineales y posteriormente generar señales sintéticas para mejorar el entrenamiento de los sistemas de detección. Para aprender las dependencias temporales hacia adelante y hacia atrás en las señales EEG, se implementó un modelo LSTM bidireccional. El modelo LSTM fue entrenado en el conjunto de datos de EEG en estado de reposo de la UC San Diego, que incluye muestras de dos grupos: individuos con la enfermedad de Parkinson y un grupo de control sano. Para determinar el número óptimo de celdas en el modelo, evaluamos el error cuadrático medio (MSE) y la correlación cruzada entre las señales originales y sintéticas. Este método también se aplicó para seleccionar la longitud del vector de estado oculto. El número de celdas ocultas se estableció en 14, y la longitud del vector de estado oculto para cada celda se fijó en 4. Aumentar estos valores no mejoró el MSE ni la correlación cruzada y aumentó innecesariamente la complejidad computacional. El rendimiento del modelo propuesto se evaluó utilizando el error cuadrático medio (MSE), el coeficiente de correlación de Pearson y los espectros de potencia de las señales sintéticas y originales, demostrando la idoneidad del método propuesto para esta aplicación. El modelo propuesto se comparó con modelos autoregresivos de media móvil (ARMA), demostrando un rendimiento superior. Esto confirma que los modelos basados en aprendizaje profundo, como LSTM, son alternativas sólidas a modelos estadísticos como ARMA para manejar señales no lineales, multifrecuencia y no estacionarias.
Descripción
La implementación de sistemas basados en inteligencia artificial para la detección de enfermedades mediante señales biomédicas es un desafío debido a la disponibilidad limitada de datos de entrenamiento. Este documento trata sobre la generación de señales EEG sintéticas utilizando modelos basados en aprendizaje profundo, para ser utilizadas en futuras investigaciones para el entrenamiento de sistemas de detección de la enfermedad de Parkinson. Los modelos lineales, como AR, MA y ARMA, a menudo son inadecuados debido a la no linealidad inherente de las series temporales. Para superar esta limitación, se proponen redes LSTM (memoria a corto y largo plazo) para aprender dependencias a largo plazo en series temporales EEG no lineales y posteriormente generar señales sintéticas para mejorar el entrenamiento de los sistemas de detección. Para aprender las dependencias temporales hacia adelante y hacia atrás en las señales EEG, se implementó un modelo LSTM bidireccional. El modelo LSTM fue entrenado en el conjunto de datos de EEG en estado de reposo de la UC San Diego, que incluye muestras de dos grupos: individuos con la enfermedad de Parkinson y un grupo de control sano. Para determinar el número óptimo de celdas en el modelo, evaluamos el error cuadrático medio (MSE) y la correlación cruzada entre las señales originales y sintéticas. Este método también se aplicó para seleccionar la longitud del vector de estado oculto. El número de celdas ocultas se estableció en 14, y la longitud del vector de estado oculto para cada celda se fijó en 4. Aumentar estos valores no mejoró el MSE ni la correlación cruzada y aumentó innecesariamente la complejidad computacional. El rendimiento del modelo propuesto se evaluó utilizando el error cuadrático medio (MSE), el coeficiente de correlación de Pearson y los espectros de potencia de las señales sintéticas y originales, demostrando la idoneidad del método propuesto para esta aplicación. El modelo propuesto se comparó con modelos autoregresivos de media móvil (ARMA), demostrando un rendimiento superior. Esto confirma que los modelos basados en aprendizaje profundo, como LSTM, son alternativas sólidas a modelos estadísticos como ARMA para manejar señales no lineales, multifrecuencia y no estacionarias.