Evaluación de precisión del modelo en datos de EEG con ojos abiertos y cerrados: efecto de preprocesamiento de datos y métodos de validación
Autores: Mattiev, Jamolbek; Sajovic, Jakob; Drevenek, Gorazd; Rogelj, Peter
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Evaluación de precisión del modelo en datos de EEG con ojos abiertos y cerrados: efecto de preprocesamiento de datos y métodos de validación
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Validación
Métodos de clasificación
Datos de electroencefalografía
Preprocesamiento
Validación cruzada
Sobreajuste
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Los datos de ojos abiertos y ojos cerrados se utilizan frecuentemente para validar nuevos métodos de clasificación de la actividad cerebral humana. La validación cruzada de modelos entrenados con datos mínimamente preprocesados se utiliza con frecuencia, a pesar de que los datos de electroencefalografía están compuestos por actividad muscular y ruido ambiental, lo que afecta la precisión de la clasificación. Además, los datos de electroencefalografía de un solo sujeto suelen dividirse en partes más pequeñas debido a la disponibilidad limitada de conjuntos de datos grandes. El método más utilizado para la validación de modelos es la validación cruzada, aunque los resultados pueden verse afectados por el sobreajuste a las especificidades de la actividad cerebral de sujetos limitados. Para probar los efectos del preprocesamiento y la validación del clasificador en la precisión de la clasificación, probamos catorce algoritmos de clasificación implementados en WEKA y MATLAB, probados en datos de electroencefalografía preprocesados de manera exhaustiva y simple. Se utilizaron la retención y la validación cruzada para comparar la precisión de la clasificación de los datos de ojos abiertos y cerrados. Se utilizaron los datos de 50 sujetos, con cuatro minutos de datos con los ojos cerrados y abiertos cada uno. Los algoritmos entrenados con datos simplemente preprocesados fueron superiores a los entrenados con datos preprocesados de manera exhaustiva en las pruebas de validación cruzada. Lo contrario fue cierto cuando se examinó la precisión de la retención. Se observaron aumentos significativos en la precisión de la retención si los datos de diferentes sujetos no se separaban estrictamente entre los conjuntos de datos de prueba y entrenamiento, lo que muestra la presencia de sobreajuste. Los resultados muestran que el preprocesamiento exhaustivo de los datos puede ser ventajoso para la clasificación invariante al sujeto, mientras que se puede lograr una mayor precisión específica del sujeto con un preprocesamiento simple. Por lo tanto, los investigadores deben indicar el uso final previsto de su clasificador.
Descripción
Los datos de ojos abiertos y ojos cerrados se utilizan frecuentemente para validar nuevos métodos de clasificación de la actividad cerebral humana. La validación cruzada de modelos entrenados con datos mínimamente preprocesados se utiliza con frecuencia, a pesar de que los datos de electroencefalografía están compuestos por actividad muscular y ruido ambiental, lo que afecta la precisión de la clasificación. Además, los datos de electroencefalografía de un solo sujeto suelen dividirse en partes más pequeñas debido a la disponibilidad limitada de conjuntos de datos grandes. El método más utilizado para la validación de modelos es la validación cruzada, aunque los resultados pueden verse afectados por el sobreajuste a las especificidades de la actividad cerebral de sujetos limitados. Para probar los efectos del preprocesamiento y la validación del clasificador en la precisión de la clasificación, probamos catorce algoritmos de clasificación implementados en WEKA y MATLAB, probados en datos de electroencefalografía preprocesados de manera exhaustiva y simple. Se utilizaron la retención y la validación cruzada para comparar la precisión de la clasificación de los datos de ojos abiertos y cerrados. Se utilizaron los datos de 50 sujetos, con cuatro minutos de datos con los ojos cerrados y abiertos cada uno. Los algoritmos entrenados con datos simplemente preprocesados fueron superiores a los entrenados con datos preprocesados de manera exhaustiva en las pruebas de validación cruzada. Lo contrario fue cierto cuando se examinó la precisión de la retención. Se observaron aumentos significativos en la precisión de la retención si los datos de diferentes sujetos no se separaban estrictamente entre los conjuntos de datos de prueba y entrenamiento, lo que muestra la presencia de sobreajuste. Los resultados muestran que el preprocesamiento exhaustivo de los datos puede ser ventajoso para la clasificación invariante al sujeto, mientras que se puede lograr una mayor precisión específica del sujeto con un preprocesamiento simple. Por lo tanto, los investigadores deben indicar el uso final previsto de su clasificador.