Selección de Genes para la Clasificación de Datos de Cáncer en Microarreglos mediante un Nuevo Algoritmo Basado en Reglas
Autores: Pino Angulo, Adrian
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Selección de Genes para la Clasificación de Datos de Cáncer en Microarreglos mediante un Nuevo Algoritmo Basado en Reglas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Microarreglo
Análisis de datos
Selección de características
Genes
Pavicd
Clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Debido a la diferencia desproporcionada entre el número de genes y muestras, el análisis de datos de microarreglos se considera una tarea extremadamente difícil en la clasificación de muestras. La selección de características mitiga este problema al eliminar genes irrelevantes y redundantes de los datos. En este artículo, proponemos una nueva metodología para la selección de características que tiene como objetivo detectar genes relevantes, no redundantes e interactuantes al analizar el espacio de valores de características en lugar del espacio de características. Siguiendo esta metodología, también proponemos un nuevo algoritmo de selección de características, a saber, Pavicd (Valor Atributo Probabilístico para la Distinción de Clases). Los experimentos en catorce conjuntos de datos de cáncer de microarreglos revelan que Pavicd obtiene el mejor rendimiento en términos de tiempo de ejecución y precisión de clasificación al utilizar Ripper-k y C4.5 como clasificadores. Al utilizar SVM (Máquina de Vectores de Soporte), el algoritmo envolvente Gbc (Colonia de Abejas Genéticas) obtiene los mejores resultados. Sin embargo, Pavicd es significativamente más rápido.
Descripción
Debido a la diferencia desproporcionada entre el número de genes y muestras, el análisis de datos de microarreglos se considera una tarea extremadamente difícil en la clasificación de muestras. La selección de características mitiga este problema al eliminar genes irrelevantes y redundantes de los datos. En este artículo, proponemos una nueva metodología para la selección de características que tiene como objetivo detectar genes relevantes, no redundantes e interactuantes al analizar el espacio de valores de características en lugar del espacio de características. Siguiendo esta metodología, también proponemos un nuevo algoritmo de selección de características, a saber, Pavicd (Valor Atributo Probabilístico para la Distinción de Clases). Los experimentos en catorce conjuntos de datos de cáncer de microarreglos revelan que Pavicd obtiene el mejor rendimiento en términos de tiempo de ejecución y precisión de clasificación al utilizar Ripper-k y C4.5 como clasificadores. Al utilizar SVM (Máquina de Vectores de Soporte), el algoritmo envolvente Gbc (Colonia de Abejas Genéticas) obtiene los mejores resultados. Sin embargo, Pavicd es significativamente más rápido.