Selección de características para la detección de cáncer de colon utilizando clustering K-Means y algoritmo de búsqueda de armonía modificado
Autores: Bae, Jin Hee; Kim, Minwoo; Lim, J.S.; Geem, Zong Woo
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Selección de características para la detección de cáncer de colon utilizando clustering K-Means y algoritmo de búsqueda de armonía modificado
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Propone un método de selección de características para pacientes con cáncer colorrectal mediante el agrupamiento K-means y el algoritmo de búsqueda de armonía modificado
Información genética
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 20
Citaciones: Sin citaciones
Este artículo propone un método de selección de características que es efectivo para distinguir a los pacientes con cáncer colorrectal de individuos normales utilizando el agrupamiento K-means y el algoritmo de búsqueda de armonía modificado. Dado que la causa genética del cáncer colorrectal proviene de mutaciones en genes, es importante clasificar la presencia o ausencia de cáncer colorrectal a través de información genética. La metodología propuesta consta de cuatro pasos. Primero, los datos originales se normalizan Z mediante preprocesamiento de datos. Luego, se seleccionan genes candidatos utilizando el puntaje de Fisher. A continuación, se selecciona un gen representativo de cada grupo después de que los genes candidatos se agrupan utilizando el agrupamiento K-means. Finalmente, la selección de características se lleva a cabo utilizando el algoritmo de búsqueda de armonía modificado. La combinación de genes creada por la selección de características se aplica al modelo de clasificación y se verifica utilizando validación cruzada de 5 pliegues. El modelo propuesto obtuvo una precisión de clasificación de hasta 94.36%. Además, al comparar el método propuesto con otros métodos, demostramos que el método propuesto funciona bien en la clasificación del cáncer colorrectal. Además, creemos que el modelo propuesto se puede aplicar no solo al cáncer colorrectal sino también a otras enfermedades relacionadas con genes.
Descripción
Este artículo propone un método de selección de características que es efectivo para distinguir a los pacientes con cáncer colorrectal de individuos normales utilizando el agrupamiento K-means y el algoritmo de búsqueda de armonía modificado. Dado que la causa genética del cáncer colorrectal proviene de mutaciones en genes, es importante clasificar la presencia o ausencia de cáncer colorrectal a través de información genética. La metodología propuesta consta de cuatro pasos. Primero, los datos originales se normalizan Z mediante preprocesamiento de datos. Luego, se seleccionan genes candidatos utilizando el puntaje de Fisher. A continuación, se selecciona un gen representativo de cada grupo después de que los genes candidatos se agrupan utilizando el agrupamiento K-means. Finalmente, la selección de características se lleva a cabo utilizando el algoritmo de búsqueda de armonía modificado. La combinación de genes creada por la selección de características se aplica al modelo de clasificación y se verifica utilizando validación cruzada de 5 pliegues. El modelo propuesto obtuvo una precisión de clasificación de hasta 94.36%. Además, al comparar el método propuesto con otros métodos, demostramos que el método propuesto funciona bien en la clasificación del cáncer colorrectal. Además, creemos que el modelo propuesto se puede aplicar no solo al cáncer colorrectal sino también a otras enfermedades relacionadas con genes.