Métodos de aprendizaje automático para la clasificación del cáncer utilizando datos de expresión génica: una revisión
Autores: Alharbi, Fadi; Vakanski, Aleksandar
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Métodos de aprendizaje automático para la clasificación del cáncer utilizando datos de expresión génica: una revisión
Categoría
Ingeniería y Tecnología
Subcategoría
Bioingeniería
Palabras clave
Cáncer
Expresión génica
Aprendizaje profundo
Aprendizaje automático
Preprocesamiento de datos
Patrones génicos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
El cáncer es un término que denota un grupo de enfermedades causadas por el crecimiento anormal de células que pueden propagarse en diferentes partes del cuerpo. Según la Organización Mundial de la Salud (OMS), el cáncer es la segunda causa principal de muerte después de las enfermedades cardiovasculares. La expresión génica puede desempeñar un papel fundamental en la detección temprana del cáncer, ya que es indicativa de los procesos bioquímicos en tejidos y células, así como de las características genéticas de un organismo. Los microarreglos de ácido desoxirribonucleico (ADN) y los métodos de secuenciación de ácido ribonucleico (ARN) para datos de expresión génica permiten cuantificar los niveles de expresión de genes y producir datos valiosos para el análisis computacional. Este estudio revisa los avances recientes en el análisis de la expresión génica para la clasificación del cáncer utilizando métodos de aprendizaje automático. Se revisan enfoques basados en aprendizaje convencional y profundo, con énfasis en la aplicación de modelos de aprendizaje profundo debido a sus ventajas comparativas para identificar patrones génicos distintivos para varios tipos de cáncer. Se cubren trabajos relevantes que emplean las arquitecturas de redes neuronales profundas más comúnmente utilizadas, incluyendo perceptrones de múltiples capas, así como redes convolucionales, recurrentes, de grafos y transformadores. Esta encuesta también presenta una descripción general de los métodos de recolección de datos para el análisis de la expresión génica y enumera conjuntos de datos importantes que se utilizan comúnmente para el aprendizaje supervisado de máquinas para esta tarea. Además, revisamos técnicas pertinentes para la ingeniería de características y el preprocesamiento de datos que se utilizan típicamente para manejar la alta dimensionalidad de los datos de expresión génica, causada por un gran número de genes presentes en las muestras de datos. El documento concluye con una discusión de las futuras direcciones de investigación para el análisis de la expresión génica basado en el aprendizaje automático para la clasificación del cáncer.
Descripción
El cáncer es un término que denota un grupo de enfermedades causadas por el crecimiento anormal de células que pueden propagarse en diferentes partes del cuerpo. Según la Organización Mundial de la Salud (OMS), el cáncer es la segunda causa principal de muerte después de las enfermedades cardiovasculares. La expresión génica puede desempeñar un papel fundamental en la detección temprana del cáncer, ya que es indicativa de los procesos bioquímicos en tejidos y células, así como de las características genéticas de un organismo. Los microarreglos de ácido desoxirribonucleico (ADN) y los métodos de secuenciación de ácido ribonucleico (ARN) para datos de expresión génica permiten cuantificar los niveles de expresión de genes y producir datos valiosos para el análisis computacional. Este estudio revisa los avances recientes en el análisis de la expresión génica para la clasificación del cáncer utilizando métodos de aprendizaje automático. Se revisan enfoques basados en aprendizaje convencional y profundo, con énfasis en la aplicación de modelos de aprendizaje profundo debido a sus ventajas comparativas para identificar patrones génicos distintivos para varios tipos de cáncer. Se cubren trabajos relevantes que emplean las arquitecturas de redes neuronales profundas más comúnmente utilizadas, incluyendo perceptrones de múltiples capas, así como redes convolucionales, recurrentes, de grafos y transformadores. Esta encuesta también presenta una descripción general de los métodos de recolección de datos para el análisis de la expresión génica y enumera conjuntos de datos importantes que se utilizan comúnmente para el aprendizaje supervisado de máquinas para esta tarea. Además, revisamos técnicas pertinentes para la ingeniería de características y el preprocesamiento de datos que se utilizan típicamente para manejar la alta dimensionalidad de los datos de expresión génica, causada por un gran número de genes presentes en las muestras de datos. El documento concluye con una discusión de las futuras direcciones de investigación para el análisis de la expresión génica basado en el aprendizaje automático para la clasificación del cáncer.