Explicando perfiles de expresión génica del cáncer de ovario con reglas difusas y algoritmos genéticos
Autores: Consiglio, Arianna; Casalino, Gabriella; Castellano, Giovanna; Grillo, Giorgio; Perlino, Elda; Vessio, Gennaro; Licciulli, Flavio
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Explicando perfiles de expresión génica del cáncer de ovario con reglas difusas y algoritmos genéticos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Análisis de datos de expresión génica
Herramientas
Pipelines
Modelos de aprendizaje profundo
Algoritmos genéticos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 41
Citaciones: Sin citaciones
El análisis de datos de expresión génica es una tarea compleja, y existen muchas herramientas y flujos de trabajo disponibles para manejar grandes conjuntos de datos de secuenciación para estudios de caso-control (bivariados). En algunos casos, como en estudios piloto o exploratorios, el investigador necesita comparar más de dos grupos de muestras que consisten en unos pocos replicados. Tanto los flujos de trabajo bioinformáticos estadísticos estándar como los innovadores modelos de aprendizaje profundo no son adecuados para extraer patrones e información interpretables de tales conjuntos de datos. En este trabajo, aplicamos una combinación de sistemas de reglas difusas y algoritmos genéticos para analizar un conjunto de datos compuesto por 21 muestras y 6 clases, útil para abordar el estudio de perfiles de expresión en cáncer de ovario, en comparación con otras enfermedades ováricas. El método propuesto es capaz de realizar una selección de características entre genes guiada por el algoritmo genético, y de construir un conjunto de reglas que explican cómo las clases pueden distinguirse observando cambios en la expresión de genes seleccionados. Después de probar varios parámetros, el modelo final consta de 10 genes involucrados en las vías moleculares del cáncer y 10 reglas que clasifican correctamente todas las muestras.
Descripción
El análisis de datos de expresión génica es una tarea compleja, y existen muchas herramientas y flujos de trabajo disponibles para manejar grandes conjuntos de datos de secuenciación para estudios de caso-control (bivariados). En algunos casos, como en estudios piloto o exploratorios, el investigador necesita comparar más de dos grupos de muestras que consisten en unos pocos replicados. Tanto los flujos de trabajo bioinformáticos estadísticos estándar como los innovadores modelos de aprendizaje profundo no son adecuados para extraer patrones e información interpretables de tales conjuntos de datos. En este trabajo, aplicamos una combinación de sistemas de reglas difusas y algoritmos genéticos para analizar un conjunto de datos compuesto por 21 muestras y 6 clases, útil para abordar el estudio de perfiles de expresión en cáncer de ovario, en comparación con otras enfermedades ováricas. El método propuesto es capaz de realizar una selección de características entre genes guiada por el algoritmo genético, y de construir un conjunto de reglas que explican cómo las clases pueden distinguirse observando cambios en la expresión de genes seleccionados. Después de probar varios parámetros, el modelo final consta de 10 genes involucrados en las vías moleculares del cáncer y 10 reglas que clasifican correctamente todas las muestras.