logo móvil
Contáctanos

Un enfoque de computación hiperdimensional inspirado en el cerebro para clasificar datos masivos de metilación del ADN del cáncer

Autores: Cumbo, Fabio; Cappelli, Eleonora; Weitschek, Emanuel

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Un enfoque de computación hiperdimensional inspirado en el cerebro para clasificar datos masivos de metilación del ADN del cáncer


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Avances
Genómica del cáncer
Metilación del ADN
Tumorigénesis
Algoritmo de aprendizaje automático
Clasificación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 37

Citaciones: Sin citaciones


Descripción
Los recientes avances en genómica del cáncer han puesto bajo el foco la metilación del ADN, una modificación genética que regula el funcionamiento del genoma y cuyas modificaciones tienen un papel importante en la tumorigénesis y la supresión de tumores. Debido a la alta dimensionalidad y la enorme cantidad de datos genómicos que se producen a través de los últimos avances en secuenciación de próxima generación, es muy desafiante hacer un uso efectivo de los datos de metilación del ADN en aplicaciones de diagnóstico, por ejemplo, en la identificación de muestras sanas vs enfermas. Además, las técnicas de vanguardia no son lo suficientemente rápidas para producir resultados confiables rápidamente o eficientes en el manejo de esas enormes cantidades de datos. Por esta razón, proponemos HD-classifier, un algoritmo de aprendizaje automático supervisado hiperdimensional (HD) basado en la memoria cognitiva para la clasificación de muestras tumorales vs no tumorales a través del análisis de sus datos de Metilación del ADN. El enfoque se inspira en cómo el cerebro humano es capaz de recordar y distinguir conceptos simples y complejos adoptando hiper vectores y no valores numéricos únicos. Exactamente como funciona el cerebro, esto permite codificar patrones complejos, lo que hace que toda la arquitectura sea robusta ante fallos y errores también con datos ruidosos. Diseñamos y desarrollamos un algoritmo y una herramienta de software que es capaz de realizar clasificación supervisada con el enfoque HD. Realizamos experimentos en tres conjuntos de datos de metilación del ADN de diferentes tipos de cáncer para demostrar la validez de nuestro algoritmo, es decir, Carcinoma Invasivo de Mama (BRCA), Carcinoma de Células Renales Papilares (KIRP) y Carcinoma de Tiroides (THCA). Obtenemos resultados sobresalientes en términos de precisión y tiempo computacional con una baja cantidad de recursos computacionales. Además, validamos nuestro enfoque comparándolo (i) con BIGBIOCL, un software basado en Random Forest para clasificar grandes conjuntos de datos ómicos en entornos de computación distribuida, (ii) con Máquina de Vectores de Soporte (SVM) y (iii) con métodos de clasificación de Árbol de Decisión de vanguardia. Finalmente, liberamos de forma gratuita tanto los conjuntos de datos como el software en GitHub.

Otros recursos que podrían interesarte

Temas Virtualpro