logo móvil
Contáctanos

Un modelo de bosque profundo en cascada para la clasificación de subtipos de cáncer de mama utilizando datos multiómicos

Autores: El-Nabawy, Ala"a; Belal, Nahla A.; El-Bendary, Nashwa

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Un modelo de bosque profundo en cascada para la clasificación de subtipos de cáncer de mama utilizando datos multiómicos


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Diagnóstico
Cáncer de mama
Cascada bosque profundo
Precisión de clasificación
Conjuntos de datos multi-ómicos
Expresión génica

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 40

Citaciones: Sin citaciones


Descripción
Los sistemas de diagnóstico automatizado tienen como objetivo reducir el costo del diagnóstico manteniendo la misma eficiencia. Muchos métodos se han utilizado para la clasificación de subtipos de cáncer de mama. Algunos utilizan una sola fuente de datos, mientras que otros integran muchas fuentes de datos, lo que resulta en una reducción del rendimiento computacional en lugar de la precisión. Los datos sobre el cáncer de mama, especialmente los datos biológicos, son conocidos por su desequilibrio, con una falta de cantidades extensas de imágenes histopatológicas como datos biológicos. Estudios recientes han demostrado que el modelo de conjunto de bosques profundos en cascada logra una precisión de clasificación competitiva en comparación con otras alternativas, como los métodos generales de aprendizaje de conjuntos y las redes neuronales profundas convencionales (DNN), especialmente para conjuntos de entrenamiento desequilibrados, a través del aprendizaje de hiperrepresentaciones mediante el uso de árboles de decisión de conjunto en cascada. En este trabajo, se emplea un bosque profundo en cascada para clasificar los subtipos de cáncer de mama, IntClust y Pam50, utilizando conjuntos de datos multi-ómicos y diferentes configuraciones. Los resultados obtenidos registraron una precisión del 83.45% para 5 subtipos y del 77.55% para 10 subtipos. La importancia de este trabajo radica en que se muestra que el uso de datos de expresión génica solo con el clasificador de bosques profundos en cascada logra una precisión comparable a otras técnicas con un mayor rendimiento computacional, donde el tiempo registrado es de aproximadamente 5 segundos para 10 subtipos y 7 segundos para 5 subtipos.

Otros recursos que podrían interesarte

Temas Virtualpro