logo móvil
Contáctanos

Toma de decisiones sobre el diagnóstico de enfermedades oncológicas utilizando clasificadores SVM sensibles al costo basados en conjuntos de datos con una variedad de características de diferentes naturalezas

Autores: Demidova, Liliya A.

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Toma de decisiones sobre el diagnóstico de enfermedades oncológicas utilizando clasificadores SVM sensibles al costo basados en conjuntos de datos con una variedad de características de diferentes naturalezas


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Detectando cáncer
Biomarcadores
Clasificadores SVM
Conjuntos de datos
Algoritmo UMAP
Marcadores de proteínas en la sangre

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 37

Citaciones: Sin citaciones


Descripción
Este documento discute el problema de detectar cáncer utilizando biomarcadores como marcadores proteicos en la sangre. El propósito de esta investigación es proponer un enfoque para la toma de decisiones en el diagnóstico del cáncer a través de la creación de clasificadores SVM sensibles al costo basados en conjuntos de datos con una variedad de características de diferente naturaleza. Tales conjuntos de datos pueden incluir composiciones de características conocidas correspondientes a marcadores proteicos en la sangre y nuevas características construidas utilizando métodos para calcular entropía y dimensiones fractales, así como utilizando el algoritmo UMAP. Con base en estos conjuntos de datos, se desarrollaron clasificadores SVM multiclase. Utilizan principios de aprendizaje sensibles al costo para superar el problema de desequilibrio de clases, que es típico en conjuntos de datos médicos. Al implementar el algoritmo UMAP, se consideraron varias variantes de la función de pérdida. Esto se realizó para seleccionar aquellas que proporcionan la formación de nuevas características que en última instancia nos permiten desarrollar los mejores clasificadores SVM sensibles al costo en términos de maximizar el valor medio de la métrica. Los resultados experimentales demostraron la posibilidad de aplicar el algoritmo UMAP, entropía aproximada y, además, dimensiones fractales de Higuchi y Katz para construir nuevas características utilizando marcadores proteicos en la sangre. Se descubrió que al trabajar con el algoritmo UMAP, lo más prometedor es la aplicación de una función de pérdida basada en entropía cruzada difusa, y lo menos prometedor es la aplicación de una función de pérdida basada en entropía cruzada intuitiva. La ampliación del conjunto de datos original con características basadas en el algoritmo UMAP, características basadas en el algoritmo UMAP y entropía aproximada, o características basadas en la entropía aproximada proporcionó la creación de los tres mejores clasificadores SVM sensibles al costo con valores medios de la métrica aumentados en un 5.359%, 5.245% y 4.675%, respectivamente, en comparación con los valores medios de esta métrica en el caso en que solo se utilizó el conjunto de datos original para crear el clasificador SVM base (sin realizar ninguna manipulación para superar el problema de desequilibrio de clases, y también sin introducir nuevas características).

Otros recursos que podrían interesarte

Temas Virtualpro