logo móvil
Contáctanos

Modelo de Clasificación de Cáncer de Hígado Usando Selección de Características Híbrida Basada en Técnica Dependiente de Clase para la Región Central de Tailandia

Autores: Panthong, Rattanawadee; Srivihok, Anongnart

Idioma: Inglés

Editor: MDPI

Año: 2019

Descargar PDF

Acceso abierto

Artículo científico
2019

Modelo de Clasificación de Cáncer de Hígado Usando Selección de Características Híbrida Basada en Técnica Dependiente de Clase para la Región Central de Tailandia


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Gran cantidad
Conjuntos de datos multidimensionales
Selección de características
Rendimiento de clasificación
Cáncer de hígado
Modelo predictivo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Los datos del cáncer de hígado siempre consisten en un gran número de conjuntos de datos multidimensionales. Un conjunto de datos que tiene características enormes y múltiples clases puede ser irrelevante para la clasificación de patrones en el aprendizaje automático. Por lo tanto, la selección de características mejora el rendimiento del modelo de clasificación para lograr la máxima precisión en la clasificación. Los objetivos del presente estudio fueron encontrar el mejor subconjunto de características y evaluar el rendimiento de clasificación del modelo predictivo. Este artículo propuso un enfoque híbrido de selección de características combinando la ganancia de información y la selección secuencial hacia adelante basada en la técnica dependiente de la clase (IGSFS-CD) para el modelo de clasificación del cáncer de hígado. Se utilizaron dos clasificadores diferentes (árbol de decisión y Bayes ingenuo) para evaluar los subconjuntos de características. Los conjuntos de datos del cáncer de hígado se obtuvieron de la base de datos del Hospital de Cáncer de Tailandia. Se aplicaron tres métodos de conjunto (clasificadores de conjunto, bagging y AdaBoost) para mejorar el rendimiento de la clasificación. El método IGSFS-CD proporcionó una buena precisión del 78.36% (sensibilidad 0.7841 y especificidad 0.9159) en LC_dataset-1. Además, LC_dataset II ofreció el mejor rendimiento con una precisión del 84.82% (sensibilidad 0.8481 y especificidad 0.9437). El método IGSFS-CD logró un mejor rendimiento de clasificación en comparación con el método independiente de la clase. Además, la mejor selección de subconjuntos de características podría ayudar a reducir la complejidad del modelo predictivo.

Otros recursos que podrían interesarte

Temas Virtualpro