Modelo de Clasificación de Cáncer de Hígado Usando Selección de Características Híbrida Basada en Técnica Dependiente de Clase para la Región Central de Tailandia
Autores: Panthong, Rattanawadee; Srivihok, Anongnart
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Modelo de Clasificación de Cáncer de Hígado Usando Selección de Características Híbrida Basada en Técnica Dependiente de Clase para la Región Central de Tailandia
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Gran cantidad
Conjuntos de datos multidimensionales
Selección de características
Rendimiento de clasificación
Cáncer de hígado
Modelo predictivo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los datos del cáncer de hígado siempre consisten en un gran número de conjuntos de datos multidimensionales. Un conjunto de datos que tiene características enormes y múltiples clases puede ser irrelevante para la clasificación de patrones en el aprendizaje automático. Por lo tanto, la selección de características mejora el rendimiento del modelo de clasificación para lograr la máxima precisión en la clasificación. Los objetivos del presente estudio fueron encontrar el mejor subconjunto de características y evaluar el rendimiento de clasificación del modelo predictivo. Este artículo propuso un enfoque híbrido de selección de características combinando la ganancia de información y la selección secuencial hacia adelante basada en la técnica dependiente de la clase (IGSFS-CD) para el modelo de clasificación del cáncer de hígado. Se utilizaron dos clasificadores diferentes (árbol de decisión y Bayes ingenuo) para evaluar los subconjuntos de características. Los conjuntos de datos del cáncer de hígado se obtuvieron de la base de datos del Hospital de Cáncer de Tailandia. Se aplicaron tres métodos de conjunto (clasificadores de conjunto, bagging y AdaBoost) para mejorar el rendimiento de la clasificación. El método IGSFS-CD proporcionó una buena precisión del 78.36% (sensibilidad 0.7841 y especificidad 0.9159) en LC_dataset-1. Además, LC_dataset II ofreció el mejor rendimiento con una precisión del 84.82% (sensibilidad 0.8481 y especificidad 0.9437). El método IGSFS-CD logró un mejor rendimiento de clasificación en comparación con el método independiente de la clase. Además, la mejor selección de subconjuntos de características podría ayudar a reducir la complejidad del modelo predictivo.
Descripción
Los datos del cáncer de hígado siempre consisten en un gran número de conjuntos de datos multidimensionales. Un conjunto de datos que tiene características enormes y múltiples clases puede ser irrelevante para la clasificación de patrones en el aprendizaje automático. Por lo tanto, la selección de características mejora el rendimiento del modelo de clasificación para lograr la máxima precisión en la clasificación. Los objetivos del presente estudio fueron encontrar el mejor subconjunto de características y evaluar el rendimiento de clasificación del modelo predictivo. Este artículo propuso un enfoque híbrido de selección de características combinando la ganancia de información y la selección secuencial hacia adelante basada en la técnica dependiente de la clase (IGSFS-CD) para el modelo de clasificación del cáncer de hígado. Se utilizaron dos clasificadores diferentes (árbol de decisión y Bayes ingenuo) para evaluar los subconjuntos de características. Los conjuntos de datos del cáncer de hígado se obtuvieron de la base de datos del Hospital de Cáncer de Tailandia. Se aplicaron tres métodos de conjunto (clasificadores de conjunto, bagging y AdaBoost) para mejorar el rendimiento de la clasificación. El método IGSFS-CD proporcionó una buena precisión del 78.36% (sensibilidad 0.7841 y especificidad 0.9159) en LC_dataset-1. Además, LC_dataset II ofreció el mejor rendimiento con una precisión del 84.82% (sensibilidad 0.8481 y especificidad 0.9437). El método IGSFS-CD logró un mejor rendimiento de clasificación en comparación con el método independiente de la clase. Además, la mejor selección de subconjuntos de características podría ayudar a reducir la complejidad del modelo predictivo.