logo móvil
Contáctanos

Un enfoque de dos fases para la selección de características semi-supervisada

Autores: Saxena, Amit; Pare, Shreya; Meena, Mahendra Singh; Gupta, Deepak; Gupta, Akshansh; Razzak, Imran; Lin, Chin-Teng; Prasad, Mukesh

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Un enfoque de dos fases para la selección de características semi-supervisada


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Propuesto
Características
Conjunto de datos
Fase-i
Fase-ii
Clasificación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 46

Citaciones: Sin citaciones


Descripción
Este documento propone un enfoque novedoso para seleccionar un subconjunto de características en conjuntos de datos semisupervisados donde solo algunas de las pautas están etiquetadas. Todo el proceso se completa en dos fases. En la primera fase, es decir, Fase-I, el conjunto de datos se divide en dos partes: La primera parte, que contiene patrones etiquetados, y la segunda parte, que contiene patrones no etiquetados. En la primera parte, se identifica un pequeño número de características utilizando enfoques de selección de características basados en máxima relevancia (de la primera parte) y mínima redundancia (conjunto de datos completo) utilizando el coeficiente de correlación. El subconjunto de características del conjunto identificado de características, que produce una alta precisión de clasificación utilizando cualquier clasificador supervisado a partir de patrones etiquetados, se selecciona para su posterior procesamiento. En la segunda fase, es decir, Fase-II, los patrones pertenecientes a la primera y segunda parte se agrupan por separado en el número disponible de clases del conjunto de datos. En los grupos de la primera parte, se toma la mayoría de los patrones pertenecientes a un grupo como la clase para ese grupo, que ya está dada. Se forman los pares de centroides de los grupos creados en la primera y segunda parte. El centroide de la segunda parte más cercano a un centroide de la primera parte se emparejará. Dado que se conoce la clase del primer centroide, la misma clase se puede asignar al centroide del grupo de la segunda parte, que es desconocido. La clase real de los patrones, si se conoce para la segunda parte del conjunto de datos, se puede utilizar para probar la precisión de clasificación de los patrones en la segunda parte. El enfoque propuesto de dos fases funciona bien en términos de precisión de clasificación y número de características seleccionadas en los conjuntos de datos de referencia dados.

Otros recursos que podrían interesarte

Temas Virtualpro