Multikoc: clasificador de varias clases basado en agrupamiento k-means
Autores: Abdallah, Loai; Badarna, Murad; Khalifa, Waleed; Yousef, Malik
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Multikoc: clasificador de varias clases basado en agrupamiento k-means
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Biología computacional
Clasificación multi-clase única
Tipos de tumores
Reconocimiento de pliegues de proteínas
Tipos de cáncer
Algoritmo MultiKOC
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
En la comunidad de biología computacional hay muchos casos biológicos que se consideran como problemas de clasificación multi-one-class. Ejemplos incluyen la clasificación de múltiples tipos de tumores, el reconocimiento del plegamiento de proteínas y la clasificación molecular de múltiples tipos de cáncer. En todos estos casos, los casos negativos adecuadamente caracterizados del mundo real o los valores atípicos son imprácticos de lograr y los casos positivos pueden consistir en diferentes grupos, lo que a su vez puede llevar a una degradación de la precisión. En este documento presentamos un algoritmo novedoso llamado MultiKOC clasificadores multi-one-class basados en K-means para abordar este problema. La idea principal es ejecutar un algoritmo de agrupamiento sobre las muestras positivas para capturar los subdatos ocultos de los datos positivos dados, y luego construir un clasificador one-class para cada ejemplo de miembro del grupo por separado: en otras palabras, entrenar al clasificador OC en cada pieza de subdatos. Para una nueva muestra dada, se aplican los clasificadores generados. Si es rechazado por todos esos clasificadores, la muestra dada se considera como una muestra negativa, de lo contrario es una muestra positiva. Los resultados de MultiKOC se comparan con los métodos tradicionales de one-class, multi-one-class, ensemble one-classes y two-class, lo que resulta en una mejora significativa sobre el rendimiento de one-class y similar al rendimiento de two-class.
Descripción
En la comunidad de biología computacional hay muchos casos biológicos que se consideran como problemas de clasificación multi-one-class. Ejemplos incluyen la clasificación de múltiples tipos de tumores, el reconocimiento del plegamiento de proteínas y la clasificación molecular de múltiples tipos de cáncer. En todos estos casos, los casos negativos adecuadamente caracterizados del mundo real o los valores atípicos son imprácticos de lograr y los casos positivos pueden consistir en diferentes grupos, lo que a su vez puede llevar a una degradación de la precisión. En este documento presentamos un algoritmo novedoso llamado MultiKOC clasificadores multi-one-class basados en K-means para abordar este problema. La idea principal es ejecutar un algoritmo de agrupamiento sobre las muestras positivas para capturar los subdatos ocultos de los datos positivos dados, y luego construir un clasificador one-class para cada ejemplo de miembro del grupo por separado: en otras palabras, entrenar al clasificador OC en cada pieza de subdatos. Para una nueva muestra dada, se aplican los clasificadores generados. Si es rechazado por todos esos clasificadores, la muestra dada se considera como una muestra negativa, de lo contrario es una muestra positiva. Los resultados de MultiKOC se comparan con los métodos tradicionales de one-class, multi-one-class, ensemble one-classes y two-class, lo que resulta en una mejora significativa sobre el rendimiento de one-class y similar al rendimiento de two-class.