Algoritmo mejorado de k-medias restringido para agrupamiento con conocimiento de dominio
Autores: Huang, Peihuang; Yao, Pei; Hao, Zhendong; Peng, Huihong; Guo, Longkun
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Algoritmo mejorado de k-medias restringido para agrupamiento con conocimiento de dominio
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Tremendo desarrollo
Tecnología de aprendizaje automático
Conocimiento de dominio
Precisión de agrupamiento
-means restringido
Simulación numérica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Al presenciar el tremendo desarrollo de la tecnología de aprendizaje automático, las aplicaciones emergentes de aprendizaje automático imponen desafíos en el uso del conocimiento de dominio para mejorar la precisión de la agrupación, dado que la agrupación sufre una tasa de precisión comprometida a pesar de su ventaja de procesamiento rápido. En este documento, modelamos el conocimiento de dominio (es decir, conocimiento previo o información adicional), respetando algunas aplicaciones como conjuntos de enlaces obligatorios y no se pueden enlazar, con el fin de colaborar con -means para una mejor precisión. Primero proponemos un algoritmo para -means restringido, considerando solo los enlaces obligatorios. La idea clave es considerar un conjunto de puntos de datos restringidos por los enlaces obligatorios como un solo punto de datos con un peso igual a la suma de pesos de los puntos restringidos. Luego, para agrupar el conjunto de puntos de datos con no se pueden enlazar, empleamos un emparejamiento de peso mínimo para asignar los puntos de datos a los grupos existentes. Por último, realizamos una simulación numérica para evaluar los algoritmos propuestos frente a los conjuntos de datos de UCI, demostrando que nuestro método supera a los algoritmos anteriores para -means restringido, así como al -means tradicional en cuanto a la tasa de precisión de agrupación, aunque con un tiempo de ejecución práctico ligeramente comprometido.
Descripción
Al presenciar el tremendo desarrollo de la tecnología de aprendizaje automático, las aplicaciones emergentes de aprendizaje automático imponen desafíos en el uso del conocimiento de dominio para mejorar la precisión de la agrupación, dado que la agrupación sufre una tasa de precisión comprometida a pesar de su ventaja de procesamiento rápido. En este documento, modelamos el conocimiento de dominio (es decir, conocimiento previo o información adicional), respetando algunas aplicaciones como conjuntos de enlaces obligatorios y no se pueden enlazar, con el fin de colaborar con -means para una mejor precisión. Primero proponemos un algoritmo para -means restringido, considerando solo los enlaces obligatorios. La idea clave es considerar un conjunto de puntos de datos restringidos por los enlaces obligatorios como un solo punto de datos con un peso igual a la suma de pesos de los puntos restringidos. Luego, para agrupar el conjunto de puntos de datos con no se pueden enlazar, empleamos un emparejamiento de peso mínimo para asignar los puntos de datos a los grupos existentes. Por último, realizamos una simulación numérica para evaluar los algoritmos propuestos frente a los conjuntos de datos de UCI, demostrando que nuestro método supera a los algoritmos anteriores para -means restringido, así como al -means tradicional en cuanto a la tasa de precisión de agrupación, aunque con un tiempo de ejecución práctico ligeramente comprometido.