Un enfoque de regulación de variedad basado en prototipos para adaptación de deriva de conceptos semisupervisada con transferencia de conocimiento
Autores: Muhammad Zaly Shah, Muhammad Zafran; Zainal, Anazida; Elfadil Eisa, Taiseer Abdalla; Albasheer, Hashim; Ghaleb, Fuad A.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un enfoque de regulación de variedad basado en prototipos para adaptación de deriva de conceptos semisupervisada con transferencia de conocimiento
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Minería de flujo de datos
Detectores de cambio de concepto
Adaptabilidad a la no estacionariedad
Esfuerzo de etiquetado
Anticipación de cambios de concepto
Enfoque basado en conjuntos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La minería de flujos de datos se ocupa de procesar grandes cantidades de datos en entornos no estacionarios, donde la relación entre los datos y las etiquetas a menudo cambia. Tales relaciones dinámicas dificultan el diseño de un algoritmo de procesamiento de flujos de datos computacionalmente eficiente que también sea adaptable a la no estacionariedad del entorno. Para hacer que el algoritmo sea adaptable a la no estacionariedad del entorno, se adjuntan detectores de cambio de concepto para detectar los cambios en el entorno monitoreando las tasas de error y adaptándose al estado actual del entorno. Desafortunadamente, los enfoques actuales para adaptarse a los cambios ambientales asumen que el flujo de datos está completamente etiquetado. Suponer un flujo de datos completamente etiquetado es una suposición defectuosa ya que el esfuerzo de etiquetado sería demasiado impráctico debido a la llegada rápida y al volumen de los datos. Para abordar este problema, este estudio propone detectar cambios de concepto anticipando un posible cambio en la verdadera etiqueta en la región de predicción de alta confianza. Este estudio también propone un enfoque de adaptación al cambio de concepto basado en conjuntos que transfiere clasificadores confiables al nuevo concepto. La importancia de nuestro enfoque propuesto en comparación con las líneas de base actuales es que nuestro enfoque no utiliza una medida de rendimiento como señal de cambio o asume un cambio en la distribución de datos cuando ocurre un cambio de concepto. Como resultado, nuestro enfoque propuesto puede detectar cambios de concepto cuando los datos etiquetados son escasos, incluso cuando la distribución de datos permanece estática. Basándonos en los resultados, este enfoque propuesto puede detectar cambios de concepto y enfoques de minería de flujos de datos completamente supervisados y tiene un buen rendimiento en conjuntos de datos con cambios de concepto de severidad mixta.
Descripción
La minería de flujos de datos se ocupa de procesar grandes cantidades de datos en entornos no estacionarios, donde la relación entre los datos y las etiquetas a menudo cambia. Tales relaciones dinámicas dificultan el diseño de un algoritmo de procesamiento de flujos de datos computacionalmente eficiente que también sea adaptable a la no estacionariedad del entorno. Para hacer que el algoritmo sea adaptable a la no estacionariedad del entorno, se adjuntan detectores de cambio de concepto para detectar los cambios en el entorno monitoreando las tasas de error y adaptándose al estado actual del entorno. Desafortunadamente, los enfoques actuales para adaptarse a los cambios ambientales asumen que el flujo de datos está completamente etiquetado. Suponer un flujo de datos completamente etiquetado es una suposición defectuosa ya que el esfuerzo de etiquetado sería demasiado impráctico debido a la llegada rápida y al volumen de los datos. Para abordar este problema, este estudio propone detectar cambios de concepto anticipando un posible cambio en la verdadera etiqueta en la región de predicción de alta confianza. Este estudio también propone un enfoque de adaptación al cambio de concepto basado en conjuntos que transfiere clasificadores confiables al nuevo concepto. La importancia de nuestro enfoque propuesto en comparación con las líneas de base actuales es que nuestro enfoque no utiliza una medida de rendimiento como señal de cambio o asume un cambio en la distribución de datos cuando ocurre un cambio de concepto. Como resultado, nuestro enfoque propuesto puede detectar cambios de concepto cuando los datos etiquetados son escasos, incluso cuando la distribución de datos permanece estática. Basándonos en los resultados, este enfoque propuesto puede detectar cambios de concepto y enfoques de minería de flujos de datos completamente supervisados y tiene un buen rendimiento en conjuntos de datos con cambios de concepto de severidad mixta.