logo móvil
Contáctanos

Investigación sobre la combinación de Logitboost (M5P) en tareas de clasificación de aprendizaje activo

Autores: Kazllarof, Vangjel; Karlos, Stamatis; Kotsiantis, Sotiris

Idioma: Inglés

Editor: MDPI

Año: 2020

Descargar PDF

Acceso abierto

Artículo científico
2020

Investigación sobre la combinación de Logitboost (M5P) en tareas de clasificación de aprendizaje activo


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Aprendizaje activo
Algoritmos
Logitboost
Algoritmos de conjunto
Aprendiz base de regresión
Aumento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El aprendizaje activo es la categoría de algoritmos parcialmente supervisados que se diferencia por su estrategia de combinar tanto la capacidad predictiva de un aprendiz base como el conocimiento humano para explotar adecuadamente la existencia de datos no etiquetados. Su ambición es componer algoritmos de aprendizaje potentes que, de otro modo, se basarían únicamente en muestras etiquetadas insuficientes. Dado que este último tipo de información podría generar importantes costos de monetización y obstáculos de tiempo, la contribución humana debería ser seriamente restringida en comparación con la anterior. Por esta razón, investigamos el uso del clasificador envolvente Logitboost, una variante popular de algoritmos de conjunto que adopta la técnica de boosting junto con un aprendiz base de regresión basado en árboles de modelo en 3 diferentes estrategias de consulta de aprendizaje activo. Estudiamos su eficiencia frente a 10 aprendices separados bajo un marco de aprendizaje activo bien descrito en 91 conjuntos de datos que han sido divididos en problemas binarios y multicategoría. También incluimos una variante típica de Logitboost con un regresor interno separado para discriminar los beneficios de adoptar un árbol de regresión más preciso que los árboles de un nodo, mientras examinamos la eficacia de un hiperparámetro del algoritmo propuesto. Dado que la aplicación de la técnica de boosting puede proporcionar predicciones en general menos sesgadas, asumimos que el algoritmo propuesto, denominado Logitboost(M5P), podría proporcionar decisiones tanto precisas como robustas en escenarios de aprendizaje activo que serían beneficiosos en tareas de clasificación débilmente supervisadas en la vida real. Su etapa de ponderación más suave sobre los casos mal clasificados durante el entrenamiento, así como el comportamiento preciso de M5P, son los principales factores que conducen a este rendimiento. Comparaciones estadísticas adecuadas sobre la métrica de precisión de clasificación verifican nuestras suposiciones, mientras que la adopción de M5P en lugar de árboles de decisión débiles demostró ser más competitiva para la mayoría de los problemas examinados. Presentamos nuestros resultados a través de enfoques de resumen apropiados y visualizaciones explicativas, comentando nuestros resultados por caso.

Otros recursos que podrían interesarte

Temas Virtualpro