Aprendizaje por Conjuntos Basado en Núcleos en Python
Autores: Guedj, Benjamin; Srinivasa Desikan, Bhargav
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Aprendizaje por Conjuntos Basado en Núcleos en Python
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Algoritmo de aprendizaje supervisado
Clasificación
Regresión
KernelCobra
Algoritmo COBRA
Predictores
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Proponemos un nuevo algoritmo de aprendizaje supervisado para problemas de clasificación y regresión donde están disponibles dos o más predictores preliminares. Introducimos KernelCobra, una estrategia de aprendizaje no lineal para combinar un número arbitrario de predictores iniciales. KernelCobra se basa en el algoritmo COBRA introducido por Biau et al. (2016), que combinó estimadores basados en una noción de proximidad de las predicciones en los datos de entrenamiento. Mientras que el algoritmo COBRA utilizó un umbral binario para declarar qué datos de entrenamiento estaban cerca y debían ser utilizados, generalizamos esta idea utilizando un núcleo para encapsular mejor la información de proximidad. Tal núcleo de suavizado proporciona pesos más representativos a cada uno de los puntos de entrenamiento que se utilizan para construir el predictor agregado y final, y KernelCobra supera sistemáticamente al algoritmo COBRA. Mientras que COBRA está destinado a la regresión, KernelCobra se ocupa de la clasificación y la regresión. KernelCobra se incluye como parte del paquete de Python de código abierto Pycobra (0.2.4 y posteriores), introducido por Srinivasa Desikan (2018). Se llevaron a cabo experimentos numéricos para evaluar el rendimiento (en términos de predicción pura y complejidad computacional) de KernelCobra en conjuntos de datos reales y sintéticos.
Descripción
Proponemos un nuevo algoritmo de aprendizaje supervisado para problemas de clasificación y regresión donde están disponibles dos o más predictores preliminares. Introducimos KernelCobra, una estrategia de aprendizaje no lineal para combinar un número arbitrario de predictores iniciales. KernelCobra se basa en el algoritmo COBRA introducido por Biau et al. (2016), que combinó estimadores basados en una noción de proximidad de las predicciones en los datos de entrenamiento. Mientras que el algoritmo COBRA utilizó un umbral binario para declarar qué datos de entrenamiento estaban cerca y debían ser utilizados, generalizamos esta idea utilizando un núcleo para encapsular mejor la información de proximidad. Tal núcleo de suavizado proporciona pesos más representativos a cada uno de los puntos de entrenamiento que se utilizan para construir el predictor agregado y final, y KernelCobra supera sistemáticamente al algoritmo COBRA. Mientras que COBRA está destinado a la regresión, KernelCobra se ocupa de la clasificación y la regresión. KernelCobra se incluye como parte del paquete de Python de código abierto Pycobra (0.2.4 y posteriores), introducido por Srinivasa Desikan (2018). Se llevaron a cabo experimentos numéricos para evaluar el rendimiento (en términos de predicción pura y complejidad computacional) de KernelCobra en conjuntos de datos reales y sintéticos.