¡bayes en el país de las maravillas! la inferencia predictiva de clasificación supervisada se enfrenta a la imprevisibilidad
Autores: Amiryousefi, Ali; Kinnula, Ville; Tang, Jing
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
¡bayes en el país de las maravillas! la inferencia predictiva de clasificación supervisada se enfrenta a la imprevisibilidad
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Marginal
Bayesiano
Predictivo
Clasificadores
Datos de entrenamiento
Modelo generativo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Los clasificadores predictivos bayesianos marginales (mBpc), a diferencia de los clasificadores predictivos bayesianos simultáneos (sBpc), manejan cada dato por separado y, por lo tanto, asumen tácitamente la independencia de las observaciones. Debido a la saturación en el aprendizaje de los parámetros del modelo generativo, el efecto adverso de esta falsa suposición en la precisión de mBpc tiende a desaparecer frente a una cantidad creciente de datos de entrenamiento, garantizando la convergencia de estos dos clasificadores bajo el tipo de intercambiabilidad de de Finetti. Sin embargo, este resultado está lejos de ser trivial para las secuencias generadas bajo la Intercambiabilidad de Partición (PE), donde incluso una gran cantidad de datos de entrenamiento no descarta la posibilidad de un resultado no observado (¡País de las Maravillas!). Proporcionamos un esquema computacional que permite la generación de las secuencias bajo PE. Basándonos en eso, con un aumento controlado de los datos de entrenamiento, mostramos la convergencia de los sBpc y mBpc. Esto subyace en el uso de clasificadores marginales más simples pero computacionalmente más eficientes en lugar de simultáneos. También proporcionamos una estimación de parámetros del modelo generativo que da lugar a la secuencia intercambiable por particiones, así como un paradigma de prueba para la igualdad de este parámetro entre diferentes muestras. El paquete para clasificaciones supervisadas predictivas bayesianas, estimación de parámetros y pruebas de hipótesis del modelo generativo de la fórmula de muestreo de Ewens está depositado en CRAN como paquete.
Descripción
Los clasificadores predictivos bayesianos marginales (mBpc), a diferencia de los clasificadores predictivos bayesianos simultáneos (sBpc), manejan cada dato por separado y, por lo tanto, asumen tácitamente la independencia de las observaciones. Debido a la saturación en el aprendizaje de los parámetros del modelo generativo, el efecto adverso de esta falsa suposición en la precisión de mBpc tiende a desaparecer frente a una cantidad creciente de datos de entrenamiento, garantizando la convergencia de estos dos clasificadores bajo el tipo de intercambiabilidad de de Finetti. Sin embargo, este resultado está lejos de ser trivial para las secuencias generadas bajo la Intercambiabilidad de Partición (PE), donde incluso una gran cantidad de datos de entrenamiento no descarta la posibilidad de un resultado no observado (¡País de las Maravillas!). Proporcionamos un esquema computacional que permite la generación de las secuencias bajo PE. Basándonos en eso, con un aumento controlado de los datos de entrenamiento, mostramos la convergencia de los sBpc y mBpc. Esto subyace en el uso de clasificadores marginales más simples pero computacionalmente más eficientes en lugar de simultáneos. También proporcionamos una estimación de parámetros del modelo generativo que da lugar a la secuencia intercambiable por particiones, así como un paradigma de prueba para la igualdad de este parámetro entre diferentes muestras. El paquete para clasificaciones supervisadas predictivas bayesianas, estimación de parámetros y pruebas de hipótesis del modelo generativo de la fórmula de muestreo de Ewens está depositado en CRAN como paquete.