Yet another discriminant analysis (YADA): un modelo probabilístico para aplicaciones de aprendizaje automático
Autores: Field, Richard V.; Smith, Michael R.; Wuest, Ellery J.; Ingram, Joe B.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Yet another discriminant analysis (YADA): un modelo probabilístico para aplicaciones de aprendizaje automático
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Aprendizaje automático
Modelo probabilístico
Aprendizaje profundo
YADA
Clasificación
Cuantificación de incertidumbre
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
Este documento presenta un modelo probabilístico para varias aplicaciones de aprendizaje automático (ML). Mientras que el aprendizaje profundo (DL) ha producido resultados de vanguardia en muchos dominios, los modelos de DL son complejos y sobreparametrizados, lo que conlleva una alta incertidumbre sobre lo que el modelo ha aprendido, así como su proceso de decisión. Además, los modelos de DL no son probabilísticos, lo que dificulta razonar sobre su salida. En contraste, el modelo propuesto, denominado Yet Another Discriminate Analysis (YADA), es menos complejo que otros métodos, se basa en una base matemáticamente rigurosa y puede utilizarse para una amplia variedad de tareas de ML, incluyendo clasificación, explicabilidad y cuantificación de incertidumbre. Por lo tanto, YADA es competitivo en la mayoría de los casos con muchos modelos de DL de vanguardia. Idealmente, un modelo probabilístico representaría la distribución conjunta completa de probabilidad de sus características, pero hacerlo a menudo es computacionalmente costoso e intratable. Por lo tanto, muchos modelos probabilísticos asumen que las características están distribuidas normalmente, son mutuamente independientes, o ambas, lo que puede limitar severamente su rendimiento. YADA es un modelo intermedio que (1) captura las distribuciones marginales de cada variable y las correlaciones entre variables y (2) mapea explícitamente las características al espacio de variables gaussianas multivariadas. Se pueden derivar numerosas propiedades matemáticas del modelo YADA, mejorando así los fundamentos teóricos de ML. La validación del modelo se puede verificar estadísticamente en datos nuevos o retenidos utilizando propiedades nativas de YADA. Sin embargo, hay algunos desafíos de ingeniería y prácticos que enumeramos para hacer que YADA sea más útil.
Descripción
Este documento presenta un modelo probabilístico para varias aplicaciones de aprendizaje automático (ML). Mientras que el aprendizaje profundo (DL) ha producido resultados de vanguardia en muchos dominios, los modelos de DL son complejos y sobreparametrizados, lo que conlleva una alta incertidumbre sobre lo que el modelo ha aprendido, así como su proceso de decisión. Además, los modelos de DL no son probabilísticos, lo que dificulta razonar sobre su salida. En contraste, el modelo propuesto, denominado Yet Another Discriminate Analysis (YADA), es menos complejo que otros métodos, se basa en una base matemáticamente rigurosa y puede utilizarse para una amplia variedad de tareas de ML, incluyendo clasificación, explicabilidad y cuantificación de incertidumbre. Por lo tanto, YADA es competitivo en la mayoría de los casos con muchos modelos de DL de vanguardia. Idealmente, un modelo probabilístico representaría la distribución conjunta completa de probabilidad de sus características, pero hacerlo a menudo es computacionalmente costoso e intratable. Por lo tanto, muchos modelos probabilísticos asumen que las características están distribuidas normalmente, son mutuamente independientes, o ambas, lo que puede limitar severamente su rendimiento. YADA es un modelo intermedio que (1) captura las distribuciones marginales de cada variable y las correlaciones entre variables y (2) mapea explícitamente las características al espacio de variables gaussianas multivariadas. Se pueden derivar numerosas propiedades matemáticas del modelo YADA, mejorando así los fundamentos teóricos de ML. La validación del modelo se puede verificar estadísticamente en datos nuevos o retenidos utilizando propiedades nativas de YADA. Sin embargo, hay algunos desafíos de ingeniería y prácticos que enumeramos para hacer que YADA sea más útil.