Predecir el rendimiento de la clasificación de conjunto utilizando la probabilidad conjunta condicional
Autores: Murtza, Iqbal; Kim, Jin-Young; Adnan, Muhammad
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Predecir el rendimiento de la clasificación de conjunto utilizando la probabilidad conjunta condicional
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Aprendizaje automático
Clasificación de conjunto
Aprendices base
Rendimiento de predicción
Teoría de probabilidad
Probabilidades de decisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
En muchas aplicaciones de aprendizaje automático, hay muchos escenarios en los que el rendimiento no es satisfactorio con clasificadores individuales. En este caso, se construye una clasificación de conjunto utilizando varios aprendices base débiles para lograr un rendimiento satisfactorio. Lamentablemente, la construcción de la clasificación de conjunto es empírica, es decir, se intenta una clasificación de conjunto y si el rendimiento no es satisfactorio, entonces se descarta. En este documento, se considera un problema analítico desafiante de la estimación de la clasificación de conjunto utilizando el rendimiento de predicción de los aprendices base. La formulación propuesta tiene como objetivo estimar el rendimiento de la clasificación de conjunto sin desarrollarlo físicamente y se deriva desde la perspectiva de la teoría de la probabilidad al manipular las probabilidades de decisión de los aprendices base. Con este propósito, la salida de un aprendiz base (que puede ser verdadero positivo, verdadero negativo, falso positivo o falso negativo) se considera una variable aleatoria. Luego, se analizan los efectos de las estrategias de combinación de decisiones basadas en la disyunción lógica y la votación mayoritaria desde la perspectiva de la probabilidad conjunta condicional. Para evaluar el rendimiento pronosticado del clasificador de conjunto mediante la metodología propuesta, se han empleado conjuntos de datos estándar públicamente disponibles. Los resultados muestran la efectividad de las formulaciones derivadas para estimar el rendimiento de la clasificación de conjunto. Además, los resultados teóricos y experimentales muestran que la decisión basada en la disyunción lógica supera a la votación mayoritaria en conjuntos de datos desequilibrados y escenarios sensibles al costo.
Descripción
En muchas aplicaciones de aprendizaje automático, hay muchos escenarios en los que el rendimiento no es satisfactorio con clasificadores individuales. En este caso, se construye una clasificación de conjunto utilizando varios aprendices base débiles para lograr un rendimiento satisfactorio. Lamentablemente, la construcción de la clasificación de conjunto es empírica, es decir, se intenta una clasificación de conjunto y si el rendimiento no es satisfactorio, entonces se descarta. En este documento, se considera un problema analítico desafiante de la estimación de la clasificación de conjunto utilizando el rendimiento de predicción de los aprendices base. La formulación propuesta tiene como objetivo estimar el rendimiento de la clasificación de conjunto sin desarrollarlo físicamente y se deriva desde la perspectiva de la teoría de la probabilidad al manipular las probabilidades de decisión de los aprendices base. Con este propósito, la salida de un aprendiz base (que puede ser verdadero positivo, verdadero negativo, falso positivo o falso negativo) se considera una variable aleatoria. Luego, se analizan los efectos de las estrategias de combinación de decisiones basadas en la disyunción lógica y la votación mayoritaria desde la perspectiva de la probabilidad conjunta condicional. Para evaluar el rendimiento pronosticado del clasificador de conjunto mediante la metodología propuesta, se han empleado conjuntos de datos estándar públicamente disponibles. Los resultados muestran la efectividad de las formulaciones derivadas para estimar el rendimiento de la clasificación de conjunto. Además, los resultados teóricos y experimentales muestran que la decisión basada en la disyunción lógica supera a la votación mayoritaria en conjuntos de datos desequilibrados y escenarios sensibles al costo.