Blogic: un enfoque de combinación de modelos bayesianos en regresión lógica
Autores: Wei, Yu-Chung
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Blogic: un enfoque de combinación de modelos bayesianos en regresión lógica
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Aumento de complejidad
Dimensionalidad de conjuntos de datos
Regresión lógica
Recocido simulado
Algoritmo BLogic
Combinación de modelos bayesianos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Con la creciente complejidad y dimensionalidad de los conjuntos de datos en la investigación estadística, los métodos tradicionales para identificar interacciones a menudo son más difíciles de aplicar debido a las limitaciones de las suposiciones del modelo. La regresión lógica ha surgido como una herramienta efectiva, aprovechando combinaciones booleanas de variables explicativas binarias. Sin embargo, el enfoque prevalente de recocido simulado en la regresión lógica a veces enfrenta problemas de estabilidad. Este estudio presenta el algoritmo BLogic, un enfoque novedoso que amalgama múltiples ejecuciones de recocido simulado en un conjunto de datos y sintetiza los resultados a través de la técnica de combinación de modelos bayesianos. Este algoritmo no solo facilita la predicción de variables de respuesta utilizando variables explicativas binarias, sino que también ofrece un cálculo de puntuación para los impulsores principales, elucidando variables clave y sus interacciones dentro de los datos. En simulaciones con parámetros idénticos, la regresión lógica convencional, cuando se ejecuta con una sola instancia de recocido simulado, exhibe capacidades predictivas e interpretativas reducidas tan pronto como la proporción de variables explicativas al tamaño de la muestra supera 10. En contraste, el algoritmo BLogic mantiene su efectividad hasta que esta proporción se acerca a 50. Esto subraya su mayor resistencia contra desafíos en entornos de alta dimensionalidad, especialmente en el problema de grande, pequeño. Además, al emplear datos del mundo real del Proyecto UK10K, también mostramos el rendimiento práctico del algoritmo BLogic.
Descripción
Con la creciente complejidad y dimensionalidad de los conjuntos de datos en la investigación estadística, los métodos tradicionales para identificar interacciones a menudo son más difíciles de aplicar debido a las limitaciones de las suposiciones del modelo. La regresión lógica ha surgido como una herramienta efectiva, aprovechando combinaciones booleanas de variables explicativas binarias. Sin embargo, el enfoque prevalente de recocido simulado en la regresión lógica a veces enfrenta problemas de estabilidad. Este estudio presenta el algoritmo BLogic, un enfoque novedoso que amalgama múltiples ejecuciones de recocido simulado en un conjunto de datos y sintetiza los resultados a través de la técnica de combinación de modelos bayesianos. Este algoritmo no solo facilita la predicción de variables de respuesta utilizando variables explicativas binarias, sino que también ofrece un cálculo de puntuación para los impulsores principales, elucidando variables clave y sus interacciones dentro de los datos. En simulaciones con parámetros idénticos, la regresión lógica convencional, cuando se ejecuta con una sola instancia de recocido simulado, exhibe capacidades predictivas e interpretativas reducidas tan pronto como la proporción de variables explicativas al tamaño de la muestra supera 10. En contraste, el algoritmo BLogic mantiene su efectividad hasta que esta proporción se acerca a 50. Esto subraya su mayor resistencia contra desafíos en entornos de alta dimensionalidad, especialmente en el problema de grande, pequeño. Además, al emplear datos del mundo real del Proyecto UK10K, también mostramos el rendimiento práctico del algoritmo BLogic.