logo móvil
Contáctanos

Gráfico logístico mediante algoritmos de gradiente conjugado y SVD iterado

Autores: Babativa-Márquez, Jose Giovany; Vicente-Villardón, José Luis

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Gráfico logístico mediante algoritmos de gradiente conjugado y SVD iterado


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Multivariado
Datos binarios
Análisis de componentes principales
Biplot logístico
Algoritmos
Validación cruzada

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 34

Citaciones: Sin citaciones


Descripción
Los datos binarios multivariados son cada vez más frecuentes en la práctica. Aunque algunas adaptaciones del análisis de componentes principales se utilizan para reducir la dimensionalidad de este tipo de datos, ninguno de ellos proporciona una representación simultánea de filas y columnas (biplot). Recientemente, se ha desarrollado una técnica llamada biplot logístico (LB) para representar las filas y columnas de una matriz de datos binarios de manera simultánea, aunque el algoritmo utilizado para ajustar los parámetros es demasiado exigente computacionalmente para ser útil en presencia de dispersión o cuando la matriz es grande. Proponemos el ajuste de un modelo LB utilizando algoritmos de gradiente conjugado no lineal (CG) o de mayorización-minimización (MM), y se introduce un procedimiento de validación cruzada para seleccionar el hiperparámetro que representa el número de dimensiones en el modelo. Un estudio de Monte Carlo que considera escenarios con varios niveles de dispersión y diferentes dimensiones del conjunto de datos binarios muestra que el procedimiento basado en validación cruzada es exitoso en la selección del modelo para todos los algoritmos estudiados. La comparación de los tiempos de ejecución muestra que el algoritmo CG es más eficiente en presencia de dispersión y cuando la matriz no es muy grande, mientras que el rendimiento del algoritmo MM es mejor cuando la matriz binaria es equilibrada o grande. Como complemento a los métodos propuestos y para brindar soporte práctico, se ha escrito un paquete en el lenguaje R llamado BiplotML. Para completar el estudio, se utilizan datos binarios reales sobre metilación de expresión génica para ilustrar los métodos propuestos.

Otros recursos que podrían interesarte

Temas Virtualpro