Modelo de proyección basado en la asimetría y la curtosis con aplicación para resumir datos de expresión génica
Autores: Arevalillo, Jorge M.; Navarro, Hilario
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Modelo de proyección basado en la asimetría y la curtosis con aplicación para resumir datos de expresión génica
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Datos de expresión génica
Modelos flexibles
Distribución t de sesgo multivariado
Búsqueda de proyección
Asimetría
Curtosis
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La no normalidad es un hecho común al tratar con datos de expresión génica. Por lo tanto, se necesitan modelos flexibles para tener en cuenta la asimetría subyacente y las colas pesadas de las medidas de expresión génica multivariadas. Este documento aborda el problema explorando la búsqueda de proyección bajo un marco flexible donde se asume que el modelo subyacente sigue una distribución t de sesgo multivariada. Bajo esta suposición, la búsqueda de proyección con índices de sesgo y curtosis se aborda como un enfoque natural para la reducción de datos. El trabajo examina sus propiedades dando algunas ideas teóricas y adentrándose en el lado computacional en relación con la aplicación a datos reales de expresión génica. Los resultados de la teoría se ilustran mediante un estudio de simulación; los resultados de la simulación se utilizan en combinación con las ideas teóricas para arrojar luz sobre la utilidad de la búsqueda de proyección de sesgo-curtosis para resumir datos de expresión génica multivariados. La aplicación a medidas de expresión génica de pacientes diagnosticados con cáncer de mama triple negativo ofrece hallazgos prometedores que pueden contribuir a explicar la heterogeneidad de este tipo de tumores.
Descripción
La no normalidad es un hecho común al tratar con datos de expresión génica. Por lo tanto, se necesitan modelos flexibles para tener en cuenta la asimetría subyacente y las colas pesadas de las medidas de expresión génica multivariadas. Este documento aborda el problema explorando la búsqueda de proyección bajo un marco flexible donde se asume que el modelo subyacente sigue una distribución t de sesgo multivariada. Bajo esta suposición, la búsqueda de proyección con índices de sesgo y curtosis se aborda como un enfoque natural para la reducción de datos. El trabajo examina sus propiedades dando algunas ideas teóricas y adentrándose en el lado computacional en relación con la aplicación a datos reales de expresión génica. Los resultados de la teoría se ilustran mediante un estudio de simulación; los resultados de la simulación se utilizan en combinación con las ideas teóricas para arrojar luz sobre la utilidad de la búsqueda de proyección de sesgo-curtosis para resumir datos de expresión génica multivariados. La aplicación a medidas de expresión génica de pacientes diagnosticados con cáncer de mama triple negativo ofrece hallazgos prometedores que pueden contribuir a explicar la heterogeneidad de este tipo de tumores.