Un nuevo método de conjunto para detectar anomalías en matrices de expresión génica
Autores: Selicato, Laura; Esposito, Flavia; Gargano, Grazia; Vegliante, Maria Carmela; Opinto, Giuseppina; Zaccaria, Gian Maria; Ciavarella, Sabino; Guarini, Attilio; Del Buono, Nicoletta
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un nuevo método de conjunto para detectar anomalías en matrices de expresión génica
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Anomalías
Valores atípicos
Datos de expresión génica
Análisis de microarreglos
Agrupamiento jerárquico
Análisis de componentes principales robustos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
Uno de los problemas principales en el análisis de datos reales está a menudo relacionado con la presencia de anomalías. Es decir, los casos anómalos pueden tanto estropear el análisis resultante como contener información valiosa al mismo tiempo. En ambos casos, la capacidad para detectar estas ocurrencias es muy importante. En el campo biomédico, una correcta identificación de los valores atípicos podría permitir el desarrollo de nuevas hipótesis biológicas que no se consideran al observar datos biológicos experimentales. En este trabajo, abordamos el problema de detectar valores atípicos en datos de expresión génica, centrándonos en el análisis de microarrays. Proponemos un enfoque de conjunto para detectar anomalías en matrices de expresión génica basado en el uso de Clustering Jerárquico y Análisis de Componentes Principales Robustos, lo que nos permite derivar una nueva clasificación pseudo-matemática de anomalías.
Descripción
Uno de los problemas principales en el análisis de datos reales está a menudo relacionado con la presencia de anomalías. Es decir, los casos anómalos pueden tanto estropear el análisis resultante como contener información valiosa al mismo tiempo. En ambos casos, la capacidad para detectar estas ocurrencias es muy importante. En el campo biomédico, una correcta identificación de los valores atípicos podría permitir el desarrollo de nuevas hipótesis biológicas que no se consideran al observar datos biológicos experimentales. En este trabajo, abordamos el problema de detectar valores atípicos en datos de expresión génica, centrándonos en el análisis de microarrays. Proponemos un enfoque de conjunto para detectar anomalías en matrices de expresión génica basado en el uso de Clustering Jerárquico y Análisis de Componentes Principales Robustos, lo que nos permite derivar una nueva clasificación pseudo-matemática de anomalías.