Un algoritmo novedoso de biagrupamiento difuso con conjunto difuso axiomático para la identificación de genes co-regulados
Autores: Xu, Kaijie; Wang, Yixi
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un algoritmo novedoso de biagrupamiento difuso con conjunto difuso axiomático para la identificación de genes co-regulados
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Genes co-regulados
Sitios de unión de factores de transcripción
Algoritmos de biagrupamiento
Datos de expresión génica
Matrices de partición difusa
Conjunto Difuso Axiomático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La identificación de genes co-regulados y sus Sitios de Unión de Factores de Transcripción (TFBSs) son los pasos clave para comprender la regulación de la transcripción. Además de los ensayos de laboratorio efectivos, se han desarrollado varios algoritmos de bi-clustering para la detección de genes co-expresados. Los métodos de bi-clustering se utilizan para descubrir subgrupos de genes con patrones de expresión similares bajo subconjuntos de condiciones experimentales a ser identificados cuando se aplican a datos de expresión génica. Al construir dos matrices de partición difusa de los datos de expresión génica con la teoría de Conjuntos Difusos Axiomáticos (AFS), este artículo propone un nuevo algoritmo difuso de bi-clustering para la identificación de genes co-regulados. Específicamente, los datos de expresión génica se transforman en dos matrices de partición difusa a través de la teoría de relaciones de sub-preferencia de AFS al principio. Una de las matrices considera a los genes como el universo y las condiciones como el concepto, y la otra considera a los genes como el concepto y las condiciones como el universo. La identificación de los genes co-regulados (bi-clusters) se lleva a cabo en las dos matrices de partición al mismo tiempo. Luego, se define un nuevo criterio de similitud basado en las matrices de partición y se diseña un algoritmo de optimización cíclica para descubrir los bi-clusters significativos a nivel de expresión. Los procedimientos anteriores garantizan que los bi-clusters generados tengan valores de expresión más significativos que los extraídos por los métodos de bi-clustering tradicionales. Finalmente, se evalúa el rendimiento del método propuesto con el rendimiento de los tres algoritmos de bi-clustering conocidos en conjuntos de datos de microarray reales disponibles públicamente. Los resultados experimentales están de acuerdo con el análisis teórico y muestran que el algoritmo propuesto puede detectar efectivamente los genes co-regulados sin ningún conocimiento previo de los datos de expresión génica.
Descripción
La identificación de genes co-regulados y sus Sitios de Unión de Factores de Transcripción (TFBSs) son los pasos clave para comprender la regulación de la transcripción. Además de los ensayos de laboratorio efectivos, se han desarrollado varios algoritmos de bi-clustering para la detección de genes co-expresados. Los métodos de bi-clustering se utilizan para descubrir subgrupos de genes con patrones de expresión similares bajo subconjuntos de condiciones experimentales a ser identificados cuando se aplican a datos de expresión génica. Al construir dos matrices de partición difusa de los datos de expresión génica con la teoría de Conjuntos Difusos Axiomáticos (AFS), este artículo propone un nuevo algoritmo difuso de bi-clustering para la identificación de genes co-regulados. Específicamente, los datos de expresión génica se transforman en dos matrices de partición difusa a través de la teoría de relaciones de sub-preferencia de AFS al principio. Una de las matrices considera a los genes como el universo y las condiciones como el concepto, y la otra considera a los genes como el concepto y las condiciones como el universo. La identificación de los genes co-regulados (bi-clusters) se lleva a cabo en las dos matrices de partición al mismo tiempo. Luego, se define un nuevo criterio de similitud basado en las matrices de partición y se diseña un algoritmo de optimización cíclica para descubrir los bi-clusters significativos a nivel de expresión. Los procedimientos anteriores garantizan que los bi-clusters generados tengan valores de expresión más significativos que los extraídos por los métodos de bi-clustering tradicionales. Finalmente, se evalúa el rendimiento del método propuesto con el rendimiento de los tres algoritmos de bi-clustering conocidos en conjuntos de datos de microarray reales disponibles públicamente. Los resultados experimentales están de acuerdo con el análisis teórico y muestran que el algoritmo propuesto puede detectar efectivamente los genes co-regulados sin ningún conocimiento previo de los datos de expresión génica.