Predicción de Genes Alt-Splice Usando Análisis de Multitrack-Clique: Verificación del Soporte Estadístico para el Modelado en Genomas de Eucariotas Multicelulares
Autores: Winters-Hilt, Stephen; Lewis, Andrew J.
Idioma: Inglés
Editor: MDPI
Año: 2017
Acceso abierto
Artículo científico
2017
Predicción de Genes Alt-Splice Usando Análisis de Multitrack-Clique: Verificación del Soporte Estadístico para el Modelado en Genomas de Eucariotas Multicelulares
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Limitaciones
Modelo oculto de Markov
Identificación de la estructura génica
Empalme alternativo
HMM de metaestado
Buscador de genes
Espliceosoma
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Una de las principales limitaciones de la implementación típica del modelo oculto de Markov (HMM) para la identificación de la estructura génica es que se identifica una única estructura en una secuencia dada de datos genómicos; es decir, la identificación de estructuras superpuestas no es directamente posible, y ciertamente no es posible dentro de los confines de la evaluación del camino óptimo de Viterbi. Esta es una gran limitación dado que ahora sabemos que porciones significativas de los genomas eucariotas, particularmente los genomas de mamíferos, son alternativamente empalmados y, por lo tanto, tienen estructuras superpuestas en el sentido de los transcritos de ARNm que resultan. Sin embargo, utilizando el enfoque general de HMM de metaestado desarrollado en trabajos anteriores, se puede acomodar más de una "pista" de anotación, lo que permite una implementación directa de un identificador de estructura génica de empalme alternativo. En este artículo examinamos la representación de la anotación de empalme alternativo en el contexto de múltiples pistas y mostramos que la proliferación de estados es manejable y tiene un soporte estadístico suficiente en los genomas examinados (humano, ratón, gusano y mosca) para que se pueda implementar un buscador de genes HMM de metaestado de empalme alternativo con un soporte estadístico suficiente. En el proceso de realizar el análisis de empalme alternativo en los conteos de eventos de empalme alternativo, esperábamos ver un aumento en la complejidad del empalme alternativo a medida que el organismo se vuelve más complejo, y esto se observa con el porcentaje de genes con variantes de empalme alternativo aumentando de gusano a mosca y a los genomas de mamíferos (ratón y humano). De particular interés es un aumento en las variantes de empalme alternativo al inicio y al final de la codificación en los organismos más complejos estudiados (ratón y humano), lo que indica un reclutamiento rápido de nuevos exones primero y último que posiblemente está mediado por el espliceosoma. Esto sugiere que se han producido refinamientos mediado por el espliceosoma (aceleración) de la variación y selección de la estructura génica, con niveles crecientes de sofisticación, en los eucariotas y especialmente en los mamíferos.
Descripción
Una de las principales limitaciones de la implementación típica del modelo oculto de Markov (HMM) para la identificación de la estructura génica es que se identifica una única estructura en una secuencia dada de datos genómicos; es decir, la identificación de estructuras superpuestas no es directamente posible, y ciertamente no es posible dentro de los confines de la evaluación del camino óptimo de Viterbi. Esta es una gran limitación dado que ahora sabemos que porciones significativas de los genomas eucariotas, particularmente los genomas de mamíferos, son alternativamente empalmados y, por lo tanto, tienen estructuras superpuestas en el sentido de los transcritos de ARNm que resultan. Sin embargo, utilizando el enfoque general de HMM de metaestado desarrollado en trabajos anteriores, se puede acomodar más de una "pista" de anotación, lo que permite una implementación directa de un identificador de estructura génica de empalme alternativo. En este artículo examinamos la representación de la anotación de empalme alternativo en el contexto de múltiples pistas y mostramos que la proliferación de estados es manejable y tiene un soporte estadístico suficiente en los genomas examinados (humano, ratón, gusano y mosca) para que se pueda implementar un buscador de genes HMM de metaestado de empalme alternativo con un soporte estadístico suficiente. En el proceso de realizar el análisis de empalme alternativo en los conteos de eventos de empalme alternativo, esperábamos ver un aumento en la complejidad del empalme alternativo a medida que el organismo se vuelve más complejo, y esto se observa con el porcentaje de genes con variantes de empalme alternativo aumentando de gusano a mosca y a los genomas de mamíferos (ratón y humano). De particular interés es un aumento en las variantes de empalme alternativo al inicio y al final de la codificación en los organismos más complejos estudiados (ratón y humano), lo que indica un reclutamiento rápido de nuevos exones primero y último que posiblemente está mediado por el espliceosoma. Esto sugiere que se han producido refinamientos mediado por el espliceosoma (aceleración) de la variación y selección de la estructura génica, con niveles crecientes de sofisticación, en los eucariotas y especialmente en los mamíferos.