Estructura Composicional del Genoma: Una Revisión
Autores: Bernaola-Galván, Pedro; Carpena, Pedro; Gómez-Martín, Cristina; Oliver, Jose L.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Estructura Composicional del Genoma: Una Revisión
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Genoma
Estructura
Análisis
Composición
Evolución
Complejidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 17
Citaciones: Sin citaciones
A medida que el genoma lleva la información histórica de las interacciones bióticas y ambientales de una especie, analizar los cambios en la estructura del genoma a lo largo del tiempo utilizando poderosos métodos de física estadística (como algoritmos de segmentación entrópica, análisis de fluctuaciones en caminatas de ADN o medidas de complejidad composicional) proporciona valiosas ideas sobre la evolución del genoma. Las frecuencias de nucleótidos tienden a variar a lo largo de la cadena de ADN, resultando en una estructura cromosómica jerárquicamente parcheada con heterogeneidades en diferentes escalas de longitud que van desde unos pocos nucleótidos hasta decenas de millones de ellos. El análisis de fluctuaciones revela que estas estructuras composicionales pueden clasificarse en tres categorías principales: (1) heterogeneidades de corto alcance (por debajo de unos pocos kilobases (Kbp)) principalmente atribuidas a la alternancia de regiones codificantes y no codificantes, densidades de repeticiones intercaladas o en tándem, etc.; (2) isochores, que abarcan decenas a cientos de decenas de Kbp; y (3) superestructuras, que alcanzan tamaños de decenas de megabases (Mbp) o incluso más grandes. Las coordenadas de isochores y superestructuras obtenidas en la primera secuencia completa del genoma humano T2T ahora se comparten en una base de datos pública. De esta manera, los investigadores interesados pueden utilizar los datos de isochores T2T, así como las anotaciones para diferentes elementos del genoma, para verificar una hipótesis específica sobre la estructura del genoma. De manera similar a otros niveles de organización biológica, una estructura composicional jerárquica es prevalente en el genoma. Una vez que se identifica la estructura composicional de un genoma, se pueden derivar varias medidas para cuantificar la heterogeneidad de dicha estructura. La distribución del contenido de G+C del segmento se ha propuesto recientemente como una nueva firma del genoma que resulta útil para comparar genomas completos. Otra medida significativa es la complejidad composicional de la secuencia (SCC), que se ha utilizado para comparaciones de la estructura del genoma. Por último, revisamos las comparaciones recientes del genoma en especies del antiguo filo Cyanobacteria, realizadas mediante regresión filogenética de SCC contra el tiempo, que han revelado tendencias positivas hacia una mayor complejidad del genoma. Estos hallazgos proporcionan la primera evidencia de una evolución progresiva impulsada de la estructura composicional del genoma.
Descripción
A medida que el genoma lleva la información histórica de las interacciones bióticas y ambientales de una especie, analizar los cambios en la estructura del genoma a lo largo del tiempo utilizando poderosos métodos de física estadística (como algoritmos de segmentación entrópica, análisis de fluctuaciones en caminatas de ADN o medidas de complejidad composicional) proporciona valiosas ideas sobre la evolución del genoma. Las frecuencias de nucleótidos tienden a variar a lo largo de la cadena de ADN, resultando en una estructura cromosómica jerárquicamente parcheada con heterogeneidades en diferentes escalas de longitud que van desde unos pocos nucleótidos hasta decenas de millones de ellos. El análisis de fluctuaciones revela que estas estructuras composicionales pueden clasificarse en tres categorías principales: (1) heterogeneidades de corto alcance (por debajo de unos pocos kilobases (Kbp)) principalmente atribuidas a la alternancia de regiones codificantes y no codificantes, densidades de repeticiones intercaladas o en tándem, etc.; (2) isochores, que abarcan decenas a cientos de decenas de Kbp; y (3) superestructuras, que alcanzan tamaños de decenas de megabases (Mbp) o incluso más grandes. Las coordenadas de isochores y superestructuras obtenidas en la primera secuencia completa del genoma humano T2T ahora se comparten en una base de datos pública. De esta manera, los investigadores interesados pueden utilizar los datos de isochores T2T, así como las anotaciones para diferentes elementos del genoma, para verificar una hipótesis específica sobre la estructura del genoma. De manera similar a otros niveles de organización biológica, una estructura composicional jerárquica es prevalente en el genoma. Una vez que se identifica la estructura composicional de un genoma, se pueden derivar varias medidas para cuantificar la heterogeneidad de dicha estructura. La distribución del contenido de G+C del segmento se ha propuesto recientemente como una nueva firma del genoma que resulta útil para comparar genomas completos. Otra medida significativa es la complejidad composicional de la secuencia (SCC), que se ha utilizado para comparaciones de la estructura del genoma. Por último, revisamos las comparaciones recientes del genoma en especies del antiguo filo Cyanobacteria, realizadas mediante regresión filogenética de SCC contra el tiempo, que han revelado tendencias positivas hacia una mayor complejidad del genoma. Estos hallazgos proporcionan la primera evidencia de una evolución progresiva impulsada de la estructura composicional del genoma.