Aplicación global de mapa de repeticiones (GRM): encontrando todas las unidades de repeticiones en tándem de ADN
Autores: Gluni, Matko; Vlahovi, Ines; Mri, Leo; Paar, Vladimir
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Aplicación global de mapa de repeticiones (GRM): encontrando todas las unidades de repeticiones en tándem de ADN
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Repeticiones en tándem
Secuencias genómicas
Estructuras cromosómicas
Expresión génica
Enfermedades
Identificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Las repeticiones en tándem (TRs) son componentes importantes de los genomas eucariotas; tienen roles tanto estructurales como funcionales: (i) forman estructuras cromosómicas esenciales como centrómeros y telómeros; (ii) modifican la estructura de la cromatina y afectan la transcripción, lo que resulta en una expresión génica alterada y una abundancia proteica diferente. Hay vínculos establecidos entre variaciones en TRs e incompatibilidades entre especies, desarrollo evolutivo, mala segregación cromosómica, envejecimiento, resultados de cáncer y diferentes enfermedades. Dada la importancia de los TRs, parecía esencial desarrollar una aplicación eficiente, sensible y automatizada para la identificación de todo tipo de TRs en diversas secuencias genómicas. Aquí presentamos nuestra nueva aplicación GRM para identificar TRs, la cual está diseñada para superar todas las limitaciones de los algoritmos actualmente existentes. Nuestro algoritmo GRM proporciona una identificación directa de TRs utilizando el dominio de frecuencia pero evitando el mapeo de la secuencia de ADN simbólica en secuencia numérica, y utilizando coincidencia de cadenas clave, pero evitando los métodos estadísticos de optimización local de cadenas clave individuales. Utilizando la aplicación GRM, analizamos secuencias genómicas del cromosoma 19 humano, chimpancé y ratón (RefSeqs), y demostramos que nuestra aplicación era muy rápida, eficiente y sencilla, con una potente interfaz gráfica de usuario. Puede identificar todo tipo de TRs, desde los más pequeños (2 pb) hasta los muy grandes, tan grandes como decenas de kilobases. No requiere ningún conocimiento previo de la estructura de la secuencia y no necesita ningún parámetro o umbral definido por el usuario. De esta manera, asegura que se puedan detectar un espectro completo de TRs en un solo paso. Además, es robusto a todos los tipos de mutaciones en copias repetidas y puede identificar TRs con diversas complejidades en el patrón de la secuencia. Desde esta perspectiva, podemos concluir que la aplicación GRM es un método eficiente, sensible y automatizado para la identificación de todo tipo de TRs.
Descripción
Las repeticiones en tándem (TRs) son componentes importantes de los genomas eucariotas; tienen roles tanto estructurales como funcionales: (i) forman estructuras cromosómicas esenciales como centrómeros y telómeros; (ii) modifican la estructura de la cromatina y afectan la transcripción, lo que resulta en una expresión génica alterada y una abundancia proteica diferente. Hay vínculos establecidos entre variaciones en TRs e incompatibilidades entre especies, desarrollo evolutivo, mala segregación cromosómica, envejecimiento, resultados de cáncer y diferentes enfermedades. Dada la importancia de los TRs, parecía esencial desarrollar una aplicación eficiente, sensible y automatizada para la identificación de todo tipo de TRs en diversas secuencias genómicas. Aquí presentamos nuestra nueva aplicación GRM para identificar TRs, la cual está diseñada para superar todas las limitaciones de los algoritmos actualmente existentes. Nuestro algoritmo GRM proporciona una identificación directa de TRs utilizando el dominio de frecuencia pero evitando el mapeo de la secuencia de ADN simbólica en secuencia numérica, y utilizando coincidencia de cadenas clave, pero evitando los métodos estadísticos de optimización local de cadenas clave individuales. Utilizando la aplicación GRM, analizamos secuencias genómicas del cromosoma 19 humano, chimpancé y ratón (RefSeqs), y demostramos que nuestra aplicación era muy rápida, eficiente y sencilla, con una potente interfaz gráfica de usuario. Puede identificar todo tipo de TRs, desde los más pequeños (2 pb) hasta los muy grandes, tan grandes como decenas de kilobases. No requiere ningún conocimiento previo de la estructura de la secuencia y no necesita ningún parámetro o umbral definido por el usuario. De esta manera, asegura que se puedan detectar un espectro completo de TRs en un solo paso. Además, es robusto a todos los tipos de mutaciones en copias repetidas y puede identificar TRs con diversas complejidades en el patrón de la secuencia. Desde esta perspectiva, podemos concluir que la aplicación GRM es un método eficiente, sensible y automatizado para la identificación de todo tipo de TRs.