aPEAch: Pipeline Automatizado para el Análisis de Extremo a Extremo de Datos Epigenómicos y Transcriptómicos
Autores: Xiropotamos, Panagiotis; Papageorgiou, Foteini; Manousaki, Haris; Sinnis, Charalampos; Antonatos, Charalabos; Vasilopoulos, Yiannis; Georgakilas, Georgios K.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
aPEAch: Pipeline Automatizado para el Análisis de Extremo a Extremo de Datos Epigenómicos y Transcriptómicos
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Secuenciación de próxima generación
Epigenoma
Regulación transcripcional
Métodos analíticos computacionales
APEAch
Secuenciación de ADN
Secuenciación de ARN
Python
Enfoque modular
Aprendizaje no supervisado
Optimización de agrupamiento.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
Con la llegada de la secuenciación de próxima generación (NGS), han surgido técnicas experimentales que capturan la importancia biológica de los loci de ADN o las moléculas de ARN como herramientas fundamentales para estudiar el epigenoma y la regulación transcripcional a escala genómica. El volumen de los datos generados y la complejidad subyacente en su análisis destacan la necesidad de métodos analíticos computacionales robustos y fáciles de usar que puedan agilizar el proceso y proporcionar valiosos conocimientos biológicos. Nuestra solución, aPEAch, es un pipeline automatizado que facilita el análisis de extremo a extremo de ensayos de secuenciación de ADN y ARN, incluyendo la secuenciación de ARN pequeño, desde la evaluación de la calidad de los archivos de muestra de entrada hasta responder preguntas biológicas significativas aprovechando la rica información incrustada en los datos biológicos. Nuestro método está implementado en Python, basado en un enfoque modular que permite a los usuarios elegir el camino y la extensión del análisis y las representaciones de los resultados. El pipeline puede procesar muestras con replicados simples o múltiples en lotes, lo que permite la facilidad de uso y la reproducibilidad del análisis en todas las muestras. aPEAch proporciona una variedad de métricas de muestra, como informes de control de calidad, gráficos de distribución del tamaño de fragmentos y todos los archivos de salida intermedios, lo que permite que el pipeline se vuelva a ejecutar con diferentes parámetros o algoritmos, junto con la visualización lista para publicación de los resultados. Además, aPEAch incorpora sin problemas análisis avanzados de aprendizaje no supervisado al automatizar la optimización y visualización de agrupamientos, proporcionando así una visión invaluable de los mecanismos biológicos subyacentes.
Descripción
Con la llegada de la secuenciación de próxima generación (NGS), han surgido técnicas experimentales que capturan la importancia biológica de los loci de ADN o las moléculas de ARN como herramientas fundamentales para estudiar el epigenoma y la regulación transcripcional a escala genómica. El volumen de los datos generados y la complejidad subyacente en su análisis destacan la necesidad de métodos analíticos computacionales robustos y fáciles de usar que puedan agilizar el proceso y proporcionar valiosos conocimientos biológicos. Nuestra solución, aPEAch, es un pipeline automatizado que facilita el análisis de extremo a extremo de ensayos de secuenciación de ADN y ARN, incluyendo la secuenciación de ARN pequeño, desde la evaluación de la calidad de los archivos de muestra de entrada hasta responder preguntas biológicas significativas aprovechando la rica información incrustada en los datos biológicos. Nuestro método está implementado en Python, basado en un enfoque modular que permite a los usuarios elegir el camino y la extensión del análisis y las representaciones de los resultados. El pipeline puede procesar muestras con replicados simples o múltiples en lotes, lo que permite la facilidad de uso y la reproducibilidad del análisis en todas las muestras. aPEAch proporciona una variedad de métricas de muestra, como informes de control de calidad, gráficos de distribución del tamaño de fragmentos y todos los archivos de salida intermedios, lo que permite que el pipeline se vuelva a ejecutar con diferentes parámetros o algoritmos, junto con la visualización lista para publicación de los resultados. Además, aPEAch incorpora sin problemas análisis avanzados de aprendizaje no supervisado al automatizar la optimización y visualización de agrupamientos, proporcionando así una visión invaluable de los mecanismos biológicos subyacentes.