BioTEA: Métodos de Análisis Contenerizados para Datos de Transcriptómica Basada en Microarreglos
Autores: Visentin, Luca; Scarpellino, Giorgia; Chinigò, Giorgia; Munaron, Luca; Ruffinatti, Federico Alessandro
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
BioTEA: Métodos de Análisis Contenerizados para Datos de Transcriptómica Basada en Microarreglos
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Expresión génica
Bases de datos
RNA-seq
Análisis de expresión diferencial
BioTEA
Transcriptómica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
Decenas de miles de conjuntos de datos de expresión génica que describen una variedad de organismos modelo en muchas condiciones patofisiológicas diferentes se almacenan actualmente en bases de datos de acceso público como el Gene Expression Omnibus (GEO) y ArrayExpress (AE). A medida que la tecnología de microarreglos da paso a la secuenciación de ARN, se vuelve estratégico desarrollar herramientas de análisis de alto nivel para preservar el acceso a esta enorme cantidad de información a través de los métodos más sofisticados de preparación y procesamiento de datos desarrollados a lo largo de los años, asegurando, al mismo tiempo, la reproducibilidad de los resultados. Para satisfacer esta necesidad, aquí presentamos bioTEA (Analizador de Expresión de Transcritos Biológicos), una nueva herramienta de software que combina facilidad de uso con la versatilidad y el poder de un análisis de expresión diferencial basado en R/Bioconductor, comenzando desde la recuperación y preparación de datos en bruto hasta la anotación de genes. BioTEA es un pipeline codificado en R, envuelto en una interfaz de línea de comandos basada en Python y containerizado con tecnología Docker. El usuario puede elegir entre múltiples opciones, incluyendo filtrado de genes, manejo de efectos de lote, emparejamiento de muestras y tipo de prueba estadística, para adaptar el flujo del algoritmo a la estructura del conjunto de datos particular. Todas estas opciones se guardan en un solo archivo de texto, que se puede compartir fácilmente entre diferentes laboratorios para reproducir determinísticamente los resultados. Además, un archivo de registro detallado proporciona información precisa sobre cada paso del análisis. En general, estas características hacen de bioTEA una herramienta invaluable tanto para bioinformáticos como para biólogos de laboratorio interesados en la transcriptómica. BioTEA es gratuito y de código abierto.
Descripción
Decenas de miles de conjuntos de datos de expresión génica que describen una variedad de organismos modelo en muchas condiciones patofisiológicas diferentes se almacenan actualmente en bases de datos de acceso público como el Gene Expression Omnibus (GEO) y ArrayExpress (AE). A medida que la tecnología de microarreglos da paso a la secuenciación de ARN, se vuelve estratégico desarrollar herramientas de análisis de alto nivel para preservar el acceso a esta enorme cantidad de información a través de los métodos más sofisticados de preparación y procesamiento de datos desarrollados a lo largo de los años, asegurando, al mismo tiempo, la reproducibilidad de los resultados. Para satisfacer esta necesidad, aquí presentamos bioTEA (Analizador de Expresión de Transcritos Biológicos), una nueva herramienta de software que combina facilidad de uso con la versatilidad y el poder de un análisis de expresión diferencial basado en R/Bioconductor, comenzando desde la recuperación y preparación de datos en bruto hasta la anotación de genes. BioTEA es un pipeline codificado en R, envuelto en una interfaz de línea de comandos basada en Python y containerizado con tecnología Docker. El usuario puede elegir entre múltiples opciones, incluyendo filtrado de genes, manejo de efectos de lote, emparejamiento de muestras y tipo de prueba estadística, para adaptar el flujo del algoritmo a la estructura del conjunto de datos particular. Todas estas opciones se guardan en un solo archivo de texto, que se puede compartir fácilmente entre diferentes laboratorios para reproducir determinísticamente los resultados. Además, un archivo de registro detallado proporciona información precisa sobre cada paso del análisis. En general, estas características hacen de bioTEA una herramienta invaluable tanto para bioinformáticos como para biólogos de laboratorio interesados en la transcriptómica. BioTEA es gratuito y de código abierto.