Compresión de datos de secuenciación de próxima generación y de archivos digitales de ADN
Autores: Carpentieri, Bruno
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Compresión de datos de secuenciación de próxima generación y de archivos digitales de ADN
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Aumentar el tráfico de la red
Datos genómicos
Secuenciación
Compresión
Secuencias de ADN
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
El aumento en la memoria y en el tráfico de red utilizado y causado por los nuevos datos biológicos secuenciados ha crecido profundamente recientemente. Los proyectos genómicos como HapMap y 1000 Genomas han contribuido al gran aumento de bases de datos y tráfico de red relacionados con datos genómicos y al desarrollo de nuevas tecnologías eficientes. La secuenciación a gran escala de muestras de ADN ha traído nueva atención y ha producido nuevas investigaciones, por lo que el interés de la comunidad científica por los datos genómicos ha aumentado considerablemente. En muy poco tiempo, los investigadores han desarrollado herramientas de hardware, software de análisis, algoritmos, bases de datos privadas e infraestructuras para apoyar la investigación en genómica. En este documento, analizamos diferentes enfoques para comprimir archivos digitales generados por herramientas de secuenciación de próxima generación que contienen secuencias de nucleótidos, y discutimos y evaluamos el rendimiento de compresión de algoritmos de compresión genéricos al enfrentarlos con un sistema específico diseñado por Jones et al. específicamente para la compresión de archivos genómicos. Además, presentamos una técnica simple pero efectiva para la compresión de secuencias de ADN en la que solo consideramos los datos de ADN relevantes y evaluamos experimentalmente su rendimiento.
Descripción
El aumento en la memoria y en el tráfico de red utilizado y causado por los nuevos datos biológicos secuenciados ha crecido profundamente recientemente. Los proyectos genómicos como HapMap y 1000 Genomas han contribuido al gran aumento de bases de datos y tráfico de red relacionados con datos genómicos y al desarrollo de nuevas tecnologías eficientes. La secuenciación a gran escala de muestras de ADN ha traído nueva atención y ha producido nuevas investigaciones, por lo que el interés de la comunidad científica por los datos genómicos ha aumentado considerablemente. En muy poco tiempo, los investigadores han desarrollado herramientas de hardware, software de análisis, algoritmos, bases de datos privadas e infraestructuras para apoyar la investigación en genómica. En este documento, analizamos diferentes enfoques para comprimir archivos digitales generados por herramientas de secuenciación de próxima generación que contienen secuencias de nucleótidos, y discutimos y evaluamos el rendimiento de compresión de algoritmos de compresión genéricos al enfrentarlos con un sistema específico diseñado por Jones et al. específicamente para la compresión de archivos genómicos. Además, presentamos una técnica simple pero efectiva para la compresión de secuencias de ADN en la que solo consideramos los datos de ADN relevantes y evaluamos experimentalmente su rendimiento.