Códigos bio-restringidos con red neuronal para almacenamiento de datos de ADN basado en densidad
Autores: Rasool, Abdur; Qu, Qiang; Wang, Yang; Jiang, Qingshan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Códigos bio-restringidos con red neuronal para almacenamiento de datos de ADN basado en densidad
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
ADN
Almacenamiento de información
Errores
Nucleótidos
Red neuronal
Bio-restricciones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
El ADN ha evolucionado como un medio de vanguardia para el almacenamiento de información digital debido a su densidad extremadamente alta y su preservación duradera para dar cabida a la explosión de datos. Sin embargo, las cadenas de ADN son propensas a errores durante el proceso de hibridación. Además, la síntesis y secuenciación del ADN conllevan un costo que depende del número de nucleótidos presentes. Un modelo eficiente para almacenar una gran cantidad de datos en un pequeño número de nucleótidos es esencial, y debe controlar los errores de hibridación entre los pares de bases. En este documento, se presenta un nuevo modelo computacional para diseñar grandes bibliotecas de oligonucleótidos de ADN. Se establece mediante la integración de una red neuronal (NN) con restricciones biológicas combinatorias, incluido un contenido constante de GC y satisfaciendo la distancia de Hamming y las restricciones de complemento inverso. Desarrollamos una implementación simple y eficiente de NN para producir los códigos de ADN óptimos, lo que abre la puerta para aplicar redes neuronales al almacenamiento de datos basado en ADN. Además, se introducen restricciones bio-combinatorias para mejorar los límites inferiores y evitar la ocurrencia de errores en los códigos de ADN. Nuestro objetivo es calcular grandes códigos de ADN en secuencias más cortas, que deberían evitar errores de hibridación no específicos al satisfacer la codificación bio-restringida. El modelo propuesto produce una mejora significativa en la biblioteca de ADN al construir explícitamente códigos más grandes que los códigos previamente publicados.
Descripción
El ADN ha evolucionado como un medio de vanguardia para el almacenamiento de información digital debido a su densidad extremadamente alta y su preservación duradera para dar cabida a la explosión de datos. Sin embargo, las cadenas de ADN son propensas a errores durante el proceso de hibridación. Además, la síntesis y secuenciación del ADN conllevan un costo que depende del número de nucleótidos presentes. Un modelo eficiente para almacenar una gran cantidad de datos en un pequeño número de nucleótidos es esencial, y debe controlar los errores de hibridación entre los pares de bases. En este documento, se presenta un nuevo modelo computacional para diseñar grandes bibliotecas de oligonucleótidos de ADN. Se establece mediante la integración de una red neuronal (NN) con restricciones biológicas combinatorias, incluido un contenido constante de GC y satisfaciendo la distancia de Hamming y las restricciones de complemento inverso. Desarrollamos una implementación simple y eficiente de NN para producir los códigos de ADN óptimos, lo que abre la puerta para aplicar redes neuronales al almacenamiento de datos basado en ADN. Además, se introducen restricciones bio-combinatorias para mejorar los límites inferiores y evitar la ocurrencia de errores en los códigos de ADN. Nuestro objetivo es calcular grandes códigos de ADN en secuencias más cortas, que deberían evitar errores de hibridación no específicos al satisfacer la codificación bio-restringida. El modelo propuesto produce una mejora significativa en la biblioteca de ADN al construir explícitamente códigos más grandes que los códigos previamente publicados.