Un sistema de gestión de bases de datos de alto rendimiento para gestionar y analizar datos de SNP a gran escala en aplicaciones de genotipado y cría de plantas
Autores: Zhao, Yikun; Jiang, Bin; Huo, Yongxue; Yi, Hongmei; Tian, Hongli; Wu, Haotian; Wang, Rui; Zhao, Jiuran; Wang, Fengge
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un sistema de gestión de bases de datos de alto rendimiento para gestionar y analizar datos de SNP a gran escala en aplicaciones de genotipado y cría de plantas
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Base de datos de huella genética
Investigación molecular de plantas
Psnpdms
Snp
Kasp
Control de calidad de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 49
Citaciones: Sin citaciones
Una base de datos de huellas dactilares de ADN es una herramienta eficiente, estable y automatizada para la investigación molecular de plantas que puede proporcionar un soporte técnico integral para múltiples campos de estudio, como el análisis del pan-genoma y el mejoramiento de cultivos. Sin embargo, la construcción de una base de datos de huellas dactilares de ADN para plantas requiere recursos significativos para la salida, almacenamiento, análisis y control de calidad de los datos. Se debe procesar grandes cantidades de datos heterogéneos de manera eficiente y precisa. Por lo tanto, desarrollamos un sistema de gestión de base de datos de SNP de plantas (PSNPdms) utilizando un servidor web de código abierto y software gratuito que es compatible con polimorfismos de un solo nucleótido (SNP), marcadores de inserción-deleción (InDel), PCR específica de alelos competitivos (KASP), plataformas de arrays de SNP y 23 especies. Se integra completamente con la plataforma KASP y permite la presentación gráfica y modificación de datos de KASP. El sistema tiene una estructura de gestión de personal de laboratorio simple, eficiente y versátil que se adapta a necesidades experimentales complejas y cambiantes con un proceso de flujo de trabajo simple. PSNPdms proporciona internamente un soporte efectivo para el control de calidad de los datos a través de múltiples dimensiones, como el diseño experimental estandarizado, muestras de referencia estándar, algoritmo de selección estadística de huellas dactilares y consultas de correlación de datos crudos. Además, desarrollamos un algoritmo de fusión de huellas dactilares para resolver el problema de fusionar huellas dactilares de muestras mixtas y muestras individuales en la detección de plantas, proporcionando huellas dactilares estándar únicas de cada especie de planta para la construcción de una base de datos de huellas dactilares de ADN estándar. Diferentes laboratorios pueden utilizar el sistema para generar paquetes de huellas dactilares para la interacción y compartición de datos. Además, integramos el análisis genético en el sistema para permitir la creación y descarga de dendrogramas. PSNPdms ha sido ampliamente utilizado por 23 instituciones y ha demostrado ser un sistema estable y efectivo para compartir datos y realizar análisis genéticos. Se requiere que los investigadores interesados se adapten y desarrollen aún más el sistema.
Descripción
Una base de datos de huellas dactilares de ADN es una herramienta eficiente, estable y automatizada para la investigación molecular de plantas que puede proporcionar un soporte técnico integral para múltiples campos de estudio, como el análisis del pan-genoma y el mejoramiento de cultivos. Sin embargo, la construcción de una base de datos de huellas dactilares de ADN para plantas requiere recursos significativos para la salida, almacenamiento, análisis y control de calidad de los datos. Se debe procesar grandes cantidades de datos heterogéneos de manera eficiente y precisa. Por lo tanto, desarrollamos un sistema de gestión de base de datos de SNP de plantas (PSNPdms) utilizando un servidor web de código abierto y software gratuito que es compatible con polimorfismos de un solo nucleótido (SNP), marcadores de inserción-deleción (InDel), PCR específica de alelos competitivos (KASP), plataformas de arrays de SNP y 23 especies. Se integra completamente con la plataforma KASP y permite la presentación gráfica y modificación de datos de KASP. El sistema tiene una estructura de gestión de personal de laboratorio simple, eficiente y versátil que se adapta a necesidades experimentales complejas y cambiantes con un proceso de flujo de trabajo simple. PSNPdms proporciona internamente un soporte efectivo para el control de calidad de los datos a través de múltiples dimensiones, como el diseño experimental estandarizado, muestras de referencia estándar, algoritmo de selección estadística de huellas dactilares y consultas de correlación de datos crudos. Además, desarrollamos un algoritmo de fusión de huellas dactilares para resolver el problema de fusionar huellas dactilares de muestras mixtas y muestras individuales en la detección de plantas, proporcionando huellas dactilares estándar únicas de cada especie de planta para la construcción de una base de datos de huellas dactilares de ADN estándar. Diferentes laboratorios pueden utilizar el sistema para generar paquetes de huellas dactilares para la interacción y compartición de datos. Además, integramos el análisis genético en el sistema para permitir la creación y descarga de dendrogramas. PSNPdms ha sido ampliamente utilizado por 23 instituciones y ha demostrado ser un sistema estable y efectivo para compartir datos y realizar análisis genéticos. Se requiere que los investigadores interesados se adapten y desarrollen aún más el sistema.