Una herramienta para el diseño del conjunto mínimo de SNP para la huella dactilar: caso de uso para la cebada
Autores: Ermolaev, Aleksey; Samarina, Mariya; Strembovskiy, Ilya; Kroupin, Pavel; Karlov, Gennady; Kharchenko, Pyotr; Voronov, Sergey; Eroshenko, Lyubov; Kryuchenko, Elizaveta; Laptina, Yulia; Avdeev, Sergey; Shirnin, Sergey; Igonin, Vladimir; Divashuk, Mikhail
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Una herramienta para el diseño del conjunto mínimo de SNP para la huella dactilar: caso de uso para la cebada
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Agronomía y Ciencia de los Cultivos
Palabras clave
Tecnologías
Polimorfismos de nucleótido único
Marcadores SNP
Archivo VCF
MDSearch
Cebada
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Las tecnologías genómicas de alto rendimiento están permitiendo la identificación de miles o incluso millones de polimorfismos de nucleótido único (SNP). Los marcadores SNP se utilizan con frecuencia para analizar variedades de cultivos, con los datos del marcador resumidos en un archivo VCF común. En la actualidad, es difícil identificar el conjunto mínimo de SNP, los conjuntos más pequeños que pueden distinguir entre todas las variedades de cultivos enumeradas en un archivo VCF, debido a la falta de herramientas listas para usar disponibles capaces de tal caracterización. Aquí, describimos el desarrollo de la herramienta de código abierto lista para usar MDSearch (Búsqueda de Conjunto de SNP Discriminatorio Mínimo) basada en la identificación del MDS (conjunto discriminatorio mínimo) de SNPs utilizando caminatas aleatorias a partir del conjunto discriminatorio máximo. MDSearch se puede utilizar para especies diploides y poliploides, así como para archivos VCF con fases y sin fases. MDSearch ha sido validado utilizando un conjunto de datos de SNPs de cebada disponible públicamente obtenido por genotipado por secuenciación. Como resultado, hemos identificado con éxito un conjunto discriminante de 19 marcadores SNP capaces de distinguir todas las 254 variedades de cebada incluidas en nuestro estudio. Esperamos que este programa resulte útil para los investigadores genómicos para respaldar una variedad de certificaciones.
Descripción
Las tecnologías genómicas de alto rendimiento están permitiendo la identificación de miles o incluso millones de polimorfismos de nucleótido único (SNP). Los marcadores SNP se utilizan con frecuencia para analizar variedades de cultivos, con los datos del marcador resumidos en un archivo VCF común. En la actualidad, es difícil identificar el conjunto mínimo de SNP, los conjuntos más pequeños que pueden distinguir entre todas las variedades de cultivos enumeradas en un archivo VCF, debido a la falta de herramientas listas para usar disponibles capaces de tal caracterización. Aquí, describimos el desarrollo de la herramienta de código abierto lista para usar MDSearch (Búsqueda de Conjunto de SNP Discriminatorio Mínimo) basada en la identificación del MDS (conjunto discriminatorio mínimo) de SNPs utilizando caminatas aleatorias a partir del conjunto discriminatorio máximo. MDSearch se puede utilizar para especies diploides y poliploides, así como para archivos VCF con fases y sin fases. MDSearch ha sido validado utilizando un conjunto de datos de SNPs de cebada disponible públicamente obtenido por genotipado por secuenciación. Como resultado, hemos identificado con éxito un conjunto discriminante de 19 marcadores SNP capaces de distinguir todas las 254 variedades de cebada incluidas en nuestro estudio. Esperamos que este programa resulte útil para los investigadores genómicos para respaldar una variedad de certificaciones.