Clasificación de precursores de microARN de diferentes especies basada en características de distancia K-mer
Autores: Yousef, Malik; Allmer, Jens
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Clasificación de precursores de microARN de diferentes especies basada en características de distancia K-mer
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
MicroRNAs
Regulación génica
Espacio de características k-mer
Características basadas en distancias
Rendimiento de clasificación
Distancias evolutivas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Los microARN (miARN) son secuencias cortas de ARN que están activamente involucradas en la regulación génica. Estos reguladores a nivel post-transcripcional han sido descubiertos en prácticamente todos los organismos eucariotas. Además, los miARN parecen existir en virus y también podrían ser producidos en patógenos microbianos. Inicialmente, el ARN transcrito es cortado por Drosha, produciendo precursores de miARN. Hemos demostrado previamente que es posible distinguir entre precursores de microARN de diferentes clados representando las secuencias en un espacio de características de k-meros. La representación de k-meros considera la frecuencia de un k-mero en la secuencia dada. Además, hipotetizamos que la relación entre k-meros (por ejemplo, la distancia entre k-meros) podría ser útil para la clasificación. Se crearon, probaron y compararon tres características basadas en distancias. Los tres conjuntos de características se denominaron distancia inter k-mero, distancia de ubicación de k-mero y distancia de primer-último k-mero. Aquí mostramos que es posible lograr un rendimiento de clasificación por encima del 80% (dependiendo de la distancia evolutiva) con una combinación de características basadas en distancias y k-meros regulares. Con estas características novedosas, la clasificación en distancias evolutivas más cercanas es mejor que usando solo k-meros. La combinación de características conduce a una clasificación precisa para distancias evolutivas mayores. Por ejemplo, categorizar versus Brassicaceae lleva a una precisión del 93%. Al considerar la precisión promedio, las nuevas características basadas en distancias conducen a un aumento general en la efectividad. Por el contrario, las características basadas en estructuras secundarias no llevaron a ninguna separación efectiva entre clados en este estudio. Con esta línea de investigación, respaldamos la diferenciación entre miARN verdaderos y falsos detectados a partir de datos de secuenciación de próxima generación, proporcionamos un punto de vista adicional para confirmar miARN cuando se conoce la especie de origen y abrimos una nueva estrategia para analizar la evolución de los miARN.
Descripción
Los microARN (miARN) son secuencias cortas de ARN que están activamente involucradas en la regulación génica. Estos reguladores a nivel post-transcripcional han sido descubiertos en prácticamente todos los organismos eucariotas. Además, los miARN parecen existir en virus y también podrían ser producidos en patógenos microbianos. Inicialmente, el ARN transcrito es cortado por Drosha, produciendo precursores de miARN. Hemos demostrado previamente que es posible distinguir entre precursores de microARN de diferentes clados representando las secuencias en un espacio de características de k-meros. La representación de k-meros considera la frecuencia de un k-mero en la secuencia dada. Además, hipotetizamos que la relación entre k-meros (por ejemplo, la distancia entre k-meros) podría ser útil para la clasificación. Se crearon, probaron y compararon tres características basadas en distancias. Los tres conjuntos de características se denominaron distancia inter k-mero, distancia de ubicación de k-mero y distancia de primer-último k-mero. Aquí mostramos que es posible lograr un rendimiento de clasificación por encima del 80% (dependiendo de la distancia evolutiva) con una combinación de características basadas en distancias y k-meros regulares. Con estas características novedosas, la clasificación en distancias evolutivas más cercanas es mejor que usando solo k-meros. La combinación de características conduce a una clasificación precisa para distancias evolutivas mayores. Por ejemplo, categorizar versus Brassicaceae lleva a una precisión del 93%. Al considerar la precisión promedio, las nuevas características basadas en distancias conducen a un aumento general en la efectividad. Por el contrario, las características basadas en estructuras secundarias no llevaron a ninguna separación efectiva entre clados en este estudio. Con esta línea de investigación, respaldamos la diferenciación entre miARN verdaderos y falsos detectados a partir de datos de secuenciación de próxima generación, proporcionamos un punto de vista adicional para confirmar miARN cuando se conoce la especie de origen y abrimos una nueva estrategia para analizar la evolución de los miARN.