logo móvil
Contáctanos

La inconsistencia de los algoritmos de Jaro-Winkler y Needleman-Wunsch aplicados a los resultados de similitud de cadenas de ADN

Autores: Melnikov, Boris

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

La inconsistencia de los algoritmos de Jaro-Winkler y Needleman-Wunsch aplicados a los resultados de similitud de cadenas de ADN


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Algoritmos
Distancias
Jaro-Winkler
Needleman-Wunsch
Consistencia
Cadenas de ADN

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 34

Citaciones: Sin citaciones


Descripción
Existen muchos algoritmos diferentes para calcular las distancias entre cadenas de ADN. Diferentes algoritmos para determinar dichas distancias dan resultados distintos. Este artículo no considera problemas relacionados con cuál de los algoritmos clásicos es mejor, pero muestra la inconsistencia de dos algoritmos clásicos, específicamente los algoritmos de Jaro-Winkler y Needleman-Wunsch. Para hacer esto, consideramos matrices de distancia basadas en ambos algoritmos. Explicamos que, idealmente, los triángulos formados por la matriz de distancia correspondiente a cada triple de distancias deberían ser isósceles y agudos. Por supuesto, en realidad, este hecho se viola, y podemos determinar la maldad para cada uno de estos triángulos. En este caso, los dos algoritmos para determinar distancias serán consistentes. En el caso en que tales secuencias de maldad estén ubicadas en el mismo orden para ellos, y cuanto mayor sea la diferencia de este orden, menos consistentes serán. En este artículo, consideramos las matrices de distancia para los dos algoritmos mencionados, calculadas para el ADN mitocondrial de 32 especies de monos pertenecientes a diferentes géneros. Para ellos, se forman 4960 triángulos en ambas matrices, y calculamos los valores de la correlación de rangos entre estas secuencias. Obtenemos resultados muy pequeños para estos valores (con diferentes métodos de cálculo de la correlación de rangos, no supera el valor 0.14), lo que indica la inconsistencia de los dos algoritmos bajo consideración.

Otros recursos que podrían interesarte

Temas Virtualpro