La inconsistencia de los algoritmos de Jaro-Winkler y Needleman-Wunsch aplicados a los resultados de similitud de cadenas de ADN
Autores: Melnikov, Boris
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
La inconsistencia de los algoritmos de Jaro-Winkler y Needleman-Wunsch aplicados a los resultados de similitud de cadenas de ADN
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Algoritmos
Distancias
Jaro-Winkler
Needleman-Wunsch
Consistencia
Cadenas de ADN
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Existen muchos algoritmos diferentes para calcular las distancias entre cadenas de ADN. Diferentes algoritmos para determinar dichas distancias dan resultados distintos. Este artículo no considera problemas relacionados con cuál de los algoritmos clásicos es mejor, pero muestra la inconsistencia de dos algoritmos clásicos, específicamente los algoritmos de Jaro-Winkler y Needleman-Wunsch. Para hacer esto, consideramos matrices de distancia basadas en ambos algoritmos. Explicamos que, idealmente, los triángulos formados por la matriz de distancia correspondiente a cada triple de distancias deberían ser isósceles y agudos. Por supuesto, en realidad, este hecho se viola, y podemos determinar la maldad para cada uno de estos triángulos. En este caso, los dos algoritmos para determinar distancias serán consistentes. En el caso en que tales secuencias de maldad estén ubicadas en el mismo orden para ellos, y cuanto mayor sea la diferencia de este orden, menos consistentes serán. En este artículo, consideramos las matrices de distancia para los dos algoritmos mencionados, calculadas para el ADN mitocondrial de 32 especies de monos pertenecientes a diferentes géneros. Para ellos, se forman 4960 triángulos en ambas matrices, y calculamos los valores de la correlación de rangos entre estas secuencias. Obtenemos resultados muy pequeños para estos valores (con diferentes métodos de cálculo de la correlación de rangos, no supera el valor 0.14), lo que indica la inconsistencia de los dos algoritmos bajo consideración.
Descripción
Existen muchos algoritmos diferentes para calcular las distancias entre cadenas de ADN. Diferentes algoritmos para determinar dichas distancias dan resultados distintos. Este artículo no considera problemas relacionados con cuál de los algoritmos clásicos es mejor, pero muestra la inconsistencia de dos algoritmos clásicos, específicamente los algoritmos de Jaro-Winkler y Needleman-Wunsch. Para hacer esto, consideramos matrices de distancia basadas en ambos algoritmos. Explicamos que, idealmente, los triángulos formados por la matriz de distancia correspondiente a cada triple de distancias deberían ser isósceles y agudos. Por supuesto, en realidad, este hecho se viola, y podemos determinar la maldad para cada uno de estos triángulos. En este caso, los dos algoritmos para determinar distancias serán consistentes. En el caso en que tales secuencias de maldad estén ubicadas en el mismo orden para ellos, y cuanto mayor sea la diferencia de este orden, menos consistentes serán. En este artículo, consideramos las matrices de distancia para los dos algoritmos mencionados, calculadas para el ADN mitocondrial de 32 especies de monos pertenecientes a diferentes géneros. Para ellos, se forman 4960 triángulos en ambas matrices, y calculamos los valores de la correlación de rangos entre estas secuencias. Obtenemos resultados muy pequeños para estos valores (con diferentes métodos de cálculo de la correlación de rangos, no supera el valor 0.14), lo que indica la inconsistencia de los dos algoritmos bajo consideración.