Analítica combinatoria para calcular probabilidades de siembra
Autores: Filion, Guillaume J.
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Analítica combinatoria para calcular probabilidades de siembra
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Heurísticas de siembra
Alineamiento de secuencias
Bioinformática
Mapeo de lecturas
Combinatoria analítica
Probabilidades
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
Las heurísticas de siembra son las estrategias más ampliamente utilizadas para acelerar el alineamiento de secuencias en bioinformática. Tales estrategias son más exitosas si están calibradas, de modo que se pueda ajustar adecuadamente el equilibrio entre velocidad y precisión. En el caso ampliamente utilizado del mapeo de lecturas, hasta ahora ha sido imposible predecir la tasa de éxito de las estrategias de siembra competidoras por falta de un marco teórico. Aquí presentamos un enfoque para estimar tales cantidades basado en la teoría de combinatoria analítica. La estrategia consiste en especificar una construcción combinatoria de lecturas donde falla la heurística de siembra, traducir esta especificación en una función generadora utilizando reglas formales y finalmente extraer las probabilidades de interés de las singularidades de la función generadora. La función generadora también se puede utilizar para establecer una simple recurrencia para calcular las probabilidades con mayor precisión. Utilizamos este enfoque para construir estimadores simples de la tasa de éxito de la heurística de siembra bajo diferentes tipos de errores de secuenciación, y mostramos que las estimaciones son precisas en situaciones prácticas. Más generalmente, este trabajo muestra estrategias novedosas basadas en combinatoria analítica para calcular probabilidades de interés en bioinformática.
Descripción
Las heurísticas de siembra son las estrategias más ampliamente utilizadas para acelerar el alineamiento de secuencias en bioinformática. Tales estrategias son más exitosas si están calibradas, de modo que se pueda ajustar adecuadamente el equilibrio entre velocidad y precisión. En el caso ampliamente utilizado del mapeo de lecturas, hasta ahora ha sido imposible predecir la tasa de éxito de las estrategias de siembra competidoras por falta de un marco teórico. Aquí presentamos un enfoque para estimar tales cantidades basado en la teoría de combinatoria analítica. La estrategia consiste en especificar una construcción combinatoria de lecturas donde falla la heurística de siembra, traducir esta especificación en una función generadora utilizando reglas formales y finalmente extraer las probabilidades de interés de las singularidades de la función generadora. La función generadora también se puede utilizar para establecer una simple recurrencia para calcular las probabilidades con mayor precisión. Utilizamos este enfoque para construir estimadores simples de la tasa de éxito de la heurística de siembra bajo diferentes tipos de errores de secuenciación, y mostramos que las estimaciones son precisas en situaciones prácticas. Más generalmente, este trabajo muestra estrategias novedosas basadas en combinatoria analítica para calcular probabilidades de interés en bioinformática.