Imputando árboles filogenéticos utilizando politopos tropicales sobre el espacio de árboles filogenéticos
Autores: Yoshida, Ruriko
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Imputando árboles filogenéticos utilizando politopos tropicales sobre el espacio de árboles filogenéticos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Análisis filogenéticos
Genes faltantes
árbol génico
Geometría tropical
Politopo tropical
Distancia de Robinson-Foulds
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
Cuando aplicamos análisis filogenéticos comparativos a datos genómicos, se plantea un problema y un desafío significativos, ya que algunas de las especies (o taxa) dadas a menudo tienen genes faltantes (es decir, datos). En tal caso, debemos imputar una parte faltante de un árbol genético a partir de una muestra de árboles genéticos. En este breve documento, proponemos un método novedoso para inferir la parte faltante de un árbol filogenético utilizando un análogo de una regresión lineal clásica en el contexto de la geometría tropical. En nuestro enfoque, consideramos un politopo tropical, un casco convexo con respecto a la métrica tropical más cercana a los puntos de datos. Mostramos una condición que nos permite garantizar que un árbol estimado a partir del método tiene a lo sumo una distancia de Robinson-Foulds (RF) de cuatro del verdadero, y experimentos computacionales con datos simulados y datos empíricos de Clavicipitaceae, que contiene más de 4000 genes, muestran que el método funciona bien.
Descripción
Cuando aplicamos análisis filogenéticos comparativos a datos genómicos, se plantea un problema y un desafío significativos, ya que algunas de las especies (o taxa) dadas a menudo tienen genes faltantes (es decir, datos). En tal caso, debemos imputar una parte faltante de un árbol genético a partir de una muestra de árboles genéticos. En este breve documento, proponemos un método novedoso para inferir la parte faltante de un árbol filogenético utilizando un análogo de una regresión lineal clásica en el contexto de la geometría tropical. En nuestro enfoque, consideramos un politopo tropical, un casco convexo con respecto a la métrica tropical más cercana a los puntos de datos. Mostramos una condición que nos permite garantizar que un árbol estimado a partir del método tiene a lo sumo una distancia de Robinson-Foulds (RF) de cuatro del verdadero, y experimentos computacionales con datos simulados y datos empíricos de Clavicipitaceae, que contiene más de 4000 genes, muestran que el método funciona bien.