AmazonForest: En Metapredicción In Silico de Variantes Patogénicas
Autores: Palheta, Helber Gonzales Almeida; Gonçalves, Wanderson Gonçalves; Brito, Leonardo Miranda; dos Santos, Arthur Ribeiro; dos Reis Matsumoto, Marlon; Ribeiro-dos-Santos, Ândrea; de Araújo, Gilderlanio Santana
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
AmazonForest: En Metapredicción In Silico de Variantes Patogénicas
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Biología
Palabras clave
Asociaciones genéticas
ClinVar
AmazonForest
Patogenicidad
Variantes genéticas
Enfermedades complejas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
ClinVar es una plataforma web que almacena 789,000 asociaciones genéticas con enfermedades complejas. Un conjunto parcial de estas asociaciones genéticas catalogadas ha desafiado a clínicos y genetistas, a menudo llevando a interpretaciones conflictivas o a una incertidumbre sobre la significancia del impacto clínico. En este estudio, abordamos la (re)clasificación de variantes genéticas mediante AmazonForest, que es un modelo de metapredicción de patogenicidad basado en bosques aleatorios que funciona combinando datos de impacto funcional de ocho herramientas de predicción. Evaluamos el rendimiento de algoritmos de aprendizaje de representación como autoencoders para proponer una mejor estrategia. Todos los modelos de metapredicción fueron entrenados con datos de ClinVar, y las variantes genéticas fueron anotadas con ocho predictores de impacto funcional catalogados con SnpEff/SnpSift. AmazonForest implementa el mejor modelo de bosque aleatorio con una estrategia de codificación de datos one hot, que muestra un Área Bajo la Curva ROC de >=0.93. AmazonForest se utilizó para la predicción de patogenicidad de un conjunto de 101,000 variantes genéticas de significancia incierta o conflicto de interpretación. Nuestros hallazgos revelaron 24,000 variantes con alta probabilidad de patogenicidad. Además, mostramos resultados para la Enfermedad de Alzheimer como una demostración de su aplicación en la interpretación clínica de variantes genéticas en enfermedades complejas. Por último, AmazonForest está disponible como una herramienta web y objeto de R que se puede cargar para realizar predicciones de patogenicidad.
Descripción
ClinVar es una plataforma web que almacena 789,000 asociaciones genéticas con enfermedades complejas. Un conjunto parcial de estas asociaciones genéticas catalogadas ha desafiado a clínicos y genetistas, a menudo llevando a interpretaciones conflictivas o a una incertidumbre sobre la significancia del impacto clínico. En este estudio, abordamos la (re)clasificación de variantes genéticas mediante AmazonForest, que es un modelo de metapredicción de patogenicidad basado en bosques aleatorios que funciona combinando datos de impacto funcional de ocho herramientas de predicción. Evaluamos el rendimiento de algoritmos de aprendizaje de representación como autoencoders para proponer una mejor estrategia. Todos los modelos de metapredicción fueron entrenados con datos de ClinVar, y las variantes genéticas fueron anotadas con ocho predictores de impacto funcional catalogados con SnpEff/SnpSift. AmazonForest implementa el mejor modelo de bosque aleatorio con una estrategia de codificación de datos one hot, que muestra un Área Bajo la Curva ROC de >=0.93. AmazonForest se utilizó para la predicción de patogenicidad de un conjunto de 101,000 variantes genéticas de significancia incierta o conflicto de interpretación. Nuestros hallazgos revelaron 24,000 variantes con alta probabilidad de patogenicidad. Además, mostramos resultados para la Enfermedad de Alzheimer como una demostración de su aplicación en la interpretación clínica de variantes genéticas en enfermedades complejas. Por último, AmazonForest está disponible como una herramienta web y objeto de R que se puede cargar para realizar predicciones de patogenicidad.