Minería de Texto para Entender las Variantes Genéticas Causantes de Enfermedades
Autores: Nezamuldeen, Leena; Jafri, Mohsin Saleet
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Minería de Texto para Entender las Variantes Genéticas Causantes de Enfermedades
Categoría
Gestión y administración
Subcategoría
Gestión del conocimiento
Palabras clave
Código genético
Proteínas
Variantes
Enfermedad
Bases de datos
Patogenicidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
Las variaciones en el código genético de las proteínas se consideran responsables de conferir rasgos y enfermedades subyacentes. Identificar las consecuencias funcionales de estas variantes genéticas es un desafío complicado. Existen bases de datos en línea que contienen información sobre variantes. Muchas publicaciones también han descrito variantes en detalle. Además, hay herramientas que permiten predecir la patogenicidad de las variantes. Sin embargo, navegar por estas fuentes dispares consume tiempo y a veces es complejo. Finalmente, la minería de texto y los modelos de lenguaje grande ofrecen enfoques prometedores para comprender la forma textual de este conocimiento. Esta revisión discute estos desafíos y los recursos y herramientas en línea disponibles para facilitar este proceso. Además, se sugiere un marco computacional para acelerar y facilitar el proceso de identificación del fenotipo causado por una variante genética particular. Este marco demuestra una forma de recopilar y comprender el conocimiento sobre variantes de manera más eficiente y efectiva.
Descripción
Las variaciones en el código genético de las proteínas se consideran responsables de conferir rasgos y enfermedades subyacentes. Identificar las consecuencias funcionales de estas variantes genéticas es un desafío complicado. Existen bases de datos en línea que contienen información sobre variantes. Muchas publicaciones también han descrito variantes en detalle. Además, hay herramientas que permiten predecir la patogenicidad de las variantes. Sin embargo, navegar por estas fuentes dispares consume tiempo y a veces es complejo. Finalmente, la minería de texto y los modelos de lenguaje grande ofrecen enfoques prometedores para comprender la forma textual de este conocimiento. Esta revisión discute estos desafíos y los recursos y herramientas en línea disponibles para facilitar este proceso. Además, se sugiere un marco computacional para acelerar y facilitar el proceso de identificación del fenotipo causado por una variante genética particular. Este marco demuestra una forma de recopilar y comprender el conocimiento sobre variantes de manera más eficiente y efectiva.