Suite LSPpred: Herramientas para la Predicción de Proteínas Secretorias Sin Líder en Plantas
Autores: Lonsdale, Andrew; Ceballos-Laita, Laura; Takahashi, Daisuke; Uemura, Matsuo; Abadía, Javier; Davis, Melissa J.; Bacic, Antony; Doblin, Monika S.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Suite LSPpred: Herramientas para la Predicción de Proteínas Secretorias Sin Líder en Plantas
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Botánica
Palabras clave
Proteínas vegetales
Proteínas secretoras sin líder
Desarrollo vegetal
Respuestas al estrés abiótico
Algoritmos de aprendizaje automático
Validación experimental
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 10
Citaciones: Sin citaciones
Las proteínas vegetales que se secretan sin una secuencia de péptido señal clásica se denominan proteínas secretorias sin líder (LSP) y están implicadas tanto en el desarrollo de las plantas como en las respuestas a estrés (a) biótico. En los flujos de trabajo experimentales de proteómica vegetal, la identificación de LSP se ve obstaculizada por la posibilidad de contaminación de otros compartimentos subcelulares durante la purificación del secretoma. Aplicar algoritmos de aprendizaje automático para predecir LSP en plantas también es un desafío debido a la rareza de ejemplos validados experimentalmente para fines de entrenamiento. Este trabajo intenta abordar este problema estableciendo criterios para identificar posibles LSP vegetales basados en observaciones experimentales y entrenando clasificadores de bosques aleatorios en los conjuntos de datos putativos. La base de datos de proteínas vegetales LSPDB y las herramientas de predicción bioinformática LSPpred y SPLpred están disponibles en lsppred.lspdb.org. Los módulos LSPpred y SPLpred están validados internamente en el conjunto de datos de entrenamiento, con falsos positivos controlados al 5%, y también son capaces de clasificar el número limitado de LSP vegetales establecidos (SPLpred (3/4, LSPpred 4/4). Hasta que se establezca un conjunto más grande de LSP auténticos (validados experimentalmente de forma independiente) utilizando tecnologías de imagen (microscopía de luz/fluorescencia/electrónica) para confirmar la ubicación subcelular, estas herramientas representan un método de puente para predecir e identificar LSP vegetales putativos para una posterior validación experimental.
Descripción
Las proteínas vegetales que se secretan sin una secuencia de péptido señal clásica se denominan proteínas secretorias sin líder (LSP) y están implicadas tanto en el desarrollo de las plantas como en las respuestas a estrés (a) biótico. En los flujos de trabajo experimentales de proteómica vegetal, la identificación de LSP se ve obstaculizada por la posibilidad de contaminación de otros compartimentos subcelulares durante la purificación del secretoma. Aplicar algoritmos de aprendizaje automático para predecir LSP en plantas también es un desafío debido a la rareza de ejemplos validados experimentalmente para fines de entrenamiento. Este trabajo intenta abordar este problema estableciendo criterios para identificar posibles LSP vegetales basados en observaciones experimentales y entrenando clasificadores de bosques aleatorios en los conjuntos de datos putativos. La base de datos de proteínas vegetales LSPDB y las herramientas de predicción bioinformática LSPpred y SPLpred están disponibles en lsppred.lspdb.org. Los módulos LSPpred y SPLpred están validados internamente en el conjunto de datos de entrenamiento, con falsos positivos controlados al 5%, y también son capaces de clasificar el número limitado de LSP vegetales establecidos (SPLpred (3/4, LSPpred 4/4). Hasta que se establezca un conjunto más grande de LSP auténticos (validados experimentalmente de forma independiente) utilizando tecnologías de imagen (microscopía de luz/fluorescencia/electrónica) para confirmar la ubicación subcelular, estas herramientas representan un método de puente para predecir e identificar LSP vegetales putativos para una posterior validación experimental.