Un algoritmo de búsqueda de coincidencias ortogonales regularizado basado en metaanálisis novel para predecir cáncer de pulmón con biomarcadores seleccionados
Autores: Wang, Sai; Wang, Bin-Yuan; Li, Hai-Fang
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un algoritmo de búsqueda de coincidencias ortogonales regularizado basado en metaanálisis novel para predecir cáncer de pulmón con biomarcadores seleccionados
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Selección de biomarcadores
Cáncer de pulmón
Conjuntos de datos de expresión génica
Metaanálisis
Algoritmo MA-ROMP
Análisis predictivo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
La selección de biomarcadores para análisis predictivo encuentra el problema de identificar un subconjunto de genes de tamaño mínimo que sea máximamente predictivo de un resultado de interés. Para conjuntos de datos de expresión génica de cáncer de pulmón, es un gran desafío manejar las características de un tamaño de muestra pequeño, alta dimensionalidad, alto ruido, así como la baja reproducibilidad de biomarcadores importantes en diferentes estudios. En este artículo, nuestro propuesto algoritmo de búsqueda ortogonal regularizada basado en metaanálisis (MA-ROMP) no solo gana fuerza al usar múltiples conjuntos de datos para identificar biomarcadores genómicos importantes de manera eficiente, sino que también mantiene la selección flexible entre conjuntos de datos para tener en cuenta la heterogeneidad de los datos a través de una descomposición jerárquica en los coeficientes de regresión. Para un estudio de caso de cáncer de pulmón, descargamos GSE10072, GSE19188 y GSE19804 de la base de datos GEO con condiciones experimentales inconsistentes, métodos de preparación de muestras diferentes, grupos de estudio diferentes, etc. En comparación con métodos de vanguardia, nuestro método muestra la mayor precisión, de hasta un 95.63%, con la mejor capacidad discriminativa (AUC 0.9756) así como una disminución de más de 15 veces en su tiempo de entrenamiento. Los resultados experimentales tanto en datos simulados como en varios conjuntos de datos de expresión génica de cáncer de pulmón demuestran que MA-ROMP es una herramienta más efectiva para la selección de biomarcadores y la predicción del cáncer.
Descripción
La selección de biomarcadores para análisis predictivo encuentra el problema de identificar un subconjunto de genes de tamaño mínimo que sea máximamente predictivo de un resultado de interés. Para conjuntos de datos de expresión génica de cáncer de pulmón, es un gran desafío manejar las características de un tamaño de muestra pequeño, alta dimensionalidad, alto ruido, así como la baja reproducibilidad de biomarcadores importantes en diferentes estudios. En este artículo, nuestro propuesto algoritmo de búsqueda ortogonal regularizada basado en metaanálisis (MA-ROMP) no solo gana fuerza al usar múltiples conjuntos de datos para identificar biomarcadores genómicos importantes de manera eficiente, sino que también mantiene la selección flexible entre conjuntos de datos para tener en cuenta la heterogeneidad de los datos a través de una descomposición jerárquica en los coeficientes de regresión. Para un estudio de caso de cáncer de pulmón, descargamos GSE10072, GSE19188 y GSE19804 de la base de datos GEO con condiciones experimentales inconsistentes, métodos de preparación de muestras diferentes, grupos de estudio diferentes, etc. En comparación con métodos de vanguardia, nuestro método muestra la mayor precisión, de hasta un 95.63%, con la mejor capacidad discriminativa (AUC 0.9756) así como una disminución de más de 15 veces en su tiempo de entrenamiento. Los resultados experimentales tanto en datos simulados como en varios conjuntos de datos de expresión génica de cáncer de pulmón demuestran que MA-ROMP es una herramienta más efectiva para la selección de biomarcadores y la predicción del cáncer.