Filtros Savitzky-Golay Adaptativos para el Análisis de Picos de Variación en el Número de Copias a partir de Datos de Secuenciación de Exoma Completo
Autores: Ochieng, Peter Juma; Maróti, Zoltán; Dombi, József; Krész, Miklós; Békési, József; Kalmár, Tibor
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Filtros Savitzky-Golay Adaptativos para el Análisis de Picos de Variación en el Número de Copias a partir de Datos de Secuenciación de Exoma Completo
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Variación en el número de copias
Secuenciación de todo el exoma
Picos de CNV
Suavizado de Savitzky-Golay
Método adaptativo
Detección de picos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La variación en el número de copias (CNV) es una forma de variación estructural en el genoma humano que proporciona información médica sobre enfermedades humanas complejas; mientras que la secuenciación de todo el genoma se está volviendo más asequible, la secuenciación de todo el exoma (WES) sigue siendo una herramienta importante en el diagnóstico clínico. Debido a su naturaleza discontinua y las características únicas de los datos de WES basados en enriquecimiento de objetivos escasos, el análisis y la detección de picos de CNV siguen siendo tareas difíciles. El suavizado de Savitzky-Golay (SG) es bien conocido como un método de suavizado rápido y eficiente. Sin embargo, ningún estudio ha documentado el uso de esta técnica para la detección de picos de CNV. Se sabe que la efectividad del filtro SG clásico depende de la selección adecuada de la longitud de la ventana y el grado polinómico, que deben corresponder con la escala del pico porque, en el caso de picos con una alta tasa de cambio, la efectividad del filtro podría estar restringida. Basado en el algoritmo de Savitzky-Golay, este documento introduce un nuevo método adaptativo para suavizar distribuciones de picos irregulares. El método propuesto garantiza una reducción de ruido de alta precisión al modificar dinámicamente los resultados del suavizado previo para ajustar automáticamente los parámetros. Nuestro método ofrece una técnica adicional de extracción de características basada en la densidad y la distancia euclidiana. En comparación con el filtrado clásico de Savitzky-Golay y otros métodos de filtrado similares, la evaluación del rendimiento demuestra que el filtrado adaptativo de Savitzky-Golay tiene un mejor desempeño. Según los resultados experimentales, nuestro método detecta eficazmente picos de CNV en todos los segmentos genómicos tanto para etiquetas cortas como largas, con valores de fidelidad de altura de pico mínimos (es decir, bajo sesgo de estimación). Como resultado, demostramos claramente cuán bien funciona el método de filtrado adaptativo de Savitzky-Golay y cómo su uso en la detección de picos de CNV puede complementar las técnicas existentes utilizadas en el análisis de picos de CNV.
Descripción
La variación en el número de copias (CNV) es una forma de variación estructural en el genoma humano que proporciona información médica sobre enfermedades humanas complejas; mientras que la secuenciación de todo el genoma se está volviendo más asequible, la secuenciación de todo el exoma (WES) sigue siendo una herramienta importante en el diagnóstico clínico. Debido a su naturaleza discontinua y las características únicas de los datos de WES basados en enriquecimiento de objetivos escasos, el análisis y la detección de picos de CNV siguen siendo tareas difíciles. El suavizado de Savitzky-Golay (SG) es bien conocido como un método de suavizado rápido y eficiente. Sin embargo, ningún estudio ha documentado el uso de esta técnica para la detección de picos de CNV. Se sabe que la efectividad del filtro SG clásico depende de la selección adecuada de la longitud de la ventana y el grado polinómico, que deben corresponder con la escala del pico porque, en el caso de picos con una alta tasa de cambio, la efectividad del filtro podría estar restringida. Basado en el algoritmo de Savitzky-Golay, este documento introduce un nuevo método adaptativo para suavizar distribuciones de picos irregulares. El método propuesto garantiza una reducción de ruido de alta precisión al modificar dinámicamente los resultados del suavizado previo para ajustar automáticamente los parámetros. Nuestro método ofrece una técnica adicional de extracción de características basada en la densidad y la distancia euclidiana. En comparación con el filtrado clásico de Savitzky-Golay y otros métodos de filtrado similares, la evaluación del rendimiento demuestra que el filtrado adaptativo de Savitzky-Golay tiene un mejor desempeño. Según los resultados experimentales, nuestro método detecta eficazmente picos de CNV en todos los segmentos genómicos tanto para etiquetas cortas como largas, con valores de fidelidad de altura de pico mínimos (es decir, bajo sesgo de estimación). Como resultado, demostramos claramente cuán bien funciona el método de filtrado adaptativo de Savitzky-Golay y cómo su uso en la detección de picos de CNV puede complementar las técnicas existentes utilizadas en el análisis de picos de CNV.