Algoritmos de selección de genes en un espacio de decisión génica de células individuales basados en autoinformación
Autores: Fang, Yan; Lin, Yonghua; Huang, Chuanbo; Li, Zhaowen
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Algoritmos de selección de genes en un espacio de decisión génica de células individuales basados en autoinformación
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Algoritmos de selección de genes
Teoría de conjuntos aproximados
Función de evaluación
Dependencia
Autoinformación
Precisión de clasificación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Un paso crítico para los algoritmos de selección de genes que utilizan la teoría de conjuntos aproximados es el establecimiento de una función de evaluación de genes para evaluar la capacidad de clasificación de subconjuntos de genes candidatos. El concepto de dependencia en un modelo clásico de conjuntos aproximados de vecindario desempeña el papel de esta función de evaluación. Este criterio solo toma nota de la información proporcionada por la aproximación inferior y omite la aproximación superior, lo que puede resultar en la pérdida de información importante. Este documento propone algoritmos de selección de genes dentro de un espacio de decisión de genes de células individuales mediante el empleo de autoinformación, teniendo en cuenta tanto las aproximaciones inferiores como superiores. Inicialmente, se define la distancia entre los valores de expresión génica dentro de cada subespacio para establecer la relación de tolerancia en el conjunto de células. Posteriormente, se introduce la autoinformación a través de la lente de las clases de tolerancia. Luego se examina en detalle la relación entre estas medidas y sus respectivas propiedades. Para los datos de expresión génica, la métrica de autoinformación propuesta demuestra superioridad sobre otras medidas al tener en cuenta tanto las aproximaciones inferiores como superiores, facilitando así la selección de subconjuntos óptimos de genes. Finalmente, se desarrollan algoritmos de selección de genes dentro de un espacio de decisión de genes de células individuales basados en la métrica de autoinformación propuesta, y los experimentos realizados en 10 conjuntos de datos de células individuales disponibles públicamente indican que el rendimiento de clasificación de los algoritmos propuestos puede mejorarse mediante la selección de genes pertinentes para la clasificación. Los resultados demuestran que se logra una precisión de clasificación promedio del 93.7% (KNN) al seleccionar un 48.3% menos de genes que la puntuación de Fisher.
Descripción
Un paso crítico para los algoritmos de selección de genes que utilizan la teoría de conjuntos aproximados es el establecimiento de una función de evaluación de genes para evaluar la capacidad de clasificación de subconjuntos de genes candidatos. El concepto de dependencia en un modelo clásico de conjuntos aproximados de vecindario desempeña el papel de esta función de evaluación. Este criterio solo toma nota de la información proporcionada por la aproximación inferior y omite la aproximación superior, lo que puede resultar en la pérdida de información importante. Este documento propone algoritmos de selección de genes dentro de un espacio de decisión de genes de células individuales mediante el empleo de autoinformación, teniendo en cuenta tanto las aproximaciones inferiores como superiores. Inicialmente, se define la distancia entre los valores de expresión génica dentro de cada subespacio para establecer la relación de tolerancia en el conjunto de células. Posteriormente, se introduce la autoinformación a través de la lente de las clases de tolerancia. Luego se examina en detalle la relación entre estas medidas y sus respectivas propiedades. Para los datos de expresión génica, la métrica de autoinformación propuesta demuestra superioridad sobre otras medidas al tener en cuenta tanto las aproximaciones inferiores como superiores, facilitando así la selección de subconjuntos óptimos de genes. Finalmente, se desarrollan algoritmos de selección de genes dentro de un espacio de decisión de genes de células individuales basados en la métrica de autoinformación propuesta, y los experimentos realizados en 10 conjuntos de datos de células individuales disponibles públicamente indican que el rendimiento de clasificación de los algoritmos propuestos puede mejorarse mediante la selección de genes pertinentes para la clasificación. Los resultados demuestran que se logra una precisión de clasificación promedio del 93.7% (KNN) al seleccionar un 48.3% menos de genes que la puntuación de Fisher.