Sensibilidad de las métricas de análisis de supervivencia
Autores: Vasilev, Iulii; Petrovskiy, Mikhail; Mashechkin, Igor
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Sensibilidad de las métricas de análisis de supervivencia
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Modelos de análisis de supervivencia
Probabilidad de un evento a lo largo del tiempo
Distribución de eventos a lo largo del tiempo
Eventos tardíos
Sensibilidad de métricas
Evaluación de calidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Los modelos de análisis de supervivencia permiten predecir la probabilidad de un evento a lo largo del tiempo. La especificidad de los datos de análisis de supervivencia incluye la distribución de eventos a lo largo del tiempo y la proporción de clases. Los eventos tardíos suelen ser raros y no corresponden a la distribución principal, afectando fuertemente la calidad de los modelos y la evaluación de calidad. En este documento, identificamos cuatro casos de sensibilidad excesiva de las métricas de análisis de supervivencia y proponemos métodos para superarlos. Para establecer la igualdad de impactos de observación, ajustamos los pesos de los eventos basados en el tiempo objetivo y el indicador de censura. Según la sensibilidad de las métricas, el (área bajo la curva de Precisión-Recall) es el más adecuado para evaluar la calidad de los modelos de supervivencia, y otras métricas se utilizan como funciones de pérdida. Para evaluar la influencia de la función de pérdida, el modelo utiliza unos para seleccionar el tamaño y los hiperparámetros del conjunto. El estudio experimental incluyó ocho conjuntos de datos médicos reales. Las modificaciones propuestas del (Puntaje Brier Integrado) mejoraron la calidad en comparación con las funciones de pérdida clásicas. Además, en siete de ocho conjuntos de datos, el uso de nuevas funciones de pérdida supera a los modelos existentes de la biblioteca scikit-survival.
Descripción
Los modelos de análisis de supervivencia permiten predecir la probabilidad de un evento a lo largo del tiempo. La especificidad de los datos de análisis de supervivencia incluye la distribución de eventos a lo largo del tiempo y la proporción de clases. Los eventos tardíos suelen ser raros y no corresponden a la distribución principal, afectando fuertemente la calidad de los modelos y la evaluación de calidad. En este documento, identificamos cuatro casos de sensibilidad excesiva de las métricas de análisis de supervivencia y proponemos métodos para superarlos. Para establecer la igualdad de impactos de observación, ajustamos los pesos de los eventos basados en el tiempo objetivo y el indicador de censura. Según la sensibilidad de las métricas, el (área bajo la curva de Precisión-Recall) es el más adecuado para evaluar la calidad de los modelos de supervivencia, y otras métricas se utilizan como funciones de pérdida. Para evaluar la influencia de la función de pérdida, el modelo utiliza unos para seleccionar el tamaño y los hiperparámetros del conjunto. El estudio experimental incluyó ocho conjuntos de datos médicos reales. Las modificaciones propuestas del (Puntaje Brier Integrado) mejoraron la calidad en comparación con las funciones de pérdida clásicas. Además, en siete de ocho conjuntos de datos, el uso de nuevas funciones de pérdida supera a los modelos existentes de la biblioteca scikit-survival.