Predicción de los Requisitos de UCI Postoperatoria: Cerrando la Brecha Translacional con un Referente Clínico del Mundo Real para Enfoques de Inteligencia Artificial
Autores: Althammer, Alexander; Berger, Felix; Spring, Oliver; Simon, Philipp; Girrbach, Felix; Dieing, Maximilian; Brunner, Jens O.; Shmygalev, Sergey; Bartenschlager, Christina C.; Heller, Axel R.
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Predicción de los Requisitos de UCI Postoperatoria: Cerrando la Brecha Translacional con un Referente Clínico del Mundo Real para Enfoques de Inteligencia Artificial
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Predicción
Cuidado postoperatorio
Inteligencia artificial
Aprendizaje automático
Juicio clínico
Rendimiento predictivo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Antecedentes: La predicción precisa de los requisitos de atención postoperatoria es crítica para la seguridad del paciente y la asignación de recursos. Aunque se han propuesto numerosos enfoques que involucran inteligencia artificial (IA) y aprendizaje automático (AA) para apoyar tales predicciones, su implementación en la práctica ha sido hasta ahora insuficientemente exitosa. Una razón de esto es que el rendimiento de los algoritmos es difícil de evaluar en el uso práctico, ya que la precisión de las decisiones clínicas aún no se ha cuantificado sistemáticamente. Como resultado, los modelos a menudo se evalúan puramente desde una perspectiva técnica, descuidando el contexto socio-técnico. Métodos: Realizamos un estudio observacional retrospectivo y unicéntrico en el Hospital Universitario de Augsburgo, que incluyó 35,488 casos quirúrgicos electivos documentados entre agosto de 2023 y enero de 2025. Para cada caso, se compararon las predicciones del nivel de atención preoperatoria realizadas por los equipos de cirugía y anestesiología con la atención postoperatoria real proporcionada. El rendimiento predictivo se evaluó utilizando precisión y sensibilidad. Dado que se trata de un conjunto de datos altamente desbalanceado, además de la sensibilidad y especificidad, también se calcularon la precisión balanceada y el puntaje Fbeta. Los resultados se contrastaron con enfoques publicados basados en Aprendizaje Automático (AA). Resultados: La precisión general de la predicción fue alta (cirugía: 91.2%; anestesiología: 87.1%). Sin embargo, la sensibilidad para identificar a los pacientes que requieren cuidados intensivos postoperatorios fue notablemente más baja que la reportada para los modelos de AA en la literatura, con las mayores discrepancias observadas en los pacientes que finalmente fueron admitidos en la UCI (cirugía: 38.05%; anestesiología: 56.84%; AA: 70%). No obstante, el juicio clínico demostró un puntaje F1 superior, indicando un rendimiento más equilibrado entre sensibilidad y precisión (cirugía: 0.527; anestesiología: 0.551; AA: 0.28). Conclusiones: Este estudio proporciona el primer punto de referencia del mundo real de la experiencia clínica en la predicción de atención postoperatoria y muestra una forma en que los enfoques modernos de AA deben ser evaluados en un contexto sociotécnico específico. Al cuantificar el rendimiento predictivo de cirujanos y anestesiólogos, permite una evaluación de los enfoques existentes de AA. Así, la fortaleza de nuestro trabajo es la provisión de un punto de referencia del mundo real contra el cual todos los métodos de AA para la predicción preoperatoria de la demanda de UCI pueden ser evaluados sistemáticamente. Esto permite, por primera vez, una comparación de diferentes enfoques sobre una base común y orientada a la práctica y, por lo tanto, facilita significativamente la traducción a la práctica clínica, cerrando así la brecha translacional. Además, ofrece un marco basado en datos para apoyar la integración de AA en la toma de decisiones preoperatorias.
Descripción
Antecedentes: La predicción precisa de los requisitos de atención postoperatoria es crítica para la seguridad del paciente y la asignación de recursos. Aunque se han propuesto numerosos enfoques que involucran inteligencia artificial (IA) y aprendizaje automático (AA) para apoyar tales predicciones, su implementación en la práctica ha sido hasta ahora insuficientemente exitosa. Una razón de esto es que el rendimiento de los algoritmos es difícil de evaluar en el uso práctico, ya que la precisión de las decisiones clínicas aún no se ha cuantificado sistemáticamente. Como resultado, los modelos a menudo se evalúan puramente desde una perspectiva técnica, descuidando el contexto socio-técnico. Métodos: Realizamos un estudio observacional retrospectivo y unicéntrico en el Hospital Universitario de Augsburgo, que incluyó 35,488 casos quirúrgicos electivos documentados entre agosto de 2023 y enero de 2025. Para cada caso, se compararon las predicciones del nivel de atención preoperatoria realizadas por los equipos de cirugía y anestesiología con la atención postoperatoria real proporcionada. El rendimiento predictivo se evaluó utilizando precisión y sensibilidad. Dado que se trata de un conjunto de datos altamente desbalanceado, además de la sensibilidad y especificidad, también se calcularon la precisión balanceada y el puntaje Fbeta. Los resultados se contrastaron con enfoques publicados basados en Aprendizaje Automático (AA). Resultados: La precisión general de la predicción fue alta (cirugía: 91.2%; anestesiología: 87.1%). Sin embargo, la sensibilidad para identificar a los pacientes que requieren cuidados intensivos postoperatorios fue notablemente más baja que la reportada para los modelos de AA en la literatura, con las mayores discrepancias observadas en los pacientes que finalmente fueron admitidos en la UCI (cirugía: 38.05%; anestesiología: 56.84%; AA: 70%). No obstante, el juicio clínico demostró un puntaje F1 superior, indicando un rendimiento más equilibrado entre sensibilidad y precisión (cirugía: 0.527; anestesiología: 0.551; AA: 0.28). Conclusiones: Este estudio proporciona el primer punto de referencia del mundo real de la experiencia clínica en la predicción de atención postoperatoria y muestra una forma en que los enfoques modernos de AA deben ser evaluados en un contexto sociotécnico específico. Al cuantificar el rendimiento predictivo de cirujanos y anestesiólogos, permite una evaluación de los enfoques existentes de AA. Así, la fortaleza de nuestro trabajo es la provisión de un punto de referencia del mundo real contra el cual todos los métodos de AA para la predicción preoperatoria de la demanda de UCI pueden ser evaluados sistemáticamente. Esto permite, por primera vez, una comparación de diferentes enfoques sobre una base común y orientada a la práctica y, por lo tanto, facilita significativamente la traducción a la práctica clínica, cerrando así la brecha translacional. Además, ofrece un marco basado en datos para apoyar la integración de AA en la toma de decisiones preoperatorias.