Redes multimodales y semisupervisadas guiadas por atención mejorada para predecir la agudeza visual (AV) después de la terapia con anti-VEGF
Autores: Wang, Yizhen; Wang, Yaqi; Liu, Xianwen; Cui, Weiwei; Jin, Peng; Cheng, Yuxia; Jia, Gangyong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Redes multimodales y semisupervisadas guiadas por atención mejorada para predecir la agudeza visual (AV) después de la terapia con anti-VEGF
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Tecnología de telemedicina
Pacientes de DME
Terapia anti-VEGF
Agudeza visual
Algoritmo multimodal
Aprendizaje semisupervisado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
El desarrollo de la tecnología de telemedicina ha proporcionado nuevas vías para el diagnóstico y tratamiento de pacientes con EMD, especialmente después de la terapia con factor de crecimiento endotelial vascular (VEGF), y la predicción precisa de la agudeza visual (AV) de los pacientes es importante para optimizar los planes de tratamiento de seguimiento. Sin embargo, los métodos actuales de predicción automatizada a menudo requieren intervención humana y tienen poca interpretabilidad, lo que dificulta su aplicación generalizada en escenarios de telemedicina. Por lo tanto, se necesita con urgencia un modelo de predicción automatizado eficiente y con buena interpretabilidad para mejorar los resultados del tratamiento de pacientes con EMD en entornos de telemedicina. En este estudio, proponemos un algoritmo multimodal basado en un marco de aprendizaje semisupervisado, que tiene como objetivo combinar imágenes de tomografía de coherencia óptica (OCT) y datos clínicos para predecir automáticamente los valores de AV de los pacientes después del tratamiento con anti-VEGF. Nuestro enfoque primero realiza la segmentación retiniana de las imágenes de OCT a través de un marco de aprendizaje semisupervisado, que a su vez extrae biomarcadores clave como el grosor retiniano central (CST). Posteriormente, estas características se combinan con los datos clínicos del paciente y se introducen en un algoritmo de aprendizaje multimodal para la predicción de la AV. Nuestro modelo tuvo un buen desempeño en la Competencia de Big Data de la Sociedad de Teleoftalmología de Asia Pacífico (APTOS), obteniendo el quinto lugar en la puntuación general y el tercer lugar en la precisión de la predicción de AV. La segmentación retiniana logró una precisión del 99.03 +/- 0.19% en el conjunto de datos HZO. Este marco algorítmico multimodal es importante en el contexto de la telemedicina, especialmente para el tratamiento de pacientes con EMD.
Descripción
El desarrollo de la tecnología de telemedicina ha proporcionado nuevas vías para el diagnóstico y tratamiento de pacientes con EMD, especialmente después de la terapia con factor de crecimiento endotelial vascular (VEGF), y la predicción precisa de la agudeza visual (AV) de los pacientes es importante para optimizar los planes de tratamiento de seguimiento. Sin embargo, los métodos actuales de predicción automatizada a menudo requieren intervención humana y tienen poca interpretabilidad, lo que dificulta su aplicación generalizada en escenarios de telemedicina. Por lo tanto, se necesita con urgencia un modelo de predicción automatizado eficiente y con buena interpretabilidad para mejorar los resultados del tratamiento de pacientes con EMD en entornos de telemedicina. En este estudio, proponemos un algoritmo multimodal basado en un marco de aprendizaje semisupervisado, que tiene como objetivo combinar imágenes de tomografía de coherencia óptica (OCT) y datos clínicos para predecir automáticamente los valores de AV de los pacientes después del tratamiento con anti-VEGF. Nuestro enfoque primero realiza la segmentación retiniana de las imágenes de OCT a través de un marco de aprendizaje semisupervisado, que a su vez extrae biomarcadores clave como el grosor retiniano central (CST). Posteriormente, estas características se combinan con los datos clínicos del paciente y se introducen en un algoritmo de aprendizaje multimodal para la predicción de la AV. Nuestro modelo tuvo un buen desempeño en la Competencia de Big Data de la Sociedad de Teleoftalmología de Asia Pacífico (APTOS), obteniendo el quinto lugar en la puntuación general y el tercer lugar en la precisión de la predicción de AV. La segmentación retiniana logró una precisión del 99.03 +/- 0.19% en el conjunto de datos HZO. Este marco algorítmico multimodal es importante en el contexto de la telemedicina, especialmente para el tratamiento de pacientes con EMD.