Aprovechando modelos de transformadores para una farmacovigilancia mejorada: un análisis comparativo de la extracción de RAM de textos biomédicos y de redes sociales
Autores: Elbiach, Oumayma; Grissette, Hanane; Nfaoui, El Habib
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Aprovechando modelos de transformadores para una farmacovigilancia mejorada: un análisis comparativo de la extracción de RAM de textos biomédicos y de redes sociales
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Extracción de reacciones adversas a medicamentos en texto biomédico
Atención médica
Farmacovigilancia
Modelos basados en transformadores
Extracción de RAM.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La extracción de Reacciones Adversas a Medicamentos de textos biomédicos es una tarea crítica en el campo de la salud y la farmacovigilancia. Sirve como piedra angular para mejorar la seguridad de los pacientes al permitir la identificación temprana y la mitigación de riesgos potenciales asociados con tratamientos farmacéuticos. Este proceso no solo ayuda a detectar efectos secundarios dañinos que pueden no haber sido evidentes durante los ensayos clínicos, sino que también contribuye a una comprensión más amplia de la seguridad de los medicamentos en entornos del mundo real, guiando en última instancia acciones regulatorias e informando prácticas clínicas. En este estudio, realizamos una evaluación exhaustiva de once modelos basados en transformadores para la extracción de ADR, centrándonos en dos conjuntos de datos ampliamente utilizados: CADEC y SMM4H. La tarea se abordó como un problema de etiquetado de secuencias, donde cada token en el texto se clasifica como parte de un ADR o no. Se ajustaron y evaluaron varias arquitecturas de transformadores, incluidas BioBERT, PubMedBERT y SpanBERT, en estos conjuntos de datos. BioBERT demostró un rendimiento superior en el conjunto de datos de CADEC, logrando un impresionante puntaje F1 del 86.13%, lo que indica su sólida capacidad para reconocer ADR dentro de narrativas de pacientes. Por otro lado, SpanBERT surgió como el mejor intérprete en el conjunto de datos de SMM4H, con un puntaje F1 del 84.29%, mostrando su efectividad en el procesamiento de datos de redes sociales más diversos y desafiantes. Estos resultados resaltan la importancia de seleccionar modelos apropiados basados en características específicas como la formalidad del texto, el lenguaje específico del dominio y la complejidad de la tarea para lograr un rendimiento óptimo en la extracción de ADR.
Descripción
La extracción de Reacciones Adversas a Medicamentos de textos biomédicos es una tarea crítica en el campo de la salud y la farmacovigilancia. Sirve como piedra angular para mejorar la seguridad de los pacientes al permitir la identificación temprana y la mitigación de riesgos potenciales asociados con tratamientos farmacéuticos. Este proceso no solo ayuda a detectar efectos secundarios dañinos que pueden no haber sido evidentes durante los ensayos clínicos, sino que también contribuye a una comprensión más amplia de la seguridad de los medicamentos en entornos del mundo real, guiando en última instancia acciones regulatorias e informando prácticas clínicas. En este estudio, realizamos una evaluación exhaustiva de once modelos basados en transformadores para la extracción de ADR, centrándonos en dos conjuntos de datos ampliamente utilizados: CADEC y SMM4H. La tarea se abordó como un problema de etiquetado de secuencias, donde cada token en el texto se clasifica como parte de un ADR o no. Se ajustaron y evaluaron varias arquitecturas de transformadores, incluidas BioBERT, PubMedBERT y SpanBERT, en estos conjuntos de datos. BioBERT demostró un rendimiento superior en el conjunto de datos de CADEC, logrando un impresionante puntaje F1 del 86.13%, lo que indica su sólida capacidad para reconocer ADR dentro de narrativas de pacientes. Por otro lado, SpanBERT surgió como el mejor intérprete en el conjunto de datos de SMM4H, con un puntaje F1 del 84.29%, mostrando su efectividad en el procesamiento de datos de redes sociales más diversos y desafiantes. Estos resultados resaltan la importancia de seleccionar modelos apropiados basados en características específicas como la formalidad del texto, el lenguaje específico del dominio y la complejidad de la tarea para lograr un rendimiento óptimo en la extracción de ADR.