Identificación de texto relacionado con reacciones adversas a medicamentos en redes sociales: un enfoque de aprendizaje activo de múltiples vistas con diversas representaciones de documentos
Autores: Liu, Jing; Wang, Yue; Huang, Lihua; Zhang, Chenghong; Zhao, Songzheng
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Identificación de texto relacionado con reacciones adversas a medicamentos en redes sociales: un enfoque de aprendizaje activo de múltiples vistas con diversas representaciones de documentos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Reacciones adversas a medicamentos
Datos de redes sociales
Detección de texto relacionado con reacciones adversas a medicamentos
Aprendizaje activo de múltiples perspectivas
Representaciones de documentos
Seguridad de medicamentos.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las reacciones adversas a los medicamentos (RAM) son un gran problema de salud pública. Identificar texto que mencione RAM a partir de un gran volumen de datos de redes sociales es importante. Sin embargo, necesitamos abordar dos desafíos para la detección de texto relacionada con RAM de alto rendimiento: el problema del desequilibrio de datos y la necesidad de utilizar simultáneamente información basada en datos e información elaborada a mano. Por lo tanto, proponemos un enfoque llamado aprendizaje activo de múltiples vistas utilizando representaciones documentales específicas del dominio y basadas en datos (MVAL4D), que busca mejorar la capacidad predictiva y aliviar la necesidad de datos etiquetados. Específicamente, se propone un nuevo mecanismo de generación de vistas para generar múltiples vistas al explotar simultáneamente varias representaciones documentales obtenidas mediante ingeniería de características elaboradas a mano y mediante métodos de aprendizaje profundo. Además, a diferencia de estudios anteriores de aprendizaje activo en los que todas las instancias se eligen utilizando el mismo criterio de selección, MVAL4D adopta diferentes criterios (es decir, confianza e informatividad) para seleccionar instancias potencialmente positivas y potencialmente negativas para anotación manual. Los resultados experimentales verifican la efectividad de MVAL4D. El enfoque propuesto puede generalizarse a muchas otras tareas de clasificación de texto. Además, puede ofrecer una base sólida para la tarea de extracción de menciones de RAM y mejorar la viabilidad de monitorear la seguridad de los medicamentos utilizando datos de redes sociales.
Descripción
Las reacciones adversas a los medicamentos (RAM) son un gran problema de salud pública. Identificar texto que mencione RAM a partir de un gran volumen de datos de redes sociales es importante. Sin embargo, necesitamos abordar dos desafíos para la detección de texto relacionada con RAM de alto rendimiento: el problema del desequilibrio de datos y la necesidad de utilizar simultáneamente información basada en datos e información elaborada a mano. Por lo tanto, proponemos un enfoque llamado aprendizaje activo de múltiples vistas utilizando representaciones documentales específicas del dominio y basadas en datos (MVAL4D), que busca mejorar la capacidad predictiva y aliviar la necesidad de datos etiquetados. Específicamente, se propone un nuevo mecanismo de generación de vistas para generar múltiples vistas al explotar simultáneamente varias representaciones documentales obtenidas mediante ingeniería de características elaboradas a mano y mediante métodos de aprendizaje profundo. Además, a diferencia de estudios anteriores de aprendizaje activo en los que todas las instancias se eligen utilizando el mismo criterio de selección, MVAL4D adopta diferentes criterios (es decir, confianza e informatividad) para seleccionar instancias potencialmente positivas y potencialmente negativas para anotación manual. Los resultados experimentales verifican la efectividad de MVAL4D. El enfoque propuesto puede generalizarse a muchas otras tareas de clasificación de texto. Además, puede ofrecer una base sólida para la tarea de extracción de menciones de RAM y mejorar la viabilidad de monitorear la seguridad de los medicamentos utilizando datos de redes sociales.