Un marco de clasificación de oraciones para identificar errores geométricos en la terapia de radiación a partir de la literatura relevante
Autores: Basu, Tanmay; Goldsworthy, Simon; Gkoutos, Georgios V.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un marco de clasificación de oraciones para identificar errores geométricos en la terapia de radiación a partir de la literatura relevante
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Revisiones sistemáticas
Extracción de datos
Tratamiento de radioterapia
Revisiones de literatura
Aprendizaje automático
Procesamiento de lenguaje natural
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El objetivo de las revisiones sistemáticas es abordar una pregunta de investigación resumiendo estudios relevantes siguiendo un plan y un protocolo de búsqueda detallados, completos y transparentes para reducir el sesgo. Las revisiones sistemáticas son muy útiles en el ámbito biomédico y de la salud; sin embargo, la fase de extracción de datos del proceso de revisión sistemática requiere una experiencia sustancial y es laboriosa y consume mucho tiempo. El objetivo de este trabajo es automatizar parcialmente el proceso de construcción de revisiones de literatura sobre tratamientos de radioterapia sistemática resumiendo los elementos de datos requeridos sobre errores geométricos de la radioterapia a partir de la literatura relevante utilizando enfoques de aprendizaje automático y procesamiento de lenguaje natural (NLP). Se desarrolla un marco en este estudio que inicialmente construye un corpus de entrenamiento extrayendo oraciones que contienen diferentes tipos de errores geométricos de la radioterapia de publicaciones relevantes. Las publicaciones se recuperan de PubMed siguiendo un conjunto de reglas definidas por un experto en el dominio. Posteriormente, el método desarrolla un corpus de entrenamiento extrayendo oraciones relevantes utilizando una medida de similitud de oraciones. Luego, se entrena un clasificador de máquina de soporte vectorial (SVM) en este corpus de entrenamiento para extraer las oraciones de nuevas publicaciones que contienen errores geométricos relevantes. Para demostrar el enfoque propuesto, hemos utilizado 60 publicaciones que contienen errores geométricos en radioterapia para extraer automáticamente las oraciones que indican la media y la desviación estándar de diferentes tipos de errores entre la radioterapia planificada y la ejecutada. Los resultados experimentales muestran que la recuperación y la precisión del marco propuesto son, respectivamente, del 97% y del 72%. Los resultados muestran claramente que el marco es capaz de extraer casi todas las oraciones que contienen los datos requeridos sobre errores geométricos.
Descripción
El objetivo de las revisiones sistemáticas es abordar una pregunta de investigación resumiendo estudios relevantes siguiendo un plan y un protocolo de búsqueda detallados, completos y transparentes para reducir el sesgo. Las revisiones sistemáticas son muy útiles en el ámbito biomédico y de la salud; sin embargo, la fase de extracción de datos del proceso de revisión sistemática requiere una experiencia sustancial y es laboriosa y consume mucho tiempo. El objetivo de este trabajo es automatizar parcialmente el proceso de construcción de revisiones de literatura sobre tratamientos de radioterapia sistemática resumiendo los elementos de datos requeridos sobre errores geométricos de la radioterapia a partir de la literatura relevante utilizando enfoques de aprendizaje automático y procesamiento de lenguaje natural (NLP). Se desarrolla un marco en este estudio que inicialmente construye un corpus de entrenamiento extrayendo oraciones que contienen diferentes tipos de errores geométricos de la radioterapia de publicaciones relevantes. Las publicaciones se recuperan de PubMed siguiendo un conjunto de reglas definidas por un experto en el dominio. Posteriormente, el método desarrolla un corpus de entrenamiento extrayendo oraciones relevantes utilizando una medida de similitud de oraciones. Luego, se entrena un clasificador de máquina de soporte vectorial (SVM) en este corpus de entrenamiento para extraer las oraciones de nuevas publicaciones que contienen errores geométricos relevantes. Para demostrar el enfoque propuesto, hemos utilizado 60 publicaciones que contienen errores geométricos en radioterapia para extraer automáticamente las oraciones que indican la media y la desviación estándar de diferentes tipos de errores entre la radioterapia planificada y la ejecutada. Los resultados experimentales muestran que la recuperación y la precisión del marco propuesto son, respectivamente, del 97% y del 72%. Los resultados muestran claramente que el marco es capaz de extraer casi todas las oraciones que contienen los datos requeridos sobre errores geométricos.