Sobre la Creación de una Lista de Términos Multipalabra Médicos Derivada de un Corpus
Autores: Florescu, Cosmin Mihail; Ohniwa, Ryosuke L.
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Sobre la Creación de una Lista de Términos Multipalabra Médicos Derivada de un Corpus
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Estudios
Listas de palabras médicas
Métodos de análisis de corpus
Términos médicos de varias palabras
Sketch Engine
Función de extracción de términos
Relevancia
Datos de dispersión
Corpus médico
Corpus de inglés general
Subconjuntos semánticos
Anatomía
Trastornos
Conceptos e Ideas
Replicabilidad
Materiales basados en evidencia
Cursos de Inglés para Fines Médicos
Entornos de comunicación en salud
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Aunque varios estudios han logrado crear listas de palabras médicas utilizando métodos de análisis de corpus, actualmente hay una escasez de listas completas que contengan términos médicos de múltiples palabras (TMPs). Este estudio intenta llenar este vacío identificando TMPs médicos utilizando un gran corpus de libros de texto médicos en inglés (28,384,681 palabras en total). Se utilizó la función de extracción de términos en Sketch Engine para extraer TMPs de alta frecuencia y calcular datos de importancia y dispersión para cada TMP. La validez de la lista resultante y de subconjuntos específicos se probó utilizando un corpus médico diferente y un corpus general en inglés. La lista resultante comprende 3307 TMPs, con un 63.83% (2111 TMPs) que ocurren con frecuencias comparables en el diferente corpus médico y solo un 0.97% (32 TMPs) que ocurren con frecuencias comparables en el corpus general en inglés. El estudio también reveló diferencias claras en la replicabilidad entre subconjuntos semánticos, con TMPs de los grupos semánticos de Anatomía y Trastornos mostrando alta replicabilidad, mientras que los TMPs del grupo semántico de Conceptos e Ideas mostraron replicabilidad baja a moderada. La lista puede ser utilizada para desarrollar materiales basados en evidencia en cursos de Inglés para Fines Médicos y para explorar más a fondo cómo se empaqueta la información en entornos de comunicación en el ámbito de la salud.
Descripción
Aunque varios estudios han logrado crear listas de palabras médicas utilizando métodos de análisis de corpus, actualmente hay una escasez de listas completas que contengan términos médicos de múltiples palabras (TMPs). Este estudio intenta llenar este vacío identificando TMPs médicos utilizando un gran corpus de libros de texto médicos en inglés (28,384,681 palabras en total). Se utilizó la función de extracción de términos en Sketch Engine para extraer TMPs de alta frecuencia y calcular datos de importancia y dispersión para cada TMP. La validez de la lista resultante y de subconjuntos específicos se probó utilizando un corpus médico diferente y un corpus general en inglés. La lista resultante comprende 3307 TMPs, con un 63.83% (2111 TMPs) que ocurren con frecuencias comparables en el diferente corpus médico y solo un 0.97% (32 TMPs) que ocurren con frecuencias comparables en el corpus general en inglés. El estudio también reveló diferencias claras en la replicabilidad entre subconjuntos semánticos, con TMPs de los grupos semánticos de Anatomía y Trastornos mostrando alta replicabilidad, mientras que los TMPs del grupo semántico de Conceptos e Ideas mostraron replicabilidad baja a moderada. La lista puede ser utilizada para desarrollar materiales basados en evidencia en cursos de Inglés para Fines Médicos y para explorar más a fondo cómo se empaqueta la información en entornos de comunicación en el ámbito de la salud.