logo móvil
Contáctanos

HyEWCos: Un Estudio Comparativo de Técnicas Híbridas de Embedding y Ponderación para la Similitud de Texto en Textos Educativos Subjetivos Cortos

Autores: Hendry, Hendry; Tukino, Tukino; Sediyono, Eko; Fauzi, Ahmad; Huda, Baenil

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

HyEWCos: Un Estudio Comparativo de Técnicas Híbridas de Embedding y Ponderación para la Similitud de Texto en Textos Educativos Subjetivos Cortos


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Algoritmos de incrustación
Sistemas de ponderación
Similitud de texto basada en la percepción
Enfoque de similitud coseno
Modelo híbrido
HyEWCos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Este estudio tiene como objetivo evaluar y contrastar el rendimiento de diversas combinaciones de algoritmos de incrustación y sistemas de ponderación en la medición de la similitud de texto basada en la percepción utilizando el enfoque de similitud coseno. Dentro de un diseño experimental estructurado, se construyó un modelo híbrido denominado HyEWCos (Incrustación y Ponderación Híbrida para Similitud Coseno) que incorpora modelos de incrustación convencionales (Word2Vec, FastText), modelos basados en transformadores (BERT, GPT) y esquemas de ponderación de palabras estadísticos y lingüísticos (TFIDF, BM25, ponderación por POS y ponderación por N). Los resultados de las pruebas indican que Word2Vec combinado con la arquitectura CBOW y la ponderación TFIDF siempre devolvió el rendimiento más confiable, con los valores de error más bajos (RMSE y MAE de 0.9868) y la mayor correlación de calificación con el juicio de expertos (Pearson, 0.524; Spearman, 0.543). Estos resultados muestran que los enfoques de representación distribuida condicionada por contexto funcionan mejor en mantener la sutileza semántica de textos cortos y subjetivos que los modelos de transformadores que no están ajustados. Este trabajo es único en términos de su marco de evaluación porque integra enfoques de incrustación y ponderación que hasta ahora se han examinado principalmente por separado. La principal contribución del estudio es el desarrollo de un marco experimental que sirve como base para construir sistemas de evaluación basados en texto más estables y precisos. La investigación también demuestra la necesidad de tomar decisiones sobre los métodos de representación basados en el tipo de datos y el dominio y abre la puerta para continuar investigando en modelos híbridos adaptativos y cómo su potencial puede lograrse a través de la combinación de lo mejor de varios enfoques.

Otros recursos que podrían interesarte

Temas Virtualpro