Dinámicas Temporales en la Clasificación de Textos Cortos: Mejorando la Comprensión Semántica a Través de un Modelo Consciente del Tiempo
Autores: Abdalgader, Khaled; Matroud, Atheer A.; Al-Doboni, Ghaleb
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Dinámicas Temporales en la Clasificación de Textos Cortos: Mejorando la Comprensión Semántica a Través de un Modelo Consciente del Tiempo
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Modelos de clasificación de texto
Variaciones temporales
Semántica del lenguaje
Textos sensibles al tiempo
Precisión de clasificación
Información temporal
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los modelos tradicionales de clasificación de texto se basan predominantemente en representaciones de texto estáticas, lo que les impide capturar las variaciones temporales en el uso del lenguaje y los significados semánticos en evolución. Esta limitación reduce su capacidad para clasificar con precisión textos sensibles al tiempo, donde entender el contexto, detectar tendencias y abordar los cambios semánticos a lo largo del tiempo son críticos. Este artículo presenta un nuevo modelo de clasificación de texto corto consciente del tiempo que incorpora información temporal, lo que permite el seguimiento y la adaptación a la evolución de la semántica del lenguaje. El modelo propuesto mejora la comprensión contextual al aprovechar las marcas de tiempo y mejora significativamente la precisión de la clasificación, particularmente para aplicaciones sensibles al tiempo como la clasificación de temas de noticias. El modelo emplea una arquitectura híbrida que combina Redes Neuronales Convolucionales (CNN) y redes de Memoria a Largo y Corto Plazo Bidireccional (BiLSTM), enriquecidas con mecanismos de atención para capturar tanto dependencias locales como globales. Para refinar aún más la representación semántica y mitigar los efectos de la deriva semántica, el modelo ajusta las incrustaciones de GloVe y emplea una augmentación de datos basada en sinónimos. El enfoque propuesto se evalúa en tres conjuntos de datos dinámicos de referencia, logrando un rendimiento superior con una precisión de clasificación que alcanza el 92% para los dos primeros conjuntos de datos y el 85% para el tercer conjunto de datos. Además, el modelo se aplica a una tarea de categorización de diferentes campos y análisis de tendencias, demostrando su capacidad para capturar patrones temporales y realizar un análisis detallado de tendencias del contenido textual independiente del dominio. Estos resultados subrayan el potencial del marco propuesto para proporcionar una comprensión más profunda de la naturaleza evolutiva del lenguaje y su impacto en la clasificación de textos cortos. Este trabajo avanza el procesamiento del lenguaje natural al ofrecer un marco de clasificación consciente del tiempo, abordando los desafíos de la dinámica temporal en la semántica del lenguaje.
Descripción
Los modelos tradicionales de clasificación de texto se basan predominantemente en representaciones de texto estáticas, lo que les impide capturar las variaciones temporales en el uso del lenguaje y los significados semánticos en evolución. Esta limitación reduce su capacidad para clasificar con precisión textos sensibles al tiempo, donde entender el contexto, detectar tendencias y abordar los cambios semánticos a lo largo del tiempo son críticos. Este artículo presenta un nuevo modelo de clasificación de texto corto consciente del tiempo que incorpora información temporal, lo que permite el seguimiento y la adaptación a la evolución de la semántica del lenguaje. El modelo propuesto mejora la comprensión contextual al aprovechar las marcas de tiempo y mejora significativamente la precisión de la clasificación, particularmente para aplicaciones sensibles al tiempo como la clasificación de temas de noticias. El modelo emplea una arquitectura híbrida que combina Redes Neuronales Convolucionales (CNN) y redes de Memoria a Largo y Corto Plazo Bidireccional (BiLSTM), enriquecidas con mecanismos de atención para capturar tanto dependencias locales como globales. Para refinar aún más la representación semántica y mitigar los efectos de la deriva semántica, el modelo ajusta las incrustaciones de GloVe y emplea una augmentación de datos basada en sinónimos. El enfoque propuesto se evalúa en tres conjuntos de datos dinámicos de referencia, logrando un rendimiento superior con una precisión de clasificación que alcanza el 92% para los dos primeros conjuntos de datos y el 85% para el tercer conjunto de datos. Además, el modelo se aplica a una tarea de categorización de diferentes campos y análisis de tendencias, demostrando su capacidad para capturar patrones temporales y realizar un análisis detallado de tendencias del contenido textual independiente del dominio. Estos resultados subrayan el potencial del marco propuesto para proporcionar una comprensión más profunda de la naturaleza evolutiva del lenguaje y su impacto en la clasificación de textos cortos. Este trabajo avanza el procesamiento del lenguaje natural al ofrecer un marco de clasificación consciente del tiempo, abordando los desafíos de la dinámica temporal en la semántica del lenguaje.