logo móvil
Contáctanos

Un nuevo híbrido basado en la red de memoria a largo plazo con optimización del algoritmo de hiena manchada para clasificación de texto multi-etiqueta

Autores: Khataei Maragheh, Hamed; Gharehchopogh, Farhad Soleimanian; Majidzadeh, Kambiz; Sangar, Amin Babazadeh

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Un nuevo híbrido basado en la red de memoria a largo plazo con optimización del algoritmo de hiena manchada para clasificación de texto multi-etiqueta


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Procesamiento de lenguaje natural
Clasificación de texto de múltiples etiquetas
Algoritmos de aprendizaje profundo
Optimizador de Hiena Manchada
Red LSTM
Algoritmo SHO

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones


Descripción
Un trabajo esencial en el procesamiento del lenguaje natural es la Clasificación de Texto Multi-etiqueta (MLTC). El propósito de la MLTC es asignar múltiples etiquetas a cada documento. Los métodos tradicionales de clasificación de texto, como el aprendizaje automático, generalmente implican la dispersión de datos y la falta de descubrimiento de relaciones entre los datos. Con el desarrollo de algoritmos de aprendizaje profundo, muchos autores han utilizado el aprendizaje profundo en MLTC. En este documento, se propone un modelo novedoso llamado Optimizador de Hiena Manchada (SHO)-Memoria a Corto Plazo (LSTM) para MLTC basado en la red LSTM y el algoritmo SHO. En la red LSTM, se utiliza el método Skip-gram para incrustar palabras en el espacio vectorial. El nuevo modelo utiliza el algoritmo SHO para optimizar el peso inicial de la red LSTM. Ajustar la matriz de pesos en LSTM es un desafío importante. Si el peso de las neuronas es preciso, entonces la precisión de la salida será mayor. El algoritmo SHO es un algoritmo metaheurístico basado en poblaciones que funciona según el comportamiento de caza de masas de hienas manchadas. En este algoritmo, cada solución del problema se codifica como una hiena. Luego, las hienas se acercan a la respuesta óptima siguiendo a la hiena líder. Se utilizan cuatro conjuntos de datos (RCV1-v2, EUR-Lex, Reuters-21578 y Bookmarks) para evaluar el modelo propuesto. Las evaluaciones demuestran que el modelo propuesto tiene una tasa de precisión más alta que LSTM, Algoritmo Genético-LSTM (GA-LSTM), Optimización por Enjambre de Partículas-LSTM (PSO-LSTM), Colonia Artificial de Abejas-LSTM (ABC-LSTM), Búsqueda de Algoritmo de Armonía-LSTM (HAS-LSTM) y Evolución Diferencial-LSTM (DE-LSTM). La mejora de la precisión del modelo SHO-LSTM para los cuatro conjuntos de datos en comparación con LSTM es del 7,52%, 7,12%, 1,92% y 4,90%, respectivamente.

Otros recursos que podrían interesarte

Temas Virtualpro