Un tubería basada en aprendizaje automático para la extracción de información de reseñas de clientes
Autores: Lakatos, Róbert; Bogacsovics, Gerg; Harangi, Balázs; Lakatos, István; Tiba, Attila; Tóth, János; Szabó, Marianna; Hajdu, András
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un tubería basada en aprendizaje automático para la extracción de información de reseñas de clientes
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Procesamiento del lenguaje natural
Modelos de aprendizaje automático
Soluciones basadas en redes neuronales
Opiniones de clientes
Redes neuronales basadas en transformadores
Extracción de palabras clave
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
La eficiencia del procesamiento del lenguaje natural ha mejorado drásticamente con la llegada de modelos de aprendizaje automático, especialmente soluciones basadas en redes neuronales. Sin embargo, algunas tareas siguen siendo desafiantes, especialmente al considerar dominios específicos. Este documento presenta un modelo que puede extraer ideas de las reseñas de clientes utilizando métodos de aprendizaje automático integrados en un flujo de trabajo. Para la modelización de temas, nuestro modelo compuesto utiliza redes neuronales basadas en transformadores diseñadas para el procesamiento del lenguaje natural, extracción de palabras clave basada en incrustaciones vectoriales y agrupamiento. Los elementos de nuestro modelo se han integrado y adaptado para cumplir mejor con los requisitos de extracción eficiente de información y modelización de temas de la información extraída para la minería de opiniones. Nuestro enfoque fue validado y comparado con otros métodos de vanguardia utilizando conjuntos de datos de referencia públicamente disponibles. Los resultados muestran que nuestro sistema tiene un mejor rendimiento que los métodos existentes de modelización de temas y extracción de palabras clave en esta tarea.
Descripción
La eficiencia del procesamiento del lenguaje natural ha mejorado drásticamente con la llegada de modelos de aprendizaje automático, especialmente soluciones basadas en redes neuronales. Sin embargo, algunas tareas siguen siendo desafiantes, especialmente al considerar dominios específicos. Este documento presenta un modelo que puede extraer ideas de las reseñas de clientes utilizando métodos de aprendizaje automático integrados en un flujo de trabajo. Para la modelización de temas, nuestro modelo compuesto utiliza redes neuronales basadas en transformadores diseñadas para el procesamiento del lenguaje natural, extracción de palabras clave basada en incrustaciones vectoriales y agrupamiento. Los elementos de nuestro modelo se han integrado y adaptado para cumplir mejor con los requisitos de extracción eficiente de información y modelización de temas de la información extraída para la minería de opiniones. Nuestro enfoque fue validado y comparado con otros métodos de vanguardia utilizando conjuntos de datos de referencia públicamente disponibles. Los resultados muestran que nuestro sistema tiene un mejor rendimiento que los métodos existentes de modelización de temas y extracción de palabras clave en esta tarea.