Detección de anomalías en procesamiento de lenguaje natural para mejorar las predicciones sobre las preferencias turísticas
Autores: Meira, Jorge; Carneiro, João; Bolón-Canedo, Verónica; Alonso-Betanzos, Amparo; Novais, Paulo; Marreiros, Goreti
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Detección de anomalías en procesamiento de lenguaje natural para mejorar las predicciones sobre las preferencias turísticas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Argumentación
Tomadores de decisiones
Preferencias
Aprendizaje automático
Procesamiento del lenguaje natural
Métodos supervisados
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
Los modelos de diálogo basados en argumentación han demostrado ser apropiados para contextos de decisión en los que se pretende superar la falta de interacción entre los tomadores de decisiones, ya sea porque están dispersos, son demasiados o simplemente ni siquiera son conocidos. Sin embargo, para apoyar procesos de decisión con modelos de diálogo basados en argumentación, es necesario tener conocimiento de ciertos aspectos específicos de cada tomador de decisiones, como preferencias, intereses y limitaciones, entre otros. No obtener este conocimiento podría arruinar el éxito del modelo. En este trabajo, buscamos facilitar el proceso de adquisición de información estudiando estrategias para predecir automáticamente las preferencias (calificaciones) de los turistas en relación con los puntos de interés basándonos en sus reseñas. Exploramos diferentes métodos de aprendizaje automático para predecir las calificaciones de los usuarios. Utilizamos estrategias de Procesamiento del Lenguaje Natural para predecir si una reseña es positiva o negativa y la calificación asignada por los usuarios en una escala del 1 al 5. Luego aplicamos métodos supervisados como Regresión Logística, Bosques Aleatorios, Árboles de Decisión, Vecinos más Cercanos y Redes Neuronales Recurrentes para determinar si un turista le gusta o no le gusta un punto de interés dado. También utilizamos un enfoque distintivo en este campo a través de técnicas no supervisadas para problemas de detección de anomalías. El objetivo era mejorar el modelo supervisado en la identificación únicamente de aquellos turistas que realmente les gusta o no les gusta un punto de interés en particular, donde el objetivo principal no es identificar a todos, sino fundamentalmente no fallar a aquellos que son identificados en esas condiciones. Los experimentos realizados mostraron que los modelos desarrollados podrían predecir con alta precisión si una reseña es positiva o negativa pero tienen cierta dificultad para predecir con precisión la calificación asignada por los usuarios. El método no supervisado Factor Local de Atípicos mejoró los resultados, reduciendo los falsos positivos de la Regresión Logística con un costo asociado de aumentar los falsos negativos.
Descripción
Los modelos de diálogo basados en argumentación han demostrado ser apropiados para contextos de decisión en los que se pretende superar la falta de interacción entre los tomadores de decisiones, ya sea porque están dispersos, son demasiados o simplemente ni siquiera son conocidos. Sin embargo, para apoyar procesos de decisión con modelos de diálogo basados en argumentación, es necesario tener conocimiento de ciertos aspectos específicos de cada tomador de decisiones, como preferencias, intereses y limitaciones, entre otros. No obtener este conocimiento podría arruinar el éxito del modelo. En este trabajo, buscamos facilitar el proceso de adquisición de información estudiando estrategias para predecir automáticamente las preferencias (calificaciones) de los turistas en relación con los puntos de interés basándonos en sus reseñas. Exploramos diferentes métodos de aprendizaje automático para predecir las calificaciones de los usuarios. Utilizamos estrategias de Procesamiento del Lenguaje Natural para predecir si una reseña es positiva o negativa y la calificación asignada por los usuarios en una escala del 1 al 5. Luego aplicamos métodos supervisados como Regresión Logística, Bosques Aleatorios, Árboles de Decisión, Vecinos más Cercanos y Redes Neuronales Recurrentes para determinar si un turista le gusta o no le gusta un punto de interés dado. También utilizamos un enfoque distintivo en este campo a través de técnicas no supervisadas para problemas de detección de anomalías. El objetivo era mejorar el modelo supervisado en la identificación únicamente de aquellos turistas que realmente les gusta o no les gusta un punto de interés en particular, donde el objetivo principal no es identificar a todos, sino fundamentalmente no fallar a aquellos que son identificados en esas condiciones. Los experimentos realizados mostraron que los modelos desarrollados podrían predecir con alta precisión si una reseña es positiva o negativa pero tienen cierta dificultad para predecir con precisión la calificación asignada por los usuarios. El método no supervisado Factor Local de Atípicos mejoró los resultados, reduciendo los falsos positivos de la Regresión Logística con un costo asociado de aumentar los falsos negativos.