Detección de postura explicativa supervisada a distancia a través de la supervisión de cadena de pensamiento
Autores: Ding, Daijun; Dai, Genan; Peng, Cheng; Peng, Xiaojiang; Zhang, Bowen; Huang, Hu
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Detección de postura explicativa supervisada a distancia a través de la supervisión de cadena de pensamiento
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Investigando
Actitudes públicas
Redes sociales
Detección de postura
Redes neuronales
Explicabilidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
Investigar las actitudes públicas en las redes sociales es crucial para los sistemas de minería de opiniones. La detección de postura tiene como objetivo predecir la actitud hacia un objetivo específico expresado en un texto. Sin embargo, los detectores de postura neurales efectivos requieren una cantidad sustancial de datos de entrenamiento, que son difíciles de recopilar debido a la naturaleza dinámica de las redes sociales. Además, las redes neuronales profundas (DNN) carecen de explicabilidad, lo que las hace inadecuadas para escenarios que requieren explicaciones. Proponemos un marco de detección de postura explicativo supervisado de manera remota (DS-ESD), que comprende un método basado en cadenas de pensamiento (CoT) basado en instrucciones, una red generativa y un predictor de postura basado en transformadores. El método CoT emplea plantillas de instrucciones para extraer explicaciones de detección de postura de un modelo de lenguaje muy grande (VLLM). La red generativa aprende el mapeo entrada-explicación, y un clasificador de postura basado en transformadores se entrena con etiquetas de postura anotadas por VLLM, implementando supervisión remota. Proponemos una estrategia de rectificación de etiquetas para mitigar el impacto de etiquetas erróneas. Experimentos en tres conjuntos de datos de referencia mostraron que nuestro modelo superó a los métodos comparados, validando su eficacia en tareas de detección de postura. Esta investigación contribuye al avance de marcos de detección de postura explicativos, aprovechando la supervisión remota y las estrategias de rectificación de etiquetas para mejorar el rendimiento y la interpretabilidad.
Descripción
Investigar las actitudes públicas en las redes sociales es crucial para los sistemas de minería de opiniones. La detección de postura tiene como objetivo predecir la actitud hacia un objetivo específico expresado en un texto. Sin embargo, los detectores de postura neurales efectivos requieren una cantidad sustancial de datos de entrenamiento, que son difíciles de recopilar debido a la naturaleza dinámica de las redes sociales. Además, las redes neuronales profundas (DNN) carecen de explicabilidad, lo que las hace inadecuadas para escenarios que requieren explicaciones. Proponemos un marco de detección de postura explicativo supervisado de manera remota (DS-ESD), que comprende un método basado en cadenas de pensamiento (CoT) basado en instrucciones, una red generativa y un predictor de postura basado en transformadores. El método CoT emplea plantillas de instrucciones para extraer explicaciones de detección de postura de un modelo de lenguaje muy grande (VLLM). La red generativa aprende el mapeo entrada-explicación, y un clasificador de postura basado en transformadores se entrena con etiquetas de postura anotadas por VLLM, implementando supervisión remota. Proponemos una estrategia de rectificación de etiquetas para mitigar el impacto de etiquetas erróneas. Experimentos en tres conjuntos de datos de referencia mostraron que nuestro modelo superó a los métodos comparados, validando su eficacia en tareas de detección de postura. Esta investigación contribuye al avance de marcos de detección de postura explicativos, aprovechando la supervisión remota y las estrategias de rectificación de etiquetas para mejorar el rendimiento y la interpretabilidad.