Reconocimiento de postura multilingüe y multiobjetivo en consultas públicas en línea
Autores: Barriere, Valentin; Balahur, Alexandra
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Reconocimiento de postura multilingüe y multiobjetivo en consultas públicas en línea
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Aprendizaje automático
Reconocimiento de postura
Consultas públicas
Sistemas automáticos
Conjuntos de datos
Aprendizaje auto-supervisado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
El aprendizaje automático es una herramienta interesante para el reconocimiento de posturas en un contexto a gran escala, en términos de tamaño de datos, pero también en cuanto a los temas abordados o los idiomas utilizados por los participantes. Las consultas públicas de los ciudadanos utilizando plataformas de democracia participativa en línea ofrecen este tipo de escenario y son buenos casos de uso para sistemas automáticos de reconocimiento de posturas. En este documento, proponemos utilizar tres conjuntos de datos de consultas públicas, con el fin de entrenar un modelo capaz de clasificar la postura de un ciudadano dentro de un texto, hacia una propuesta o una pregunta de debate. Estudiamos la detección de posturas en varios contextos: utilizando datos de una plataforma en línea sin interacciones entre usuarios, utilizando datos multilingües de debates en línea que están en un solo idioma, y utilizando datos de debates en línea intra-multilingües, que pueden contener varios idiomas dentro de la misma discusión de debate única. Proponemos varios baselines y métodos para aprovechar los diferentes datos disponibles, comparando los resultados de modelos que utilizan anotaciones fuera del conjunto de datos, y anotaciones binarias o ternarias del conjunto de datos objetivo. Finalmente, propusimos un método de aprendizaje auto-supervisado para aprovechar los datos no etiquetados. Anotamos ambos conjuntos de datos con etiquetas de postura ternarias y los pusimos a disposición.
Descripción
El aprendizaje automático es una herramienta interesante para el reconocimiento de posturas en un contexto a gran escala, en términos de tamaño de datos, pero también en cuanto a los temas abordados o los idiomas utilizados por los participantes. Las consultas públicas de los ciudadanos utilizando plataformas de democracia participativa en línea ofrecen este tipo de escenario y son buenos casos de uso para sistemas automáticos de reconocimiento de posturas. En este documento, proponemos utilizar tres conjuntos de datos de consultas públicas, con el fin de entrenar un modelo capaz de clasificar la postura de un ciudadano dentro de un texto, hacia una propuesta o una pregunta de debate. Estudiamos la detección de posturas en varios contextos: utilizando datos de una plataforma en línea sin interacciones entre usuarios, utilizando datos multilingües de debates en línea que están en un solo idioma, y utilizando datos de debates en línea intra-multilingües, que pueden contener varios idiomas dentro de la misma discusión de debate única. Proponemos varios baselines y métodos para aprovechar los diferentes datos disponibles, comparando los resultados de modelos que utilizan anotaciones fuera del conjunto de datos, y anotaciones binarias o ternarias del conjunto de datos objetivo. Finalmente, propusimos un método de aprendizaje auto-supervisado para aprovechar los datos no etiquetados. Anotamos ambos conjuntos de datos con etiquetas de postura ternarias y los pusimos a disposición.