Ensamble de aprendizaje profundo para clasificación binaria multietiqueta de contenido generado por el usuario
Autores: Haralabopoulos, Giannis; Anagnostopoulos, Ioannis; McAuley, Derek
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Ensamble de aprendizaje profundo para clasificación binaria multietiqueta de contenido generado por el usuario
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Análisis de sentimientos
Computación afectiva
Información emocional
Clasificadores multietiqueta
Aprendizaje conjunto
Ajuste de hiperparámetros
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
El análisis de sentimientos generalmente se refiere al análisis de contenido generado por humanos a través de un filtro de polaridad. El cómputo afectivo se ocupa de las emociones exactas transmitidas a través de la información. La información emocional con mayor frecuencia no puede ser descrita con precisión por una sola clase de emoción. Los clasificadores multietiqueta pueden categorizar el contenido generado por humanos en múltiples clases emocionales. El aprendizaje en conjunto puede mejorar los aspectos estadísticos, computacionales y de representación de dichos clasificadores. Presentamos un conjunto apilado base y proponemos un conjunto ponderado. Nuestro conjunto ponderado propuesto puede usar múltiples clasificadores para mejorar los resultados de clasificación sin ajuste de hiperparámetros o sobreajuste de datos. Evaluamos nuestros modelos de conjunto con dos conjuntos de datos. El primer conjunto de datos es de Semeval2018-Task 1 y contiene casi 7000 Tweets, etiquetados con 11 clases de sentimientos. El segundo conjunto de datos es el Conjunto de Comentarios Tóxicos con más de 150,000 comentarios, etiquetados con seis niveles diferentes de abuso o acoso. Nuestros resultados sugieren que el aprendizaje en conjunto mejora los resultados de clasificación en hasta.
Descripción
El análisis de sentimientos generalmente se refiere al análisis de contenido generado por humanos a través de un filtro de polaridad. El cómputo afectivo se ocupa de las emociones exactas transmitidas a través de la información. La información emocional con mayor frecuencia no puede ser descrita con precisión por una sola clase de emoción. Los clasificadores multietiqueta pueden categorizar el contenido generado por humanos en múltiples clases emocionales. El aprendizaje en conjunto puede mejorar los aspectos estadísticos, computacionales y de representación de dichos clasificadores. Presentamos un conjunto apilado base y proponemos un conjunto ponderado. Nuestro conjunto ponderado propuesto puede usar múltiples clasificadores para mejorar los resultados de clasificación sin ajuste de hiperparámetros o sobreajuste de datos. Evaluamos nuestros modelos de conjunto con dos conjuntos de datos. El primer conjunto de datos es de Semeval2018-Task 1 y contiene casi 7000 Tweets, etiquetados con 11 clases de sentimientos. El segundo conjunto de datos es el Conjunto de Comentarios Tóxicos con más de 150,000 comentarios, etiquetados con seis niveles diferentes de abuso o acoso. Nuestros resultados sugieren que el aprendizaje en conjunto mejora los resultados de clasificación en hasta.