La máquina Tsetlin para análisis de sentimientos y detección de reseñas de spam en chino
Autores: Zhang, Xuanyu; Zhou, Hao; Yu, Ke; Wu, Xiaofei; Yazidi, Anis
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
La máquina Tsetlin para análisis de sentimientos y detección de reseñas de spam en chino
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Procesamiento de lenguaje natural
Redes neuronales de aprendizaje profundo
Máquina tsetlin
Interpretabilidad
Tareas de procesamiento de lenguaje natural en chino
Resultados experimentales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
En Procesamiento del Lenguaje Natural (PLN), las redes neuronales de aprendizaje profundo tienen un rendimiento superior pero plantean barreras de transparencia y explicabilidad, debido a su naturaleza de caja negra, y, por lo tanto, existe una falta de confiabilidad. Por otro lado, las técnicas clásicas de aprendizaje automático son intuitivas y fáciles de entender pero a menudo no pueden desempeñarse satisfactoriamente. Afortunadamente, muchos estudios de investigación han indicado recientemente que el modelo recién introducido, la Máquina Tsetlin (TM), tiene un rendimiento confiable y, al mismo tiempo, disfruta de interpretabilidad a nivel humano por naturaleza, lo cual es un enfoque prometedor para equilibrar efectividad e interpretabilidad. Sin embargo, casi todos los trabajos relacionados hasta ahora se han concentrado en el idioma inglés, mientras que la investigación en otros idiomas es relativamente escasa. Por lo tanto, proponemos un método novedoso, basado en el modelo TM, en el cual el proceso de aprendizaje es transparente y fácil de entender para tareas de PLN en chino. Nuestro modelo puede aprender información semántica en el idioma chino por cláusulas. Para la evaluación, realizamos experimentos en dos dominios, a saber, análisis de sentimientos y detección de reseñas de spam. Los resultados experimentales mostraron que, para ambos dominios, nuestro método podría proporcionar una precisión y una puntuación F1 más altas que los modelos de aprendizaje profundo complejos, pero no transparentes, como BERT y ERINE.
Descripción
En Procesamiento del Lenguaje Natural (PLN), las redes neuronales de aprendizaje profundo tienen un rendimiento superior pero plantean barreras de transparencia y explicabilidad, debido a su naturaleza de caja negra, y, por lo tanto, existe una falta de confiabilidad. Por otro lado, las técnicas clásicas de aprendizaje automático son intuitivas y fáciles de entender pero a menudo no pueden desempeñarse satisfactoriamente. Afortunadamente, muchos estudios de investigación han indicado recientemente que el modelo recién introducido, la Máquina Tsetlin (TM), tiene un rendimiento confiable y, al mismo tiempo, disfruta de interpretabilidad a nivel humano por naturaleza, lo cual es un enfoque prometedor para equilibrar efectividad e interpretabilidad. Sin embargo, casi todos los trabajos relacionados hasta ahora se han concentrado en el idioma inglés, mientras que la investigación en otros idiomas es relativamente escasa. Por lo tanto, proponemos un método novedoso, basado en el modelo TM, en el cual el proceso de aprendizaje es transparente y fácil de entender para tareas de PLN en chino. Nuestro modelo puede aprender información semántica en el idioma chino por cláusulas. Para la evaluación, realizamos experimentos en dos dominios, a saber, análisis de sentimientos y detección de reseñas de spam. Los resultados experimentales mostraron que, para ambos dominios, nuestro método podría proporcionar una precisión y una puntuación F1 más altas que los modelos de aprendizaje profundo complejos, pero no transparentes, como BERT y ERINE.