logo móvil
Contáctanos

La máquina Tsetlin para análisis de sentimientos y detección de reseñas de spam en chino

Autores: Zhang, Xuanyu; Zhou, Hao; Yu, Ke; Wu, Xiaofei; Yazidi, Anis

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

La máquina Tsetlin para análisis de sentimientos y detección de reseñas de spam en chino


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Software

Palabras clave

Procesamiento de lenguaje natural
Redes neuronales de aprendizaje profundo
Máquina tsetlin
Interpretabilidad
Tareas de procesamiento de lenguaje natural en chino
Resultados experimentales

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 40

Citaciones: Sin citaciones


Descripción
En Procesamiento del Lenguaje Natural (PLN), las redes neuronales de aprendizaje profundo tienen un rendimiento superior pero plantean barreras de transparencia y explicabilidad, debido a su naturaleza de caja negra, y, por lo tanto, existe una falta de confiabilidad. Por otro lado, las técnicas clásicas de aprendizaje automático son intuitivas y fáciles de entender pero a menudo no pueden desempeñarse satisfactoriamente. Afortunadamente, muchos estudios de investigación han indicado recientemente que el modelo recién introducido, la Máquina Tsetlin (TM), tiene un rendimiento confiable y, al mismo tiempo, disfruta de interpretabilidad a nivel humano por naturaleza, lo cual es un enfoque prometedor para equilibrar efectividad e interpretabilidad. Sin embargo, casi todos los trabajos relacionados hasta ahora se han concentrado en el idioma inglés, mientras que la investigación en otros idiomas es relativamente escasa. Por lo tanto, proponemos un método novedoso, basado en el modelo TM, en el cual el proceso de aprendizaje es transparente y fácil de entender para tareas de PLN en chino. Nuestro modelo puede aprender información semántica en el idioma chino por cláusulas. Para la evaluación, realizamos experimentos en dos dominios, a saber, análisis de sentimientos y detección de reseñas de spam. Los resultados experimentales mostraron que, para ambos dominios, nuestro método podría proporcionar una precisión y una puntuación F1 más altas que los modelos de aprendizaje profundo complejos, pero no transparentes, como BERT y ERINE.

Otros recursos que podrían interesarte

Temas Virtualpro