Comparando Estrategias de Aprendizaje Automático Supervisado y Características Lingüísticas para Buscar Opiniones Muy Negativas
Autores: Almatarneh, Sattam; Gamallo, Pablo
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Comparando Estrategias de Aprendizaje Automático Supervisado y Características Lingüísticas para Buscar Opiniones Muy Negativas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Clasificadores
Rendimiento
Características lingüísticas
N-gramas
Incrustaciones de palabras
Léxicos de polaridad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En este artículo, examinamos el rendimiento de varios clasificadores en el proceso de búsqueda de opiniones muy negativas. Más precisamente, realizamos un estudio empírico que analiza la influencia de tres tipos de características lingüísticas (n-gramas, incrustaciones de palabras y léxicos de polaridad) y sus combinaciones cuando se utilizan para alimentar diferentes clasificadores de aprendizaje automático supervisado: Naive Bayes (NB), Árbol de Decisión (DT) y Máquina de Vectores de Soporte (SVM). Los experimentos que hemos llevado a cabo muestran que SVM supera claramente a NB y DT en todos los conjuntos de datos, teniendo en cuenta todas las características individualmente, así como sus combinaciones.
Descripción
En este artículo, examinamos el rendimiento de varios clasificadores en el proceso de búsqueda de opiniones muy negativas. Más precisamente, realizamos un estudio empírico que analiza la influencia de tres tipos de características lingüísticas (n-gramas, incrustaciones de palabras y léxicos de polaridad) y sus combinaciones cuando se utilizan para alimentar diferentes clasificadores de aprendizaje automático supervisado: Naive Bayes (NB), Árbol de Decisión (DT) y Máquina de Vectores de Soporte (SVM). Los experimentos que hemos llevado a cabo muestran que SVM supera claramente a NB y DT en todos los conjuntos de datos, teniendo en cuenta todas las características individualmente, así como sus combinaciones.