logo móvil
Contáctanos

Análisis de los efectos del preprocesamiento de documentos en la minería de texto y opiniones

Autores: Eler, Danilo Medeiros; Grosa, Denilson; Pola, Ives; Garcia, Rogério; Correia, Ronaldo; Teixeira, Jaqueline

Idioma: Inglés

Editor: MDPI

Año: 2018

Descargar PDF

Acceso abierto

Artículo científico
2018

Análisis de los efectos del preprocesamiento de documentos en la minería de texto y opiniones


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Información textual
Datos no estructurados
Algoritmos de minería de datos
Paso de preprocesamiento
Proceso de minería de texto
Metodología

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Típicamente, la información textual está disponible como datos no estructurados, que requieren procesamiento para que los algoritmos de minería de datos puedan manejar dichos datos; este procesamiento se conoce como el paso de preprocesamiento en el proceso general de minería de texto. Este documento tiene como objetivo analizar el fuerte impacto que tiene el paso de preprocesamiento en la mayoría de las tareas de minería. Por lo tanto, proponemos una metodología para variar distintas combinaciones de pasos de preprocesamiento y analizar qué combinación de preprocesamiento permite una alta precisión. Con el fin de mostrar diferentes combinaciones de métodos de preprocesamiento, se realizaron experimentos comparando algunas combinaciones como la reducción de palabras, el ponderado de términos, la eliminación de términos basada en un corte de baja frecuencia y la eliminación de palabras vacías. Estas combinaciones se aplicaron en tareas de minería de texto y opinión, de las cuales se calcularon tasas de clasificación correctas para resaltar el fuerte impacto de las combinaciones de preprocesamiento. Además, proporcionamos representaciones gráficas de cada combinación de preprocesamiento para mostrar cómo los enfoques visuales son útiles para mostrar los efectos del procesamiento en las similitudes de documentos y la formación de grupos (es decir, cohesión y separación).

Otros recursos que podrían interesarte

Temas Virtualpro