Usando Etiquetado Colaborativo para Clasificación de Texto: De la Clasificación de Texto a la Minería de Opiniones
Autores: Charton, Eric; Meurs, Marie-Jean; Jean-Louis, Ludovic; Gagnon, Michel
Idioma: Inglés
Editor: MDPI
Año: 2013
Acceso abierto
Artículo científico
2013
Usando Etiquetado Colaborativo para Clasificación de Texto: De la Clasificación de Texto a la Minería de Opiniones
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Iniciativas
Usuarios
Plataformas colaborativas
Clasificación
Minería de textos
Sistemas basados en aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Numerosas iniciativas han permitido a los usuarios compartir conocimientos u opiniones utilizando plataformas colaborativas. En la mayoría de los casos, los usuarios proporcionan una descripción textual de su conocimiento, siguiendo restricciones muy limitadas o ninguna. Aquí, abordamos la clasificación de documentos escritos en un entorno así. Como caso de uso, nuestro estudio se realiza en el contexto del material de la campaña de evaluación de minería de textos, relacionado con la clasificación de recetas de cocina etiquetadas por usuarios de un sitio web colaborativo. Este contexto hace que algunas de las especificidades del corpus sean difíciles de modelar para sistemas basados en aprendizaje automático y sistemas basados en palabras clave o léxicos. En particular, diferentes autores pueden tener diferentes opiniones sobre cómo clasificar un documento dado. Los sistemas presentados a continuación fueron sometidos a la campaña de evaluación DÉfi Fouille de Textes 2013, donde obtuvieron los mejores resultados generales, ocupando el primer lugar en la tarea 1 y el segundo en la tarea 2. En este artículo, explicamos nuestro enfoque para construir sistemas relevantes y efectivos que manejen un corpus así.
Descripción
Numerosas iniciativas han permitido a los usuarios compartir conocimientos u opiniones utilizando plataformas colaborativas. En la mayoría de los casos, los usuarios proporcionan una descripción textual de su conocimiento, siguiendo restricciones muy limitadas o ninguna. Aquí, abordamos la clasificación de documentos escritos en un entorno así. Como caso de uso, nuestro estudio se realiza en el contexto del material de la campaña de evaluación de minería de textos, relacionado con la clasificación de recetas de cocina etiquetadas por usuarios de un sitio web colaborativo. Este contexto hace que algunas de las especificidades del corpus sean difíciles de modelar para sistemas basados en aprendizaje automático y sistemas basados en palabras clave o léxicos. En particular, diferentes autores pueden tener diferentes opiniones sobre cómo clasificar un documento dado. Los sistemas presentados a continuación fueron sometidos a la campaña de evaluación DÉfi Fouille de Textes 2013, donde obtuvieron los mejores resultados generales, ocupando el primer lugar en la tarea 1 y el segundo en la tarea 2. En este artículo, explicamos nuestro enfoque para construir sistemas relevantes y efectivos que manejen un corpus así.