Medición de la Similitud de Texto: Una Encuesta
Autores: Wang, Jiapeng; Dong, Yihong
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Medición de la Similitud de Texto: Una Encuesta
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Medición de similitud de texto
Tareas de procesamiento de lenguaje natural
Recuperación de información
Respuesta automática a preguntas
Traducción automática
Sistemas de diálogo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La medición de la similitud de texto es la base de las tareas de procesamiento del lenguaje natural, que juegan un papel importante en la recuperación de información, la respuesta automática a preguntas, la traducción automática, los sistemas de diálogo y la coincidencia de documentos. Este artículo examina sistemáticamente el estado de la investigación sobre la medición de similitud, analiza las ventajas y desventajas de los métodos actuales, desarrolla un sistema de descripción de clasificación más completo de los algoritmos de medición de similitud de texto y resume la dirección de desarrollo futuro. Con el objetivo de proporcionar una referencia para la investigación y aplicación relacionadas, el método de medición de similitud de texto se describe desde dos aspectos: la distancia de texto y la representación de texto. La distancia de texto se puede dividir en distancia de longitud, distancia de distribución y distancia semántica; la representación de texto se divide en basada en cadenas, basada en corpus, texto de semántica única, texto de múltiples semánticas y representación basada en estructuras gráficas. Finalmente, el desarrollo de la similitud de texto también se resume en la sección de discusión.
Descripción
La medición de la similitud de texto es la base de las tareas de procesamiento del lenguaje natural, que juegan un papel importante en la recuperación de información, la respuesta automática a preguntas, la traducción automática, los sistemas de diálogo y la coincidencia de documentos. Este artículo examina sistemáticamente el estado de la investigación sobre la medición de similitud, analiza las ventajas y desventajas de los métodos actuales, desarrolla un sistema de descripción de clasificación más completo de los algoritmos de medición de similitud de texto y resume la dirección de desarrollo futuro. Con el objetivo de proporcionar una referencia para la investigación y aplicación relacionadas, el método de medición de similitud de texto se describe desde dos aspectos: la distancia de texto y la representación de texto. La distancia de texto se puede dividir en distancia de longitud, distancia de distribución y distancia semántica; la representación de texto se divide en basada en cadenas, basada en corpus, texto de semántica única, texto de múltiples semánticas y representación basada en estructuras gráficas. Finalmente, el desarrollo de la similitud de texto también se resume en la sección de discusión.