Obtener información espacial a partir de información no espacial: inferir información espacial a partir de descripciones textuales mediante espacios conceptuales
Autores: Abbasi, Omid Reza; Alesheikh, Ali Asghar; Razavi-Termeh, Seyed Vahid
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Obtener información espacial a partir de información no espacial: inferir información espacial a partir de descripciones textuales mediante espacios conceptuales
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Redes sociales
Contenido textual
Información espacial
Procesamiento de consultas
Recuperación de información geográfica
Sistemas de recomendación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
Con el rápido crecimiento de las redes sociales, el contenido textual está creciendo cada vez más. Los textos no estructurados son una rica fuente de información espacial latente. Extraer esta información es útil en el procesamiento de consultas, la recuperación de información geográfica (GIR) y los sistemas de recomendación. En este documento, proponemos un enfoque novedoso para inferir información espacial a partir de características destacadas de naturaleza no espacial en corpus de texto. Proponemos dos métodos, denominados DCS y RCS, para representar conceptos basados en lugares. Además, se proponen dos medidas, la entropía de Shannon y el I de Moran, para calcular el grado de geoindicatividad de los términos en los textos. La metodología se compara con un enfoque de Asignación Latente de Dirichlet (LDA) para estimar la mejora de precisión. Evaluamos los métodos en un conjunto de datos de anuncios de alquiler de propiedades en Irán y un conjunto de datos de artículos de Wikipedia en persa. Los resultados muestran que nuestro enfoque propuesto mejora la precisión relativa de las predicciones en aproximadamente un 10% en el caso de los anuncios de alquiler y un 13% en el caso de los artículos de Wikipedia. El error de distancia promedio es de aproximadamente 13.3 km para los anuncios y 10.3 km para los artículos de Wikipedia, lo que hace que el método sea adecuado para inferir la región general de la ciudad en la que se encuentra una propiedad. La metodología propuesta es prometedora para inferir conocimiento espacial a partir de contenido textual que carece de términos espaciales.
Descripción
Con el rápido crecimiento de las redes sociales, el contenido textual está creciendo cada vez más. Los textos no estructurados son una rica fuente de información espacial latente. Extraer esta información es útil en el procesamiento de consultas, la recuperación de información geográfica (GIR) y los sistemas de recomendación. En este documento, proponemos un enfoque novedoso para inferir información espacial a partir de características destacadas de naturaleza no espacial en corpus de texto. Proponemos dos métodos, denominados DCS y RCS, para representar conceptos basados en lugares. Además, se proponen dos medidas, la entropía de Shannon y el I de Moran, para calcular el grado de geoindicatividad de los términos en los textos. La metodología se compara con un enfoque de Asignación Latente de Dirichlet (LDA) para estimar la mejora de precisión. Evaluamos los métodos en un conjunto de datos de anuncios de alquiler de propiedades en Irán y un conjunto de datos de artículos de Wikipedia en persa. Los resultados muestran que nuestro enfoque propuesto mejora la precisión relativa de las predicciones en aproximadamente un 10% en el caso de los anuncios de alquiler y un 13% en el caso de los artículos de Wikipedia. El error de distancia promedio es de aproximadamente 13.3 km para los anuncios y 10.3 km para los artículos de Wikipedia, lo que hace que el método sea adecuado para inferir la región general de la ciudad en la que se encuentra una propiedad. La metodología propuesta es prometedora para inferir conocimiento espacial a partir de contenido textual que carece de términos espaciales.