El rendimiento de la evolución del tema basado en una medida de maximización de características para el dominio de la lingüística
Autores: Feng, Junchao; Miao, Jianjun; Tang, Yue; Li, Yuechen; Feng, Jundong
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
El rendimiento de la evolución del tema basado en una medida de maximización de características para el dominio de la lingüística
Categoría
Matemáticas
Subcategoría
Análisis matemático
Palabras clave
Enfoque de minería de datos
Evolución de temas
Dominio científico
Lingüística
Selección de características
Modelo de agrupamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Comprender el rendimiento del enfoque de minería de datos y la evolución de temas en un cierto dominio científico es fundamental para capturar los principales desarrollos del dominio y facilitar la transferencia de conocimientos dentro y entre dominios. Nuestra investigación selecciona la lingüística como un dominio exploratorio y explota la medida de maximización de características (FM) para la selección de características, combinada con la relación de contraste para realizar el análisis diacrónico de los temas del dominio de la lingüística. Para extraer con precisión los temas del dominio de la lingüística y obtener la selección del modelo de clustering óptimo, explotamos un método integrado asociado con el algoritmo de clustering basado en incrustaciones profundas (DEC) basado en la Matriz de Representación de Texto basada en palabras clave (KTRM) e índice de Lamirel y probamos el rendimiento de este método. Los resultados muestran que la medida de FM es aplicable en el dominio de la lingüística para la minería de temas, y el método combinado tiene la ventaja de un modelo de optimización de clustering imparcial y se aplica al diseño de clustering no paramétrico y algoritmos desde la baja dimensión hasta la alta dimensión de conjuntos de datos. Los hallazgos sugieren que este enfoque podría ser adecuado para un análisis diacrónico de la evolución de temas y facilitar el rendimiento de la detección de temas. Además, estos hallazgos de detección de texto pueden dar lugar a la fusión de conocimientos con el factor del lenguaje como un objetivo de investigación disponible en la investigación interdisciplinaria.
Descripción
Comprender el rendimiento del enfoque de minería de datos y la evolución de temas en un cierto dominio científico es fundamental para capturar los principales desarrollos del dominio y facilitar la transferencia de conocimientos dentro y entre dominios. Nuestra investigación selecciona la lingüística como un dominio exploratorio y explota la medida de maximización de características (FM) para la selección de características, combinada con la relación de contraste para realizar el análisis diacrónico de los temas del dominio de la lingüística. Para extraer con precisión los temas del dominio de la lingüística y obtener la selección del modelo de clustering óptimo, explotamos un método integrado asociado con el algoritmo de clustering basado en incrustaciones profundas (DEC) basado en la Matriz de Representación de Texto basada en palabras clave (KTRM) e índice de Lamirel y probamos el rendimiento de este método. Los resultados muestran que la medida de FM es aplicable en el dominio de la lingüística para la minería de temas, y el método combinado tiene la ventaja de un modelo de optimización de clustering imparcial y se aplica al diseño de clustering no paramétrico y algoritmos desde la baja dimensión hasta la alta dimensión de conjuntos de datos. Los hallazgos sugieren que este enfoque podría ser adecuado para un análisis diacrónico de la evolución de temas y facilitar el rendimiento de la detección de temas. Además, estos hallazgos de detección de texto pueden dar lugar a la fusión de conocimientos con el factor del lenguaje como un objetivo de investigación disponible en la investigación interdisciplinaria.