Selección de acciones relacionadas con colaboración de datos utilizando minería de texto
Autores: Hirano, Masanori; Sakaji, Hiroki; Kimura, Shoko; Izumi, Kiyoshi; Matsushima, Hiroyasu; Nagao, Shintaro; Kato, Atsuo
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Selección de acciones relacionadas con colaboración de datos utilizando minería de texto
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Fondos mutuos temáticos
Esquema
Método de procesamiento de lenguaje natural
Word2vec
Co-ocurrencia
Puntuación F1
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Proponemos un esquema extendido para seleccionar acciones relacionadas para fondos mutuos temáticos. Este esquema fue diseñado para apoyar a los gerentes de fondos que están construyendo fondos mutuos temáticos. En nuestros experimentos preliminares, se encontró que construir un fondo mutuo temático era bastante difícil. Nuestro esquema es un tipo de método de procesamiento de lenguaje natural y se basa en palabras extraídas según su similitud con un tema utilizando word2vec y nuestra única similitud basada en la co-ocurrencia en la información de la empresa. Utilizamos datos que incluyen relaciones con inversores y sitios web oficiales como datos de información de la empresa. También realizamos varios otros experimentos, incluyendo la optimización de hiperparámetros, en nuestro esquema. El esquema logró un 172% más de puntuación F1 y un 21% más de precisión que un método estándar. Nuestra investigación también mostró la posibilidad de que los sitios web oficiales no son necesarios para nuestro esquema, en contraste con nuestros experimentos preliminares para evaluar la colaboración de datos.
Descripción
Proponemos un esquema extendido para seleccionar acciones relacionadas para fondos mutuos temáticos. Este esquema fue diseñado para apoyar a los gerentes de fondos que están construyendo fondos mutuos temáticos. En nuestros experimentos preliminares, se encontró que construir un fondo mutuo temático era bastante difícil. Nuestro esquema es un tipo de método de procesamiento de lenguaje natural y se basa en palabras extraídas según su similitud con un tema utilizando word2vec y nuestra única similitud basada en la co-ocurrencia en la información de la empresa. Utilizamos datos que incluyen relaciones con inversores y sitios web oficiales como datos de información de la empresa. También realizamos varios otros experimentos, incluyendo la optimización de hiperparámetros, en nuestro esquema. El esquema logró un 172% más de puntuación F1 y un 21% más de precisión que un método estándar. Nuestra investigación también mostró la posibilidad de que los sitios web oficiales no son necesarios para nuestro esquema, en contraste con nuestros experimentos preliminares para evaluar la colaboración de datos.