Un método basado en aprendizaje automático para la verificación de contenido en el dominio del comercio electrónico
Autores: Alexakis, Theodoros; Peppes, Nikolaos; Demestichas, Konstantinos; Adamopoulou, Evgenia
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un método basado en aprendizaje automático para la verificación de contenido en el dominio del comercio electrónico
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Tema de investigación emergente
Explosión de datos disponibles
Métodos de verificación de contenido
Tiempo de procesamiento
Aprendizaje automático
Enfoque basado en aprendizaje profundo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El análisis de datos a gran escala es un tema de investigación emergente; la explosión de datos disponibles aumenta la necesidad de métodos y herramientas de verificación de contenido adecuados para disminuir el tiempo de análisis y procesamiento de diversas aplicaciones. Los datos personales, por ejemplo, son una fuente de información muy valiosa para varios propósitos de análisis, como marketing, facturación y forense. Sin embargo, la extracción de dichos datos (denominados instancias de personas en este estudio) a menudo se enfrenta a entradas duplicadas o similares sobre personas que no son fácilmente detectables por los usuarios finales. En este contexto, los autores de este estudio presentan un enfoque basado en aprendizaje automático y aprendizaje profundo para mitigar el problema de las instancias de personas duplicadas. El concepto principal de este enfoque es reunir diferentes tipos de información referente a personas, comparar diferentes instancias de personas y predecir si son similares o no. Utilizando el algoritmo Jaro para el cálculo de similitud de atributos de personas y examinando la información disponible para las instancias de personas, se pueden proporcionar recomendaciones a los usuarios sobre la similitud o no entre dos instancias de personas. También se examinó el grado de importancia de cada atributo, con el fin de obtener una mejor comprensión respecto a las características declaradas que juegan un papel más importante.
Descripción
El análisis de datos a gran escala es un tema de investigación emergente; la explosión de datos disponibles aumenta la necesidad de métodos y herramientas de verificación de contenido adecuados para disminuir el tiempo de análisis y procesamiento de diversas aplicaciones. Los datos personales, por ejemplo, son una fuente de información muy valiosa para varios propósitos de análisis, como marketing, facturación y forense. Sin embargo, la extracción de dichos datos (denominados instancias de personas en este estudio) a menudo se enfrenta a entradas duplicadas o similares sobre personas que no son fácilmente detectables por los usuarios finales. En este contexto, los autores de este estudio presentan un enfoque basado en aprendizaje automático y aprendizaje profundo para mitigar el problema de las instancias de personas duplicadas. El concepto principal de este enfoque es reunir diferentes tipos de información referente a personas, comparar diferentes instancias de personas y predecir si son similares o no. Utilizando el algoritmo Jaro para el cálculo de similitud de atributos de personas y examinando la información disponible para las instancias de personas, se pueden proporcionar recomendaciones a los usuarios sobre la similitud o no entre dos instancias de personas. También se examinó el grado de importancia de cada atributo, con el fin de obtener una mejor comprensión respecto a las características declaradas que juegan un papel más importante.