Automatización de la extracción de características de modelos de entidad-relación: evaluación experimental de métodos de aprendizaje automático para el aprendizaje relacional

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Automatización de la extracción de características de modelos de entidad-relación: evaluación experimental de métodos de aprendizaje automático para el aprendizaje relacional

Autores: Stanoev, Boris; Mitrov, Goran; Kulakov, Andrea; Mirceva, Georgina; Lameski, Petre; Zdravevski, Eftim

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Automatización de la extracción de características de modelos de entidad-relación: evaluación experimental de métodos de aprendizaje automático para el aprendizaje relacional

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería de Sistemas

Palabras clave

Crecimiento exponencial

Ideas prácticas

Bases de datos relacionales

Aprendizaje automático

Algoritmo de proposicionalización

Minería de datos multi-relacional

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones

Con el crecimiento exponencial de los datos, extraer información accionable se vuelve intensivo en recursos. En muchas organizaciones, las bases de datos relacionales normalizadas almacenan una parte significativa de estos datos, donde las tablas están interconectadas a través de algunas relaciones. Este documento explora el aprendizaje relacional, que implica unir y fusionar tablas de bases de datos, a menudo normalizadas en tercera forma normal. El procesamiento posterior incluye la extracción de características y su utilización en modelos de aprendizaje automático (ML). En este documento, experimentamos con el algoritmo de proposicionalización (es decir, Wordification) para la ingeniería de características. A continuación, comparamos los algoritmos PropDRM y PropStar, que están diseñados específicamente para la minería de datos multi-relacionales, con algoritmos tradicionales de aprendizaje automático. Basándonos en los experimentos realizados, concluimos que Gradient Boost, en comparación con PropDRM, logra un rendimiento similar (puntuación F1, precisión y AUC) en múltiples conjuntos de datos. PropStar consistentemente tuvo un rendimiento inferior en algunos conjuntos de datos, mientras que fue comparable a los otros algoritmos en otros. En resumen, el algoritmo de proposicionalización para la extracción de características hace posible aplicar algoritmos tradicionales de ML para el aprendizaje relacional directamente. En contraste, los enfoques diseñados específicamente para el aprendizaje relacional todavía enfrentan desafíos en escalabilidad, interpretabilidad y eficiencia. Estos hallazgos tienen un impacto práctico que puede ayudar a acelerar la adopción del aprendizaje automático en contextos empresariales donde los datos se almacenan en formato relacional sin necesidad de extracción de características específicas del dominio.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro