logo móvil
Contáctanos

Cultivando diversidad de conjunto a través de la inyección dirigida de datos sintéticos: ejemplos de predicción de pérdida de trayectoria

Autores: Sotiroudis, Sotirios P.

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Cultivando diversidad de conjunto a través de la inyección dirigida de datos sintéticos: ejemplos de predicción de pérdida de trayectoria


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Aprendizaje automático
Generación de datos sintéticos
Aprendizaje de conjunto
Inyección dirigida de datos sintéticos
Conjuntos de datos de pérdida de trayecto
Error absoluto mínimo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 22

Citaciones: Sin citaciones


Descripción
Los modelos basados en Aprendizaje Automático (ML) están ganando popularidad de manera constante. Su rendimiento se determina a partir de la cantidad y calidad de los datos utilizados en sus entradas, así como de la competencia y ajuste adecuado del algoritmo de ML utilizado. Sin embargo, recopilar datos reales de alta calidad es un proceso que consume tiempo y es costoso. Por lo tanto, la Generación de Datos Sintéticos (SDG) se emplea para aumentar los datos reales limitados. Además, el Aprendizaje en Conjunto (EL) proporciona el marco para combinar de manera óptima un conjunto de algoritmos de ML independientes (aprendices base), aprovechando sus fortalezas individuales. La diversidad de los aprendices base es esencial para construir un conjunto sólido. El método propuesto de Inyección Dirigida de Datos Sintéticos (TIoSD) combina los conceptos de EL y SDG para diversificar aún más las predicciones de los aprendices base, dando lugar a un modelo de conjunto aún más sólido. Hemos aplicado TIoSD en dos conjuntos de datos de Pérdida de Ruta (PL) diferentes, utilizando dos métodos de SDG bien establecidos (llamados SMOGN y CTGAN). Mientras que el modelo de conjunto convencional alcanzó un valor de Error Absoluto Mínimo (MAE) de 3.25 dB, el conjunto desencadenado por TIoSD proporcionó un valor de MAE de 3.16 dB. Por lo tanto, se concluye que la inyección de datos sintéticos dirigida, debido a sus características de desencadenar diversidad, mejora el rendimiento del conjunto. Además, se ha investigado la proporción entre datos sintéticos y reales. Los resultados mostraron que una proporción de 0.1 es óptima.

Otros recursos que podrían interesarte

Temas Virtualpro