Cultivando diversidad de conjunto a través de la inyección dirigida de datos sintéticos: ejemplos de predicción de pérdida de trayectoria
Autores: Sotiroudis, Sotirios P.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Cultivando diversidad de conjunto a través de la inyección dirigida de datos sintéticos: ejemplos de predicción de pérdida de trayectoria
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje automático
Generación de datos sintéticos
Aprendizaje de conjunto
Inyección dirigida de datos sintéticos
Conjuntos de datos de pérdida de trayecto
Error absoluto mínimo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Los modelos basados en Aprendizaje Automático (ML) están ganando popularidad de manera constante. Su rendimiento se determina a partir de la cantidad y calidad de los datos utilizados en sus entradas, así como de la competencia y ajuste adecuado del algoritmo de ML utilizado. Sin embargo, recopilar datos reales de alta calidad es un proceso que consume tiempo y es costoso. Por lo tanto, la Generación de Datos Sintéticos (SDG) se emplea para aumentar los datos reales limitados. Además, el Aprendizaje en Conjunto (EL) proporciona el marco para combinar de manera óptima un conjunto de algoritmos de ML independientes (aprendices base), aprovechando sus fortalezas individuales. La diversidad de los aprendices base es esencial para construir un conjunto sólido. El método propuesto de Inyección Dirigida de Datos Sintéticos (TIoSD) combina los conceptos de EL y SDG para diversificar aún más las predicciones de los aprendices base, dando lugar a un modelo de conjunto aún más sólido. Hemos aplicado TIoSD en dos conjuntos de datos de Pérdida de Ruta (PL) diferentes, utilizando dos métodos de SDG bien establecidos (llamados SMOGN y CTGAN). Mientras que el modelo de conjunto convencional alcanzó un valor de Error Absoluto Mínimo (MAE) de 3.25 dB, el conjunto desencadenado por TIoSD proporcionó un valor de MAE de 3.16 dB. Por lo tanto, se concluye que la inyección de datos sintéticos dirigida, debido a sus características de desencadenar diversidad, mejora el rendimiento del conjunto. Además, se ha investigado la proporción entre datos sintéticos y reales. Los resultados mostraron que una proporción de 0.1 es óptima.
Descripción
Los modelos basados en Aprendizaje Automático (ML) están ganando popularidad de manera constante. Su rendimiento se determina a partir de la cantidad y calidad de los datos utilizados en sus entradas, así como de la competencia y ajuste adecuado del algoritmo de ML utilizado. Sin embargo, recopilar datos reales de alta calidad es un proceso que consume tiempo y es costoso. Por lo tanto, la Generación de Datos Sintéticos (SDG) se emplea para aumentar los datos reales limitados. Además, el Aprendizaje en Conjunto (EL) proporciona el marco para combinar de manera óptima un conjunto de algoritmos de ML independientes (aprendices base), aprovechando sus fortalezas individuales. La diversidad de los aprendices base es esencial para construir un conjunto sólido. El método propuesto de Inyección Dirigida de Datos Sintéticos (TIoSD) combina los conceptos de EL y SDG para diversificar aún más las predicciones de los aprendices base, dando lugar a un modelo de conjunto aún más sólido. Hemos aplicado TIoSD en dos conjuntos de datos de Pérdida de Ruta (PL) diferentes, utilizando dos métodos de SDG bien establecidos (llamados SMOGN y CTGAN). Mientras que el modelo de conjunto convencional alcanzó un valor de Error Absoluto Mínimo (MAE) de 3.25 dB, el conjunto desencadenado por TIoSD proporcionó un valor de MAE de 3.16 dB. Por lo tanto, se concluye que la inyección de datos sintéticos dirigida, debido a sus características de desencadenar diversidad, mejora el rendimiento del conjunto. Además, se ha investigado la proporción entre datos sintéticos y reales. Los resultados mostraron que una proporción de 0.1 es óptima.