Prediciendo el tiempo de entrenamiento del modelo para optimizar aplicaciones de aprendizaje automático distribuido

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Prediciendo el tiempo de entrenamiento del modelo para optimizar aplicaciones de aprendizaje automático distribuido

Autores: Guimarães, Miguel; Carneiro, Davide; Palumbo, Guilherme; Oliveira, Filipe; Oliveira, Óscar; Alves, Victor; Novais, Paulo

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Prediciendo el tiempo de entrenamiento del modelo para optimizar aplicaciones de aprendizaje automático distribuido

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Avances

Desafíos

Aprendizaje Automático

Algoritmos de aprendizaje distribuido

Tiempo de entrenamiento

Conjunto

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 34

Citaciones: Sin citaciones

A pesar de los importantes avances de los últimos años, el campo del Aprendizaje Automático continúa enfrentando desafíos de investigación y técnicos. Principalmente, estos provienen de los datos masivos y los datos en continuo, que requieren que los modelos se actualicen o se vuelvan a entrenar con frecuencia, a expensas de importantes recursos computacionales. Una solución es el uso de algoritmos de aprendizaje distribuido, que pueden aprender de manera distribuida, a partir de conjuntos de datos distribuidos. En este documento, describimos CEDEs, un sistema de aprendizaje distribuido en el que los modelos son Ensambles distribuidos heterogéneos, es decir, modelos complejos constituidos por diferentes modelos base, entrenados con diferentes y distribuidos subconjuntos de datos. Específicamente, abordamos el problema de predecir el tiempo de entrenamiento de un modelo dado, dadas sus características y las características de los datos. Dado que la creación de un Ensamble puede implicar el entrenamiento de cientos de modelos base, la información sobre la duración prevista de cada una de estas tareas individuales es fundamental para una gestión eficiente de los recursos computacionales del clúster y para minimizar el makespan, es decir, el tiempo que lleva entrenar todo el Ensamble. Los resultados muestran que el enfoque propuesto es capaz de predecir el tiempo de entrenamiento de Árboles de Decisión con un error promedio de 0.103 s y el tiempo de entrenamiento de Redes Neuronales con un error promedio de 21.263 s. También mostramos cómo los resultados dependen significativamente de los hiperparámetros del modelo y de las características de los datos de entrada.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro