Diseño de patrones para métodos de aprendizaje profundo automatizados con recursos limitados
Autores: Tuggener, Lukas; Amirian, Mohammadreza; Benites, Fernando; von Däniken, Pius; Gupta, Prakhar; Schilling, Frank-Peter; Stadelmann, Thilo
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Diseño de patrones para métodos de aprendizaje profundo automatizados con recursos limitados
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Patrones de diseño
Métodos AutoDL
Recomendaciones de diseño de redes neuronales
Capas anchas completamente conectadas
Búsqueda de arquitectura
Métodos tradicionales de aprendizaje automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
Presentamos una evaluación exhaustiva de una amplia variedad de patrones de diseño prometedores para métodos automatizados de aprendizaje profundo (AutoDL), organizados según las categorías de problemas de los desafíos AutoDL de 2019, que establecen la tarea de optimizar tanto la precisión del modelo como la eficiencia de búsqueda bajo restricciones estrictas de tiempo y computación. Proponemos evaluaciones empíricas estructuradas como la vía más prometedora para obtener principios de diseño para sistemas de aprendizaje profundo debido a la falta de un sólido respaldo teórico. A partir de estas evaluaciones, destilamos patrones relevantes que dan lugar a recomendaciones de diseño de redes neuronales. En particular, establecemos (a) que las capas totalmente conectadas muy anchas aprenden características significativas más rápido; ilustramos (b) cómo la falta de preentrenamiento en el procesamiento de audio puede ser compensada mediante la búsqueda de arquitecturas; mostramos (c) que en el procesamiento de texto, los métodos basados en aprendizaje profundo solo superan a los métodos tradicionales para longitudes de texto cortas con menos de mil caracteres bajo limitaciones estrictas de recursos; y por último presentamos (d) evidencia de que en entornos muy limitados en datos y computación, la optimización de hiperparámetros de métodos de aprendizaje automático más tradicionales supera a los sistemas de aprendizaje profundo.
Descripción
Presentamos una evaluación exhaustiva de una amplia variedad de patrones de diseño prometedores para métodos automatizados de aprendizaje profundo (AutoDL), organizados según las categorías de problemas de los desafíos AutoDL de 2019, que establecen la tarea de optimizar tanto la precisión del modelo como la eficiencia de búsqueda bajo restricciones estrictas de tiempo y computación. Proponemos evaluaciones empíricas estructuradas como la vía más prometedora para obtener principios de diseño para sistemas de aprendizaje profundo debido a la falta de un sólido respaldo teórico. A partir de estas evaluaciones, destilamos patrones relevantes que dan lugar a recomendaciones de diseño de redes neuronales. En particular, establecemos (a) que las capas totalmente conectadas muy anchas aprenden características significativas más rápido; ilustramos (b) cómo la falta de preentrenamiento en el procesamiento de audio puede ser compensada mediante la búsqueda de arquitecturas; mostramos (c) que en el procesamiento de texto, los métodos basados en aprendizaje profundo solo superan a los métodos tradicionales para longitudes de texto cortas con menos de mil caracteres bajo limitaciones estrictas de recursos; y por último presentamos (d) evidencia de que en entornos muy limitados en datos y computación, la optimización de hiperparámetros de métodos de aprendizaje automático más tradicionales supera a los sistemas de aprendizaje profundo.