Un método para transformar un problema de optimización no convexo a una forma distribuida
Autores: Khamisov, Oleg O.; Khamisov, Oleg V.; Ganchev, Todor D.; Semenkin, Eugene S.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un método para transformar un problema de optimización no convexo a una forma distribuida
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Método distribuido
Optimización no convexa
Restricciones de igualdad y desigualdad
Descenso de gradiente
Método de Newton
Tasa de convergencia
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Proponemos un método distribuido novedoso para problemas de optimización no convexos con restricciones de igualdad e desigualdad de acoplamiento. Este método transforma el problema de optimización en una forma específica para permitir la implementación distribuida de métodos modificados de descenso de gradiente y de Newton de manera que operen como si fueran distribuidos. Demostramos que para el método distribuido propuesto: (i) las comunicaciones son significativamente menos consumidoras de tiempo que las llamadas al oráculo, (ii) su tasa de convergencia es equivalente a la convergencia del método de Newton en cuanto a llamadas al oráculo, y (iii) para los casos en los que las llamadas al oráculo son más costosas que la comunicación entre agentes, la transición de un paradigma centralizado a uno distribuido no afecta significativamente el tiempo computacional. El método propuesto es aplicable cuando la función objetivo es dos veces diferenciable y las restricciones son diferenciables, lo cual es válido para una amplia gama de métodos de aprendizaje automático y configuraciones de optimización.
Descripción
Proponemos un método distribuido novedoso para problemas de optimización no convexos con restricciones de igualdad e desigualdad de acoplamiento. Este método transforma el problema de optimización en una forma específica para permitir la implementación distribuida de métodos modificados de descenso de gradiente y de Newton de manera que operen como si fueran distribuidos. Demostramos que para el método distribuido propuesto: (i) las comunicaciones son significativamente menos consumidoras de tiempo que las llamadas al oráculo, (ii) su tasa de convergencia es equivalente a la convergencia del método de Newton en cuanto a llamadas al oráculo, y (iii) para los casos en los que las llamadas al oráculo son más costosas que la comunicación entre agentes, la transición de un paradigma centralizado a uno distribuido no afecta significativamente el tiempo computacional. El método propuesto es aplicable cuando la función objetivo es dos veces diferenciable y las restricciones son diferenciables, lo cual es válido para una amplia gama de métodos de aprendizaje automático y configuraciones de optimización.