Imponiendo restricciones duras en forma de estrella en la salida de la red neuronal
Autores: Konstantinov, Andrei; Utkin, Lev; Muliukha, Vladimir
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Imponiendo restricciones duras en forma de estrella en la salida de la red neuronal
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Restricciones
Red neuronal
Región
En forma de estrella
Origen
Método
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
Un problema de imponer restricciones estrictas en la salida de la red neuronal puede encontrarse en muchas aplicaciones. Proponemos un nuevo método para resolver este problema para restricciones no convexas que son de forma estrellada. Una región producida por restricciones se llama de forma estrellada cuando existe un origen en la región desde el cual cada punto es visible. Se consideran dos tareas: generar puntos dentro de la región y en el límite de la región. La idea clave detrás del método es generar un desplazamiento del origen hacia un rayo parametrizado por la capa adicional de la red neuronal. El mayor desplazamiento admisible se determina mediante el algoritmo de marcha de rayos diferenciable. Esto nos permite generar puntos que están garantizados de satisfacer las restricciones. También se estudia una modificación más precisa del algoritmo. El método propuesto puede considerarse como una generalización de los métodos para restricciones convexas. Experimentos numéricos ilustran el método al resolver problemas de aprendizaje automático. El código que implementa el método está disponible públicamente.
Descripción
Un problema de imponer restricciones estrictas en la salida de la red neuronal puede encontrarse en muchas aplicaciones. Proponemos un nuevo método para resolver este problema para restricciones no convexas que son de forma estrellada. Una región producida por restricciones se llama de forma estrellada cuando existe un origen en la región desde el cual cada punto es visible. Se consideran dos tareas: generar puntos dentro de la región y en el límite de la región. La idea clave detrás del método es generar un desplazamiento del origen hacia un rayo parametrizado por la capa adicional de la red neuronal. El mayor desplazamiento admisible se determina mediante el algoritmo de marcha de rayos diferenciable. Esto nos permite generar puntos que están garantizados de satisfacer las restricciones. También se estudia una modificación más precisa del algoritmo. El método propuesto puede considerarse como una generalización de los métodos para restricciones convexas. Experimentos numéricos ilustran el método al resolver problemas de aprendizaje automático. El código que implementa el método está disponible públicamente.