Generalización de redes neuronales en números hipercomplejos de segundo orden
Autores: Pavlov, Stanislav; Kozlov, Dmitry; Bakulin, Mikhail; Zuev, Aleksandr; Latyshev, Andrey; Beliaev, Alexander
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Generalización de redes neuronales en números hipercomplejos de segundo orden
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Redes neuronales
Números complejos
Números hipercomplejos
Números duales
Números dobles
Dominio hipercomplejo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La gran mayoría de las redes neuronales existentes operan siguiendo reglas establecidas dentro del álgebra de los números reales. Sin embargo, a medida que la comprensión teórica de los fundamentos de las redes neuronales y sus aplicaciones prácticas se fortalecen, surgen nuevos problemas que requieren ir más allá de dicho álgebra. Diversas tareas surgen cuando los datos originales tienen formatos en números complejos. Esta situación está animando a los investigadores a explorar si las redes neuronales basadas en números complejos pueden proporcionar beneficios sobre aquellas limitadas a números reales. Múltiples trabajos recientes se han dedicado a desarrollar la arquitectura y los bloques de construcción de las redes neuronales de valores complejos. En este documento, generalizamos los modelos considerando otros tipos de números hipercomplejos de segundo orden: números duales y dobles. Desarrollamos operadores básicos para estas álgebras, como convolución, funciones de activación y normalización por lotes, y reconstruimos varias redes de valores reales para usarlos con estas nuevas álgebras. Desarrollamos una metodología general para cálculos de gradientes de valores duales y dobles basados en derivadas de Wirtinger para funciones de valores complejos. Para problemas de clasificación de visión por computadora clásica (CIFAR-10, CIFAR-100, SVHN) y procesamiento de señales (G2Net, MusicNet), nuestros puntos de referencia muestran que la transición al dominio hipercomplejo puede ser útil para alcanzar valores más altos de métricas, en comparación con los modelos originales de valores reales.
Descripción
La gran mayoría de las redes neuronales existentes operan siguiendo reglas establecidas dentro del álgebra de los números reales. Sin embargo, a medida que la comprensión teórica de los fundamentos de las redes neuronales y sus aplicaciones prácticas se fortalecen, surgen nuevos problemas que requieren ir más allá de dicho álgebra. Diversas tareas surgen cuando los datos originales tienen formatos en números complejos. Esta situación está animando a los investigadores a explorar si las redes neuronales basadas en números complejos pueden proporcionar beneficios sobre aquellas limitadas a números reales. Múltiples trabajos recientes se han dedicado a desarrollar la arquitectura y los bloques de construcción de las redes neuronales de valores complejos. En este documento, generalizamos los modelos considerando otros tipos de números hipercomplejos de segundo orden: números duales y dobles. Desarrollamos operadores básicos para estas álgebras, como convolución, funciones de activación y normalización por lotes, y reconstruimos varias redes de valores reales para usarlos con estas nuevas álgebras. Desarrollamos una metodología general para cálculos de gradientes de valores duales y dobles basados en derivadas de Wirtinger para funciones de valores complejos. Para problemas de clasificación de visión por computadora clásica (CIFAR-10, CIFAR-100, SVHN) y procesamiento de señales (G2Net, MusicNet), nuestros puntos de referencia muestran que la transición al dominio hipercomplejo puede ser útil para alcanzar valores más altos de métricas, en comparación con los modelos originales de valores reales.