Salir o no salir: arquitectura de salida temprana rentable basada en el proceso de decisión de Markov
Autores: Kim, Kyu-Sik; Lee, Hyun-Suk
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Salir o no salir: arquitectura de salida temprana rentable basada en el proceso de decisión de Markov
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Estudios
Mecanismos de salida temprana
Costo computacional
Modelos de aprendizaje profundo
Criterio de salida temprana
Proceso de decisión de Markov
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Recientemente, han surgido estudios sobre mecanismos de salida temprana para reducir el costo computacional durante el proceso de inferencia de modelos de aprendizaje profundo. Sin embargo, la mayoría de las arquitecturas de salida temprana existentes simplemente determinan la salida temprana basándose únicamente en un nivel de confianza objetivo en la predicción, sin considerar el costo computacional. Este criterio de salida temprana no logra equilibrar la precisión y el costo, lo que dificulta su uso en diversos entornos. Para abordar este problema, proponemos una arquitectura de salida temprana novedosa y rentable en la que se diseña un criterio de salida temprana basado en el proceso de decisión de Markov (MDP). Dado que las decisiones de salida temprana dentro de un modelo de salida temprana son secuenciales, las modelamos como un problema de MDP para maximizar la precisión tanto como sea posible mientras se minimiza el costo computacional. Luego, desarrollamos un algoritmo de salida temprana rentable utilizando aprendizaje por refuerzo que resuelve el problema de MDP. Para cada muestra de entrada, el algoritmo toma decisiones de salida temprana dinámicamente considerando la importancia relativa de la precisión y el costo computacional en un entorno dado, equilibrando así el compromiso entre precisión y costo independientemente del entorno. En consecuencia, puede ser utilizado en diversos entornos, incluso en un entorno con recursos limitados. A través de experimentos extensos, demostramos que nuestra arquitectura propuesta puede equilibrar efectivamente el compromiso en diferentes entornos, mientras que las arquitecturas existentes no pueden hacerlo ya que se enfocan únicamente en reducir su costo evitando la degradación de la precisión.
Descripción
Recientemente, han surgido estudios sobre mecanismos de salida temprana para reducir el costo computacional durante el proceso de inferencia de modelos de aprendizaje profundo. Sin embargo, la mayoría de las arquitecturas de salida temprana existentes simplemente determinan la salida temprana basándose únicamente en un nivel de confianza objetivo en la predicción, sin considerar el costo computacional. Este criterio de salida temprana no logra equilibrar la precisión y el costo, lo que dificulta su uso en diversos entornos. Para abordar este problema, proponemos una arquitectura de salida temprana novedosa y rentable en la que se diseña un criterio de salida temprana basado en el proceso de decisión de Markov (MDP). Dado que las decisiones de salida temprana dentro de un modelo de salida temprana son secuenciales, las modelamos como un problema de MDP para maximizar la precisión tanto como sea posible mientras se minimiza el costo computacional. Luego, desarrollamos un algoritmo de salida temprana rentable utilizando aprendizaje por refuerzo que resuelve el problema de MDP. Para cada muestra de entrada, el algoritmo toma decisiones de salida temprana dinámicamente considerando la importancia relativa de la precisión y el costo computacional en un entorno dado, equilibrando así el compromiso entre precisión y costo independientemente del entorno. En consecuencia, puede ser utilizado en diversos entornos, incluso en un entorno con recursos limitados. A través de experimentos extensos, demostramos que nuestra arquitectura propuesta puede equilibrar efectivamente el compromiso en diferentes entornos, mientras que las arquitecturas existentes no pueden hacerlo ya que se enfocan únicamente en reducir su costo evitando la degradación de la precisión.