logo móvil
Contáctanos

Salir o no salir: arquitectura de salida temprana rentable basada en el proceso de decisión de Markov

Autores: Kim, Kyu-Sik; Lee, Hyun-Suk

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Salir o no salir: arquitectura de salida temprana rentable basada en el proceso de decisión de Markov


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Estudios
Mecanismos de salida temprana
Costo computacional
Modelos de aprendizaje profundo
Criterio de salida temprana
Proceso de decisión de Markov

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 24

Citaciones: Sin citaciones


Descripción
Recientemente, han surgido estudios sobre mecanismos de salida temprana para reducir el costo computacional durante el proceso de inferencia de modelos de aprendizaje profundo. Sin embargo, la mayoría de las arquitecturas de salida temprana existentes simplemente determinan la salida temprana basándose únicamente en un nivel de confianza objetivo en la predicción, sin considerar el costo computacional. Este criterio de salida temprana no logra equilibrar la precisión y el costo, lo que dificulta su uso en diversos entornos. Para abordar este problema, proponemos una arquitectura de salida temprana novedosa y rentable en la que se diseña un criterio de salida temprana basado en el proceso de decisión de Markov (MDP). Dado que las decisiones de salida temprana dentro de un modelo de salida temprana son secuenciales, las modelamos como un problema de MDP para maximizar la precisión tanto como sea posible mientras se minimiza el costo computacional. Luego, desarrollamos un algoritmo de salida temprana rentable utilizando aprendizaje por refuerzo que resuelve el problema de MDP. Para cada muestra de entrada, el algoritmo toma decisiones de salida temprana dinámicamente considerando la importancia relativa de la precisión y el costo computacional en un entorno dado, equilibrando así el compromiso entre precisión y costo independientemente del entorno. En consecuencia, puede ser utilizado en diversos entornos, incluso en un entorno con recursos limitados. A través de experimentos extensos, demostramos que nuestra arquitectura propuesta puede equilibrar efectivamente el compromiso en diferentes entornos, mientras que las arquitecturas existentes no pueden hacerlo ya que se enfocan únicamente en reducir su costo evitando la degradación de la precisión.

Otros recursos que podrían interesarte

Temas Virtualpro