MLOps Verde a GenOps Verde: Un Estudio Empírico del Consumo de Energía en Operaciones de IA Discriminativa y Generativa
Autores: Sánchez-Mompó, Adrián; Mavromatis, Ioannis; Li, Peizheng; Katsaros, Konstantinos; Khan, Aftab
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
MLOps Verde a GenOps Verde: Un Estudio Empírico del Consumo de Energía en Operaciones de IA Discriminativa y Generativa
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Estudio
Consumo de energía
Modelos discriminativos
IA generativa
Modelos de lenguaje grandes
Rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este estudio presenta una investigación empírica sobre el consumo de energía de modelos de IA discriminativos y generativos dentro de pipelines de MLOps del mundo real. Para los modelos discriminativos, examinamos varias arquitecturas y hiperparámetros durante el entrenamiento y la inferencia, e identificamos prácticas energéticamente eficientes. Para la IA generativa, se evalúan grandes modelos de lenguaje (LLMs), con un enfoque principalmente en el consumo de energía a través de diferentes tamaños de modelo y solicitudes de servicio variadas. Nuestro estudio emplea mediciones de potencia basadas en software, asegurando facilidad de replicación a través de diversas configuraciones, modelos y conjuntos de datos. Analizamos múltiples modelos y configuraciones de hardware para descubrir correlaciones entre varias métricas, identificando los principales contribuyentes al consumo de energía. Los resultados indican que, para los modelos discriminativos, optimizar arquitecturas, hiperparámetros y hardware puede reducir significativamente el consumo de energía sin sacrificar el rendimiento. Para los LLMs, la eficiencia energética depende de equilibrar el tamaño del modelo, la complejidad del razonamiento y la capacidad de manejo de solicitudes, ya que los modelos más grandes no necesariamente consumen más energía cuando la utilización se mantiene baja. Este análisis proporciona pautas prácticas para diseñar operaciones de ML ecológicas y sostenibles, enfatizando la reducción del consumo de energía y la huella de carbono mientras se mantiene el rendimiento. Este documento puede servir como un punto de referencia para estimar con precisión el uso total de energía a través de diferentes tipos de modelos de IA.
Descripción
Este estudio presenta una investigación empírica sobre el consumo de energía de modelos de IA discriminativos y generativos dentro de pipelines de MLOps del mundo real. Para los modelos discriminativos, examinamos varias arquitecturas y hiperparámetros durante el entrenamiento y la inferencia, e identificamos prácticas energéticamente eficientes. Para la IA generativa, se evalúan grandes modelos de lenguaje (LLMs), con un enfoque principalmente en el consumo de energía a través de diferentes tamaños de modelo y solicitudes de servicio variadas. Nuestro estudio emplea mediciones de potencia basadas en software, asegurando facilidad de replicación a través de diversas configuraciones, modelos y conjuntos de datos. Analizamos múltiples modelos y configuraciones de hardware para descubrir correlaciones entre varias métricas, identificando los principales contribuyentes al consumo de energía. Los resultados indican que, para los modelos discriminativos, optimizar arquitecturas, hiperparámetros y hardware puede reducir significativamente el consumo de energía sin sacrificar el rendimiento. Para los LLMs, la eficiencia energética depende de equilibrar el tamaño del modelo, la complejidad del razonamiento y la capacidad de manejo de solicitudes, ya que los modelos más grandes no necesariamente consumen más energía cuando la utilización se mantiene baja. Este análisis proporciona pautas prácticas para diseñar operaciones de ML ecológicas y sostenibles, enfatizando la reducción del consumo de energía y la huella de carbono mientras se mantiene el rendimiento. Este documento puede servir como un punto de referencia para estimar con precisión el uso total de energía a través de diferentes tipos de modelos de IA.