Albumentations: Aceleraciones de Imagen Rápidas y Flexibles
Autores: Buslaev, Alexander; Iglovikov, Vladimir I.; Khvedchenya, Eugene; Parinov, Alex; Druzhinin, Mikhail; Kalinin, Alexandr A.
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Albumentations: Aceleraciones de Imagen Rápidas y Flexibles
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aumento de datos
Aumentaciones de imágenes
Modelos de aprendizaje profundo
Albumentations
Transformaciones de imágenes
Visión por computadora
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La augmentación de datos es una técnica comúnmente utilizada para aumentar tanto el tamaño como la diversidad de conjuntos de entrenamiento etiquetados aprovechando transformaciones de entrada que preservan las etiquetas de salida correspondientes. En visión por computadora, las augmentaciones de imágenes se han convertido en una técnica de regularización implícita común para combatir el sobreajuste en modelos de aprendizaje profundo y se utilizan de manera ubicua para mejorar el rendimiento. Si bien la mayoría de los marcos de aprendizaje profundo implementan transformaciones básicas de imágenes, la lista suele estar limitada a algunas variaciones de volteo, rotación, escalado y recorte. Además, la velocidad de procesamiento de imágenes varía en las bibliotecas de augmentación de imágenes existentes. Presentamos Albumentations, una biblioteca de código abierto rápida y flexible para la augmentación de imágenes con muchas operaciones de transformación de imágenes disponibles que también es un envoltorio fácil de usar alrededor de otras bibliotecas de augmentación. Discutimos los principios de diseño que impulsaron la implementación de Albumentations y damos una visión general de las características clave y capacidades distintas. Finalmente, proporcionamos ejemplos de augmentaciones de imágenes para diferentes tareas de visión por computadora y demostramos que Albumentations es más rápido que otras herramientas de augmentación de imágenes comúnmente utilizadas en la mayoría de las operaciones de transformación de imágenes.
Descripción
La augmentación de datos es una técnica comúnmente utilizada para aumentar tanto el tamaño como la diversidad de conjuntos de entrenamiento etiquetados aprovechando transformaciones de entrada que preservan las etiquetas de salida correspondientes. En visión por computadora, las augmentaciones de imágenes se han convertido en una técnica de regularización implícita común para combatir el sobreajuste en modelos de aprendizaje profundo y se utilizan de manera ubicua para mejorar el rendimiento. Si bien la mayoría de los marcos de aprendizaje profundo implementan transformaciones básicas de imágenes, la lista suele estar limitada a algunas variaciones de volteo, rotación, escalado y recorte. Además, la velocidad de procesamiento de imágenes varía en las bibliotecas de augmentación de imágenes existentes. Presentamos Albumentations, una biblioteca de código abierto rápida y flexible para la augmentación de imágenes con muchas operaciones de transformación de imágenes disponibles que también es un envoltorio fácil de usar alrededor de otras bibliotecas de augmentación. Discutimos los principios de diseño que impulsaron la implementación de Albumentations y damos una visión general de las características clave y capacidades distintas. Finalmente, proporcionamos ejemplos de augmentaciones de imágenes para diferentes tareas de visión por computadora y demostramos que Albumentations es más rápido que otras herramientas de augmentación de imágenes comúnmente utilizadas en la mayoría de las operaciones de transformación de imágenes.