Preentrenamiento de Redes Neuronales Convolucionales para la Clasificación de Imágenes de Secciones Delgadas Petrográficas de Lodo
Autores: Pires de Lima, Rafael; Duarte, David
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Preentrenamiento de Redes Neuronales Convolucionales para la Clasificación de Imágenes de Secciones Delgadas Petrográficas de Lodo
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Ciencias de la Tierra y Geología
Palabras clave
Redes neuronales convolucionales
Aprendizaje por transferencia
Conjuntos de datos de visión por computadora
Geociencias
Clasificación de imágenes
ImageNet
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
Las redes neuronales convolucionales (CNN) son actualmente la herramienta más utilizada para la clasificación de imágenes, especialmente si dichas imágenes tienen una gran varianza dentro de los grupos y una pequeña varianza entre grupos. Así, uno de los principales factores que impulsan el desarrollo de modelos de CNN es la creación de grandes conjuntos de datos de visión por computadora etiquetados, algunos de los cuales contienen millones de imágenes. Gracias al aprendizaje por transferencia, una técnica que modifica un modelo entrenado en una tarea primaria para ejecutar una tarea secundaria, la adaptación de modelos de CNN entrenados en conjuntos de datos tan grandes ha ganado rápidamente popularidad en muchos campos de la ciencia, incluidas las geociencias. Sin embargo, el equilibrio entre dos componentes principales de la metodología de aprendizaje por transferencia para imágenes de geociencia aún no está claro: la diferencia entre los conjuntos de datos utilizados en las tareas primaria y secundaria; y la cantidad de datos disponibles para la tarea primaria en sí. Evaluamos el rendimiento de modelos de CNN preentrenados con diferentes tipos de conjuntos de datos de imágenes, específicamente, dermatología, histología y alimentos crudos, que son ajustados a la tarea de clasificación de imágenes de secciones delgadas petrográficas. Los resultados muestran que los modelos de CNN preentrenados en ImageNet logran una mayor precisión debido al mayor número de muestras, así como a una mayor variabilidad en las muestras en ImageNet en comparación con los otros conjuntos de datos evaluados.
Descripción
Las redes neuronales convolucionales (CNN) son actualmente la herramienta más utilizada para la clasificación de imágenes, especialmente si dichas imágenes tienen una gran varianza dentro de los grupos y una pequeña varianza entre grupos. Así, uno de los principales factores que impulsan el desarrollo de modelos de CNN es la creación de grandes conjuntos de datos de visión por computadora etiquetados, algunos de los cuales contienen millones de imágenes. Gracias al aprendizaje por transferencia, una técnica que modifica un modelo entrenado en una tarea primaria para ejecutar una tarea secundaria, la adaptación de modelos de CNN entrenados en conjuntos de datos tan grandes ha ganado rápidamente popularidad en muchos campos de la ciencia, incluidas las geociencias. Sin embargo, el equilibrio entre dos componentes principales de la metodología de aprendizaje por transferencia para imágenes de geociencia aún no está claro: la diferencia entre los conjuntos de datos utilizados en las tareas primaria y secundaria; y la cantidad de datos disponibles para la tarea primaria en sí. Evaluamos el rendimiento de modelos de CNN preentrenados con diferentes tipos de conjuntos de datos de imágenes, específicamente, dermatología, histología y alimentos crudos, que son ajustados a la tarea de clasificación de imágenes de secciones delgadas petrográficas. Los resultados muestran que los modelos de CNN preentrenados en ImageNet logran una mayor precisión debido al mayor número de muestras, así como a una mayor variabilidad en las muestras en ImageNet en comparación con los otros conjuntos de datos evaluados.