Técnicas avanzadas de imagen en 3D para el análisis morfométrico de manzanas detectadas en árboles basadas en tecnología de IA
Autores: Kim, Eungchan; Kim, Sang-Yeon; Lee, Chang-Hyup; Kim, Sungjay; Ryu, Jiwon; Kim, Geon-Hee; Lee, Seul-Ki; Kim, Ghiseok
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Técnicas avanzadas de imagen en 3D para el análisis morfométrico de manzanas detectadas en árboles basadas en tecnología de IA
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Tecnología no destructiva
Predicción del tamaño de las manzanas
Momento de la cosecha
Manzanas cultivadas en campo
Técnicas de aprendizaje profundo
Parámetros morfométricos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Este estudio desarrolló una tecnología no destructiva para predecir el tamaño de las manzanas y determinar el momento óptimo de la cosecha de manzanas cultivadas en el campo. Las imágenes RGBD se recopilaron en entornos de campo con condiciones de luz fluctuantes, y se integraron técnicas de aprendizaje profundo para analizar parámetros morfométricos. Después de entrenar varios modelos, los modelos EfficientDet D4 y Mask R-CNN ResNet101 demostraron la mayor precisión de detección. Las métricas morfométricas se midieron vinculando la información de la caja delimitadora con la información de profundidad 3D para determinar los diámetros horizontal y vertical. Sin oclusión, el error porcentual absoluto medio (MAPE) utilizando métodos basados en cajas delimitadoras fue del 6,201% y del 5,164% para los diámetros horizontal y vertical, respectivamente, mientras que los métodos basados en máscaras lograron una precisión mejorada con un MAPE del 5,667% y del 4,921%. Las predicciones de volumen y peso mostraron un MAPE del 7,183% y del 6,571%, respectivamente. Para manzanas parcialmente ocultas, se aplicó segmentación amodal para analizar parámetros morfométricos según las tasas de oclusión. Mientras que los modelos convencionales mostraban un aumento del MAPE con tasas de oclusión más altas, el modelo basado en segmentación amodal mantuvo una precisión consistente independientemente de la tasa de oclusión, demostrando potencial para sistemas de cosecha automatizados donde las frutas están frecuentemente parcialmente ocultas por hojas y ramas.
Descripción
Este estudio desarrolló una tecnología no destructiva para predecir el tamaño de las manzanas y determinar el momento óptimo de la cosecha de manzanas cultivadas en el campo. Las imágenes RGBD se recopilaron en entornos de campo con condiciones de luz fluctuantes, y se integraron técnicas de aprendizaje profundo para analizar parámetros morfométricos. Después de entrenar varios modelos, los modelos EfficientDet D4 y Mask R-CNN ResNet101 demostraron la mayor precisión de detección. Las métricas morfométricas se midieron vinculando la información de la caja delimitadora con la información de profundidad 3D para determinar los diámetros horizontal y vertical. Sin oclusión, el error porcentual absoluto medio (MAPE) utilizando métodos basados en cajas delimitadoras fue del 6,201% y del 5,164% para los diámetros horizontal y vertical, respectivamente, mientras que los métodos basados en máscaras lograron una precisión mejorada con un MAPE del 5,667% y del 4,921%. Las predicciones de volumen y peso mostraron un MAPE del 7,183% y del 6,571%, respectivamente. Para manzanas parcialmente ocultas, se aplicó segmentación amodal para analizar parámetros morfométricos según las tasas de oclusión. Mientras que los modelos convencionales mostraban un aumento del MAPE con tasas de oclusión más altas, el modelo basado en segmentación amodal mantuvo una precisión consistente independientemente de la tasa de oclusión, demostrando potencial para sistemas de cosecha automatizados donde las frutas están frecuentemente parcialmente ocultas por hojas y ramas.