Comparación de los métodos K-Means y de agrupamiento jerárquico para los datos de producción de leche de búfala
Autores: Trapanese, Lucia; Bifulco, Giovanna; Santinello, Matteo; Pasquino, Nicola; Campanile, Giuseppe; Salzano, Angela
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Comparación de los métodos K-Means y de agrupamiento jerárquico para los datos de producción de leche de búfala
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Zootecnia
Palabras clave
Estudio
K-means
Agrupamiento jerárquico
Manadas de búfalos
Agrupaciones basadas en datos
Gestión general de manadas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 7
Citaciones: Sin citaciones
Este estudio investigó el uso de K-means y agrupamiento jerárquico para agrupar búfalos mediterráneos italianos utilizando registros de pruebas recolectados rutinariamente. El análisis se realizó primero en un conjunto de datos combinado que comprendía tres rebaños de búfalos y posteriormente en cada rebaño de forma individual. El objetivo principal era determinar si se podían implementar agrupaciones basadas en datos para apoyar mejoras en las estrategias generales de manejo del rebaño. Los resultados indicaron que K-means superó consistentemente al agrupamiento jerárquico en todos los conjuntos de datos, como lo reflejan los puntajes promedio de silueta (0.17-0.18 frente a 0.10-0.12 para K-means y jerárquico, respectivamente), el favorable Índice de Davies-Bouldin (DBI; 2.05-2.16 frente a 2.11-2.5 para K-means y jerárquico, respectivamente) y los valores del Índice de Calinski-Harabasz (CHI; 1034-3877 frente a 729-2109 para K-means y jerárquico, respectivamente). K-means identificó dos clústeres en el conjunto de datos combinado y en dos de los tres rebaños, mientras que se identificaron tres clústeres en el rebaño restante. El análisis de la composición de los clústeres reveló que los días en leche y la producción de leche fueron los principales factores discriminatorios cuando se formaron dos clústeres. Cuando surgieron tres clústeres, K-means también identificó un subgrupo de animales que diferían de los otros tanto en edad como en etapa de lactancia. Estos hallazgos fueron respaldados por el análisis de varianza (ANOVA), que mostró diferencias estadísticamente significativas entre la mayoría de las variables evaluadas.
Descripción
Este estudio investigó el uso de K-means y agrupamiento jerárquico para agrupar búfalos mediterráneos italianos utilizando registros de pruebas recolectados rutinariamente. El análisis se realizó primero en un conjunto de datos combinado que comprendía tres rebaños de búfalos y posteriormente en cada rebaño de forma individual. El objetivo principal era determinar si se podían implementar agrupaciones basadas en datos para apoyar mejoras en las estrategias generales de manejo del rebaño. Los resultados indicaron que K-means superó consistentemente al agrupamiento jerárquico en todos los conjuntos de datos, como lo reflejan los puntajes promedio de silueta (0.17-0.18 frente a 0.10-0.12 para K-means y jerárquico, respectivamente), el favorable Índice de Davies-Bouldin (DBI; 2.05-2.16 frente a 2.11-2.5 para K-means y jerárquico, respectivamente) y los valores del Índice de Calinski-Harabasz (CHI; 1034-3877 frente a 729-2109 para K-means y jerárquico, respectivamente). K-means identificó dos clústeres en el conjunto de datos combinado y en dos de los tres rebaños, mientras que se identificaron tres clústeres en el rebaño restante. El análisis de la composición de los clústeres reveló que los días en leche y la producción de leche fueron los principales factores discriminatorios cuando se formaron dos clústeres. Cuando surgieron tres clústeres, K-means también identificó un subgrupo de animales que diferían de los otros tanto en edad como en etapa de lactancia. Estos hallazgos fueron respaldados por el análisis de varianza (ANOVA), que mostró diferencias estadísticamente significativas entre la mayoría de las variables evaluadas.