Predicción de precios de vivienda utilizando algoritmos de aprendizaje automático en tiempos de COVID-19
Autores: Mora-Garcia, Raul-Tomas; Cespedes-Lopez, Maria-Francisca; Perez-Sanchez, V. Raul
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Predicción de precios de vivienda utilizando algoritmos de aprendizaje automático en tiempos de COVID-19
Categoría
Ciencias Medioambientales
Subcategoría
Ciencias medioambientales generales
Palabras clave
Algoritmos de aprendizaje automático
Precios de viviendas
Pandemia de COVID-19
Conjuntos de datos georreferenciados
Algoritmos de aprendizaje en conjunto
Mercado inmobiliario.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los algoritmos de aprendizaje automático se están utilizando para múltiples aplicaciones en la vida real y en la investigación. Como consecuencia de la tecnología digital, ahora hay conjuntos de datos grandes, estructurados y georreferenciados más disponibles, lo que facilita el uso de estos algoritmos para analizar e identificar patrones, así como para hacer predicciones que ayuden a los usuarios en la toma de decisiones. Esta investigación tiene como objetivo identificar los mejores algoritmos de aprendizaje automático para predecir los precios de las viviendas y cuantificar el impacto de la pandemia de COVID-19 en los precios de las viviendas en una ciudad española. La metodología aborda las fases de preparación de datos, ingeniería de características, entrenamiento y optimización de hiperparámetros, evaluación y selección de modelos, y finalmente interpretación del modelo. Se utilizan algoritmos de aprendizaje en conjunto basados en boosting (Regresor de Gradient Boosting, Extreme Gradient Boosting y Light Gradient Boosting Machine) y bagging (bosque aleatorio y regresor de árboles extra) y se comparan con un modelo de regresión lineal. Se desarrolla un estudio de caso con microdatos georreferenciados del mercado inmobiliario en Alicante (España), antes y después de la declaración de pandemia derivada de COVID-19, junto con información de otras fuentes complementarias como el catastro, indicadores sociodemográficos y económicos, e imágenes satelitales. Los resultados muestran que los algoritmos de aprendizaje automático tienen un mejor rendimiento que los modelos lineales tradicionales porque están mejor adaptados a las no linealidades de datos complejos como los datos del mercado inmobiliario. Los algoritmos basados en bagging muestran problemas de sobreajuste (bosque aleatorio y regresor de árboles extra) y los basados en boosting tienen un mejor rendimiento y menor sobreajuste. Esta investigación contribuye a la literatura sobre el mercado inmobiliario español al ser uno de los primeros estudios en utilizar aprendizaje automático y microdatos para explorar la incidencia de la pandemia de COVID-19 en los precios de las viviendas.
Descripción
Los algoritmos de aprendizaje automático se están utilizando para múltiples aplicaciones en la vida real y en la investigación. Como consecuencia de la tecnología digital, ahora hay conjuntos de datos grandes, estructurados y georreferenciados más disponibles, lo que facilita el uso de estos algoritmos para analizar e identificar patrones, así como para hacer predicciones que ayuden a los usuarios en la toma de decisiones. Esta investigación tiene como objetivo identificar los mejores algoritmos de aprendizaje automático para predecir los precios de las viviendas y cuantificar el impacto de la pandemia de COVID-19 en los precios de las viviendas en una ciudad española. La metodología aborda las fases de preparación de datos, ingeniería de características, entrenamiento y optimización de hiperparámetros, evaluación y selección de modelos, y finalmente interpretación del modelo. Se utilizan algoritmos de aprendizaje en conjunto basados en boosting (Regresor de Gradient Boosting, Extreme Gradient Boosting y Light Gradient Boosting Machine) y bagging (bosque aleatorio y regresor de árboles extra) y se comparan con un modelo de regresión lineal. Se desarrolla un estudio de caso con microdatos georreferenciados del mercado inmobiliario en Alicante (España), antes y después de la declaración de pandemia derivada de COVID-19, junto con información de otras fuentes complementarias como el catastro, indicadores sociodemográficos y económicos, e imágenes satelitales. Los resultados muestran que los algoritmos de aprendizaje automático tienen un mejor rendimiento que los modelos lineales tradicionales porque están mejor adaptados a las no linealidades de datos complejos como los datos del mercado inmobiliario. Los algoritmos basados en bagging muestran problemas de sobreajuste (bosque aleatorio y regresor de árboles extra) y los basados en boosting tienen un mejor rendimiento y menor sobreajuste. Esta investigación contribuye a la literatura sobre el mercado inmobiliario español al ser uno de los primeros estudios en utilizar aprendizaje automático y microdatos para explorar la incidencia de la pandemia de COVID-19 en los precios de las viviendas.