Прогнозування вартості нерухомості з використанням засобів машинного навчання

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Національний університет «Львівська політехніка»

Abstract

Коректна оцінка вартості нерухомості відіграє вирішальну роль у купівлі та продажу. Вартість визначається різними факторами, такими як розташування, площа кухні та кімнат, стан, рік забудови, зручності, інфраструктура поблизу, тренди розвитку району, ринкові тенденції, та багатьма іншими. Розроблена модель допоможе продавцям отримати оцінку їхньої нерухомості за внесеними параметрами, що може слугувати відправною точкою для встановлення кінцевої вартості. Обчислення вартості нерухомості історично ґрунтувалось переважно на методі аналізу даних вручну та суб’єктивних оцінках, що часто призводило до помилок і затримок. Застосування алгоритмів машинного навчання для вирішення цієї проблеми виявилось ефективний, оскільки має низку переваг над методом оцінки вручну, а саме: високий рівень точності, запобігання суб’єктивності та упередженості в оцінках, ефективність у часі, зниження витрат, використання геопросторових даних і обґрунтування результатів. Процес створення моделі машинного навчання умовно розділено на чотири етапи, які містять збирання даних, їх фільтрування, оброблення, доповнення, розподіл на різні вибірки та тренування моделі на основі цих даних. Прийнято рішення використати одразу декілька алгоритмів регресії для побудови моделей машинного навчання, щоб порівняти результати та вибрати алгоритм, який найкраще підходить для вирішення поставленого завдання. Розглянуто найпопулярніші алгоритми регресії, коротко описано принцип їх роботи, а також метрики, за допомогою яких можна оцінити якість прогнозованих значень моделей. Для тестування алгоритмів лінійної регресії, дерева прийняття рішень, методу найближчого сусіда, методу опорних векторів і “випадкового лісу” застосовано стандартні параметри. Вибрано коефіцієнт детермінації R-квадрат як основну метрику. Порівняння коефіцієнтів детермінації отриманих результатів показало, що найкращий результат в алгоритму “випадковий ліс”. Підібравши вручну гіперпараметри для цього алгоритму, досягнуто середнього значення абсолютної похибки прогнозованого значення, що становить 8,49 %, а медіани 1,9 %. Побудована модель відповідає встановленим вимогам якості та готова до реалізації у інформаційній системі прогнозування вартості нерухомості. Correct valuation of real estate plays a crucial role in the process of buying and selling. We have carefully studied the existing applications with which we carry out real estate transactions, described their features, advantages and disadvantages. The developed model will help sellers get an estimate of their property according to the parameters entered, which can serve as a starting point for establishing the final value. The computation of real estate values has historically been based primarily on the method of analyzing data manually and subjective estimates, often resulting in errors and delays. The use of machine learning algorithms in solving this problem turned out to be effective, since it has a number of advantages over the manual estimation method, namely: a high level of accuracy, elimination of subjectivity and bias in estimates, time efficiency, cost reduction, use of geospatial data and substantiation of results. The process of creating a machine learning model is conditionally decomposed into four stages, which include collecting data, filtering, processing, supplementing, dividing into different samples and training the model based on this data. We considered the most popular regression algorithms, briefly described the principle of their work, as well as metrics with which you can evaluate the quality of the predicted values of the models. Standard parameters were used to test linear regression algorithms, decision tree, nearest neighbor method, support vector method, and random forest. The determination coefficient R-square is chosen as the main metric. Comparing the coefficient of determination of the results, it became clear that the algorithm “random forest” showed the best result. Having manually selected hyper parameters for this algorithm, the average value of the absolute error of the predicted value is 8.49 %, and the median is 1.9 %. The constructed model meets the established quality requirements and is ready for implementation in the information system of forecasting the value of real estate. For buyers, this service will be relevant, since they will be able to search for real estate according to the parameters entered by them, which have a favorable price for the purchase.

Description

Citation

Верес О. Прогнозування вартості нерухомості з використанням засобів машинного навчання / Олег Верес Андрій Шимоняк // Вісник Національного університету “Львівська політехніка”. Серія: Інформаційні системи та мережі. — Львів : Видавництво Львівської політехніки, 2024. — № 15. — С. 140–158.

Endorsement

Review

Supplemented By

Referenced By