Proyek ini bertujuan untuk membangun model untuk memprediksi harga rumah. dalam proyek ini akan digunakan beberapa model diantaranya adalah Regresi Linear, Multiple Regression, K-Nearest Neighbors, dan Random Forest. Setelah dilakukan uji semua model, pada akhirnya akan dilakukan uji komparasi untuk membandingkan semuamodel dan memilih model terbaik berdasarkan beberapa metrics. Metrics yang akan digunakan adalah Root Mean Squared Error (RMSE), R-Squared, Adjusted R-Squared, dan Cross Validation.
Data yang digunakan adalah data House Sales in King County yang diambil dari Kaggle
Hasil yang didapatkan adalah bahwa model Random Forest menggunakan data tanpa preprocessing, memiliki performa yang paling baik dibandingkan dengan model lainnya.