请到后台主题设置添加
首页 / 房产工具箱资讯

机器学习线性回归——房价预测问题(California housing)

  一个地区的房价与该地区的地理位置、人口数、居民收入等诸多特征有着密切的关系。房价预测问题是要根据给定小区的特征预测该小区房价的中位数,这是一个经典的回归问题。在sklearn工具库中集成了房价预测问题的数据california_housing,可以直接用。california_housing数据集中的每条数据都包含9个变量:人均收入(MedInc)、房龄(HouseAge)、房间数(AveRooms)、卧室数(AveBedrooms)、小区人口数(Population)、房屋居住人数(AveOccup)、小区经度(Longitude)、小区纬度(Latitude)和房价中位数(Median_house_value)。其中,房价中位数是标签,其余的8个变量均为特征。   california_housing数据采样:   序号MedIncHouseAgeAveRoomsAveBedroomsPopulationAveOccupLatitudeLongitudeMedian_house_value14.5625464.81.02187283337.97-122.59275200210.7326118.51.1194764137.30-122.0650000132.3159134.11.043094109133.16-117.209160041.6352465.41.187134739.51-121.565310055.8491366.61.04191163133.79-118.09247300   显然,可以将房价预测问题看作一个线性回归问题,并尝试用线性回归算法求解。建立房价预测的模型。   结果:   从决定系数大于50%来看,模型的拟合效果比较理想。
版权说明:
1.版权归本网站或原作者所有;
2.未经本网或原作者允许不得转载本文内容,否则将视为侵权;
3.转载或者引用本文内容请注明来源及原作者;
4.对于不遵守此声明或者其他违法使用本文内容者,本人依法保留追究权等。
你可能感兴趣的文章
搜索
最新留言
关注我们
关注我们
微信
关注我们
微博
请到后台主题设置添加

Powered ByZ-Blog.