
步骤:
程序:
看看效果:
将预测值,与target进行对比,画图
我们来看下的线性回归是一条怎样的线(下图红色线):

模型评价:
从肉眼上看,这条线性回归效果似乎并不太理想,我们用数据说话,计算下该模型的评分如何。我们一般用以下指标来衡量模型的好坏:R2(决定系数)、RMSE(均方根误差)、cv(K折交叉验证系数)。
得分:
线性预测:
R2分数越高,说明模型的准确率越高,低于50%的准确率,模型确实不太理想啊。但既然做出来了,我们用该模型预测下房价。
效果:
图:

总结:
y = 1.94438675017008 * x + (-30.230797817428652)
3.岭回归
线性回归呈现了房价与房屋面积的关系,但实际上,房价的影响因素可不止面积,还有卫生间数量和卧室数量,当然还有其他一些特征。我们本次用这3个特征进行岭回归预测。岭回归的公式:

程序:
效果:
该模型计算得到的评分稍微要高一些:
上面可以看到是0.5
图:

总结:
h = coef[0] * float(var1) + coef[1] * float(var2) + coef[2] * float(var3) + intercept
4.Lasso回归
1)Lasso回归的公式:

2)岭回归与Lasso回归的公式是相同的,Lasso回归与岭回归的区别在于:
Many small/medium sized effects: 使用(Ridge)岭回归
Only a few variables with medium/large effect: 使用Lasso回归
3)岭回归也称为L2 正则化,Lasso回归也称为L1正则化
岭回归与Lasso回归最大的区别在于岭回归引入的是L2范数惩罚项,Lasso回归引入的是L1范数惩罚项,Lasso回归能够使得损失函数中的许多θ均变成0,这点要优于岭回归,因为岭回归是要所有的θ均存在的,这样计算量Lasso回归将远远小于岭回归。

程序:
效果:
5.多项式回归
多项式回归的公式:

后面继续挑战下,即使效果不好。
https://blog.csdn.net/weixin_42341655/article/details/120299008?spm=1001.2014.3001.5501
https://blog.csdn.net/weixin_42341655/article/details/120340827