Java教程

多元线性回归算法预测房价

本文主要是介绍多元线性回归算法预测房价,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

文章目录

    • 多元线性回归算法预测房价
    • 一、多元线性回归说明
    • 二、EXCEL进行多元线性回归
    • 三、Sklearn库多元线性回归
    • 四、总结
    • 五、参考资料

多元线性回归算法预测房价

一、多元线性回归说明

在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。因此多元线性回归比一元线性回归的实用意义更大。

二、EXCEL进行多元线性回归

1.可以发现文件里的数据有些为0,现实是不合理的
在这里插入图片描述](https://www.www.zyiz.net/i/ll/?i=850bde56044246ea861a832797a72311.png)![在这里插入图片描述
2.利用唯一标识house_id,删除重复值
在这里插入图片描述
3.缺失值处理,将bedrooms和bathrooms列的缺失行删除
①选中地址列的数据区域即bedrooms所在的列,点击数据——筛选——图中下拉三角形,筛选值为0:
在这里插入图片描述
②选中删除bedrooms值为0的所有行:
在这里插入图片描述
4.按上面同样的删除bathrooms列的缺失值,处理后表里neighbor和style列还有字符值:
在这里插入图片描述
5.可以选择删除字符列或将列值改掉,我们选择改掉:
①选择开始–>查找与替换–>替换:
在这里插入图片描述
6.处理后的表:
在这里插入图片描述

三、Sklearn库多元线性回归

1.导入包

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

2.读取文件

df = pd.read_csv('D:/house_prices.csv')#返回表格的一些基本信息,主要介绍数据集各列的数据类型,是否为空值,内存占用情况
df.info(); df.head()

3.去除第一列house
在这里插入图片描述
4.赋值变量

x_data = new_data.iloc[:, 0:5] #area、bedrooms、bathroom对应列
y_data = new_data.iloc[:, -1] #price对应列
print(x_data, y_data, len(x_data))

5.建立模型并输出结果

# 应用模型
model = linear_model.LinearRegression()
model.fit(x_data, y_data)
print("回归系数:", model.coef_)
print("截距:", model.intercept_)
print('回归方程: price=',model.coef_[0],'*neiborhood+',model.coef_[1],'*area +',model.coef_[2],'*bedrooms +',model.coef_[3],'*bathromms +',model.coef_[4],'*sytle ',model.intercept_)

四、总结

本次实验了解了多元回归模型的相关概念,构建模型的基本步骤。学会了如何用Excel表构建多元回归模型,如何增加删除线性单元。熟悉使用sklearn库调用函数的方法,了解了一些处理数据的基本方法,包括处理缺省值和非数值数据的处理方法等。

五、参考资料

https://blog.csdn.net/qq_47281915/article/details/120928871?spm=1001.2014.3001.5501https://www.cnblogs.com/chouxianyu/p/11704665.html#%E9%A2%98%E7%9B%AE%E8%A6%81%E6%B1%82
https://blog.csdn.net/YangMax1/article/details/120812509

这篇关于多元线性回归算法预测房价的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!