位置：首页>> 网络编程>> Python编程>> Python人工智能之波士顿房价数据分析

Python人工智能之波士顿房价数据分析

作者：mind_programmonkey　　发布时间：2021-09-23 19:43:35　

标签：Python,波士顿房价,人工智能

1.数据概览分析

1.1 数据概览

本次提供：

train.csv,训练集；
test.csv,测试集；
submission.csv 真实房价文件；

训练集404行数据，14列，每行数据表示房屋以及房屋周围的详细信息，已给出对应的自住房平均房价。要求预测102条测试数据的房价。

1.2 数据分析

通过学习房屋以及房屋周围的详细信息,其中包含城镇犯罪率，一氧化氮浓度，住宅平均房间数，到中心区域的加权距离以及自住房平均房价等等,训练模型,通过某个地区的房屋以及房屋周围的详细信息，预测该地区的自住房平均房价。

回归问题，提交测试集每条数据对应的自住房平均房价。评估指标为均方误差mse。

2. 项目总体思路

2.1 数据读取

数据集：波士顿房间训练集.csv (404条数据)
数据集字段如下:
CRIM：城镇人均犯罪率。
ZN：住宅用地超过 25000 sq.ft. 的比例。
INDUS：城镇非零售商用土地的比例。
CHAS：查理斯河空变量（如果边界是河流，则为1；否则为0）。
NOX：一氧化氮浓度。
RM：住宅平均房间数。
AGE：1940 年之前建成的自用房屋比例。
DIS：到波士顿五个中心区域的加权距离。
RAD：辐射性公路的接近指数。
TAX：每 10000 美元的全值财产税率。
PTRATIO：城镇师生比例。
B：1000（Bk-0.63）^ 2，其中 Bk 指代城镇中黑人的比例。
LSTAT：人口中地位低下者的比例。
MEDV：自住房的平均房价，以千美元计。