运用公开住宅出租挂牌数据进行住宅租金预测

主宰稳场 提交于 2020-01-16 03:29:56

租金预测案例学习:

数据来源:
上海在租房源信息

时间节点:2019年7月17日

数据集包括在线租房源信息及其基本情况

属性信息:楼盘名称;租赁方式;面积;朝向;房租;城市;区域;街道或片区;地址;公交站等

学习目标:
1)探索查看真实房源数据,找一找数据存在哪些问题?
要求:

① 读取一个真实房源的数据表

② 查看已有的数据存在哪些问题,确认数据应该如何清洗

2)针对数据存在的问题,应该采取怎么样的数据清洗策略?
要求:

① 根据上一节发现的数据问题,编写数据清洗函数,并测试清洗函数

② 使用数据清洗函数对所有真实房源数据表进行处理并合并

③ 输出清洗合并后的数据表

3)如何根据房源地理位置信息关联更多空间特征来提高租金模型的泛化能力?
要求:

① 利用已有的数据获取有效的样本地址信息

② 根据地址信息关联更多的空间特征

③ 输出关联了地理特征的完整模型数据表

4)如何进行模型数据预处理?
要求:

① 以平米租金(单位:元/月/每平米)为应变量

② 处理模型数据中存在的缺失值、异常值问题

③ 输出最终的建模数据表

5)选取不同的模型进行模型训练并对比模型效果、优化模型效果,确定最终预测模型
要求:

① 使用留一法进行数据集划分,验证集比例:30%

② 训练至少两个不同类型的模型进行租金模型训练,并对比模型效果

③ 优化模型效果,确定最佳模型,并保存模型文件

建议工作流程:
1. 数据探索
2. 数据清洗
3. 特征补充
4. 数据预处理
5. 训练并优化模型

6. 模型保存

原始数据链接: https://pan.baidu.com/s/1bgakkH6Gq6sq2Ahuyirjqg
代码链接: 租金预测.ipynb
脑图链接: 建模工作流程 租金预测案例.png

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!