[学习记录]sklearn线性回归

匿名 (未验证) 提交于 2019-12-03 00:40:02

本文旨在记录colin老师workshop的exercise1讲解,包含入门级的sklearn操作

首先导入库

import numpy as np import pandas as pd import scipy.stas as stats import sklearn

其次导入数据,这里使用的是sklearn中内置的数据集

from sklearn.datasets import load_boston boston=load_boston()

使用pandas整理数据

pandas可以用来求相关性,取值为-1~1之间,-1为负相关,1为正相关,靠近0则是不相关。其中如果相关性低于0.5则应该考虑换一个参考模型。

对照测试集进行检验,检验的时候有三个重要指标,三个指标均越小越好

MAE:mean absolute error,预测时发生的平均偏差,取绝对值

MSE:mean squared error,对预测时产生的偏差进行平方处理,导致错误重度惩罚,正确轻度奖励

RMSE:root mean squared error,相当于对MSE结果开平方根

之前介绍的模型是一个自变量一个因变量,也支持多个自变量,就结果来看该模型不如上一个准确

原文:https://www.cnblogs.com/trickofjoker/p/9305455.html

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!