从线性回归到广义线性回归知识系统总结
0 引言 在机器学习、数据挖掘中线性回归、Logistic回归(一种非线性回归)是比较基础而且常用回归与分类算法,比如结合L-BFGS优化算法在工业级的大规模推荐系统中被比较多地应用。 如果只了解这两个算法,那就陷入了只见树木不见森林的圈子。本文企图用一篇博客的篇幅让大家系统了解这一块儿的知识。 1 线性回归 1.1问题 给定训练数据集 T = { ( x i , y i ) ∣ x i ∈ R n , y i ∈ R , i ∈ { 1 , 2 , . . , N } } T=\{(x_i,y_i)|x_i \in R^n, y_i \in R,i\in\{1,2,..,N\}\} T = { ( x i , y i ) ∣ x i ∈ R n , y i ∈ R , i ∈ { 1 , 2 , . . , N } } 注意, x i x_i x i 是有n维特征的数据 ( x i 1 , x i 2 , . . . , x i n ) (x_{i1},x_{i2},...,x_{in}) ( x i 1 , x i 2 , . . . , x i n ) , ( x i , y i ) (x_i,y_i) ( x i , y i ) 构成一条数据记录, y i ∈ R y_i \in R y i ∈ R 。 要求构建合适的模型