逻辑回归

匿名 (未验证) 提交于 2019-12-02 23:34:01

多元线性回归(Ridge、Lasso、ElasticNet)是做回归预测的

逻辑回归(Logistic Regression)

是做分类任务的

Q:做回归预测损失函数是什么?
A:平方均值损失函数MSE

Q:做分类损失函数是什么?
A:做分类损失函数是交叉熵!

Q:什么是熵?
A:熵是一种测量分子不稳定性的指标,分子运动越不稳定,熵就越大,来自热力学
熵是一种测量信息量的单位,信息熵,包含的信息越多,熵就越大,来自信息论,香农
熵是一种测量不确定性的单位,不确定性越大,概率越小,熵就越大!

Q:熵和概率是什么一个关系?
A:随着概率的减小,熵会增大

逻辑回归

Q:为什么本质是多元线性回归?
A:1,公式,首先应用了多元线性回归的公式,其次才是把多元线性回归的结果,交给sigmoid函数去进行缩放
2,导函数,逻辑回归的损失函数推导的导函数,整个形式上和多元线性回归基本一致,
只是y_hat求解公式包含了一个sigmoid过程而已

Q:逻辑回归的损失函数是什么?
A:交叉熵,做分类就用交叉熵,-ylogP,因为逻辑回归是二分类,所以
loss func = (-y
logP + -(1-y)*log(1-P)),也就是说我们期望这个损失最小然后找到最优解
事实上,我们就可以利用前面学过的梯度下降法来求解最优解了

Q:逻辑回归为什么阈值是0.5?
A:因为线性回归区间是负无穷到正无穷的,所以区间可以按照0来分成两部分,所以带到sigmoid公式里面去
z=0的话,y就等于0.5

Q:逻辑回归做多分类?
A:逻辑回归做多分类,把多分类的问题,转化成多个二分类的问题,如果假如要分三个类别,就需要同时
训练三个互相不影响的模型,比如我们n个维度,那么三分类,w参数的个数就会是(n+1)*3个参数
上面所谓的互不影响,指的是模型在梯度下降的时候,分别去训练,分别去下降,三个模型互相不需要
传递数据,也不需要等待收敛

Q:文字本身是几维的数据?音乐本身是几维的数据?图片本身是几维的数据?视频本身是几维的数据?
A:看什么类型的数据,文字一维的,音乐是单声道的音乐,音乐是一维的数据,如果音乐是双声道的,
就是二维的数据,图片如果看成是张图片,就是个平面二维的数据,视频一张张图片按时间顺序码放的,
那就是三维的数据
但我们做机器学习的时候,真的只会这样考虑吗?
文章是由不同的词组成的,词的种类越多,事实上考虑的维度就越多
图片如果是彩色的图片,图片可以有R、G、B、alpha
音乐可以有不同的频率,每个频率如果看成是一个维度,那么就可以N多个维度
图片也可以有不同的频率,每个频率如果看成是一个维度,那么就可以N多个维度

文章来源: https://blog.csdn.net/weixin_43442290/article/details/90442863
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!