动手学深度学习——学习笔记(Task1)

杀马特。学长 韩版系。学妹 提交于 2020-02-16 10:06:00
    作为机器学习的一类,深度学习通常基于神经网络型逐级表示越来越抽象的概念或模式。我们先从线性回归和 softmax 回归这两种单层神经网络,简要介绍机器学习中的基本概念。然后,我们由单层神经网络延伸到多层神经网络,并通多层感知机引出深度学习模型。在观察和了解了模型的过拟合现象后,我们将介绍深度学习中对过拟合的常用方法:权重衰减和丢弃法。

线性回归

线性回归输出是一个连续值,因此适用于回归问题。

线性回归模型表示形式

在这里插入图片描述

损失函数

在这里插入图片描述

优化算法

随机梯度下降方法
在这里插入图片描述
在这里插入图片描述

总结

:线性回归基本要素包括模型、训练数据、损失函数和优化算法。

Softmax回归

softmax回归适用于分类问题。

softmax表示形式

在这里插入图片描述

softmax运算原理

在这里插入图片描述
在这里插入图片描述

交叉熵损失函数

在这里插入图片描述

总结

:softmax回归是单层神经⽹络,输出个数等于分类问题中的类别个数;交叉熵适合衡量两个概率分布的差异。

多层感知机

 多层感知机在单层神经网络的基础上引入了1到多个隐藏层(hidden layer)。隐藏层位于输入和输出层之间。

多层感知机表示形式

在这里插入图片描述
数学表达式为
在这里插入图片描述

激活函数

常用激活函数有:
ReLu函数
在这里插入图片描述
在这里插入图片描述
sigmoid函数
在这里插入图片描述
在这里插入图片描述
tanh函数
在这里插入图片描述
在这里插入图片描述

总结:

多层感知机在输出层与输入层之间加上了1个或多个全连接隐藏层,并通过激活函数对隐藏层输出进行变换。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!