第一讲 深度学习概述
1.1 深度学习的引出
特点:
-
通过 组合低层特征,形成了更加抽象的 高层特征。
-
表达式中的 u,w参数需要在训练中通过 反向传播多次迭代调整,使得整体的 分类误差最小。
-
深度学习网络往往 包含多个中间层(隐藏层),且网络结构要更复杂一些。
1.2 数据集及其拆分
-
Iris(鸢尾花)数据集
-
分类特征:花萼和花瓣的宽度和长度
数据集在数学上通常表示为 $\{(x_1,y_1),(x_2,y_2),...,(x_i,y_i),...,(x_m,y_m)\}$
-
其中 $x_i$ 为样本特征。由于样本(即一行)一般有多个特征,因而 $x_i = \{x_i^1, x_i^2,..., x_i^n\} $
-
而 $y_i$ 表示 样本i 的 类别标签。
类别标签的ground truth 与 gold standard
-
ground truth:翻译为地面实况。机器学习领域一般用于表示 真实值、标准答案 等,表示 通过 直接观察收集到 的真实结果。
-
gold standard:金标准,医学上一般指诊断疾病 公认的最可靠的方法。
-
机器学习领域更倾向于使用ground truth,如果用gold standard则表示可以很好地代表ground truth。
1.21 数据集与有监督学习
有监督学习中数据通常分成 训练集、测试集 两部分。
-
训练集( training set):用来训练模型,即被用来 学习 得到系统的 参数取值。
-
测试集( testing set):用于最终报告模型的评价结果,因此在训练阶段测试集中的样本应该是不可见的。
-
对训练集做进一步划分为 训练集、验证集 validation set。
-
验证集:与测试集类似,也是用于评估模型的性能。
-
区别:是 验证集 主要 用于 模型选择 和 调整超参数,因而一般不用于报告最终结果。
1.22 训练集测试集拆分
1.3 分类及其性能度量
1.4 回归问题及其性能度量
1.5 一致性的评价方法
来源:oschina
链接:https://my.oschina.net/u/4380905/blog/4297343