深度学习笔记

牧云@^-^@ 提交于 2020-07-29 11:31:37

第一讲 深度学习概述

1.1 深度学习的引出

特点:

  • 通过 组合低层特征,形成了更加抽象的 高层特征

  • 表达式中的 u,w参数需要在训练中通过 反向传播多次迭代调整,使得整体的 分类误差最小

  • 深度学习网络往往 包含多个中间层(隐藏层),且网络结构要更复杂一些。

 

1.2 数据集及其拆分

  • Iris(鸢尾花)数据集

  • 分类特征:花萼和花瓣的宽度和长度

数据集在数学上通常表示为 $\{(x_1,y_1),(x_2,y_2),...,(x_i,y_i),...,(x_m,y_m)\}​$

  • 其中  $x_i$  为样本特征。由于样本(即一行)一般有多个特征,因而 $x_i = \{x_i^1, x_i^2,..., x_i^n\} ​$

  • 而 $y_i$  表示 样本i类别标签

类别标签的ground truth 与 gold standard

  • ground truth:翻译为地面实况。机器学习领域一般用于表示 真实值、标准答案 等,表示 通过 直接观察收集到 的真实结果。

  • gold standard:金标准,医学上一般指诊断疾病 公认的最可靠的方法

  • 机器学习领域更倾向于使用ground truth,如果用gold standard则表示可以很好地代表ground truth。

 

1.21 数据集与有监督学习

有监督学习中数据通常分成 训练集测试集 两部分。

  • 训练集( training set):用来训练模型,即被用来 学习 得到系统的 参数取值

  • 测试集( testing set):用于最终报告模型的评价结果,因此在训练阶段测试集中的样本应该是不可见的。

  • 训练集做进一步划分为 训练集、验证集 validation set

    • 验证集:与测试集类似,也是用于评估模型的性能。

    • 区别:是 验证集 主要 用于 模型选择 调整超参数,因而一般不用于报告最终结果。

 

1.22 训练集测试集拆分

 

 

 

1.3 分类及其性能度量

 

1.4 回归问题及其性能度量

 

1.5 一致性的评价方法

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!