端到端

第2章 端到端的机器学习项目

喜你入骨 提交于 2019-11-27 02:56:07
第2章 端到端的机器学习项目 写在前面 参考书 《机器学习实战——基于Scikit-Learn和TensorFlow》 工具 python3.5.1,Jupyter Notebook, Pycharm 回归问题的性能指标 均方根误差(RMSE):$\sqrt {\frac{1}{m} \sum\limits_{i=1}^m ( h(x^{(i)}) - y^{(i)} ) ^2}$,对应$l_2$范数。 平均绝对误差(MAE):$\frac{1}{m} \sum\limits_{i=1}^m | h( x^{(i)} ) - y^{(i)} |$,对应$l_1$范数。 范数指数越高,则越关注大的价值,忽略小的价值。这就是为什么RMSE比MAE对异常值更敏感。但是当异常值非常稀少(例如钟形曲线)时,RMSE的表现优异,通常作为首选。 df.where详解 参考连接: https://blog.csdn.net/brucewong0516/article/details/80226990 返回一个同样shape的df,当满足条件为TRUE时,从本身返回结果,否则从返回其他df的结果 df.mask使用时,结果与where相反 分层抽样详解 sklearn.model_selection.StratifiedShuffleSplit 参考链接: https://blog.csdn.net

论文阅读笔记:FOOLING END-TO-END SPEAKER VERIFICATION WITH ADVERSARIAL EXAMPLES

人走茶凉 提交于 2019-11-26 17:15:11
论文地址: https://arxiv.org/pdf/1801.03339.pdf (用对抗样本欺骗端到端的说话人验证) ICASSP2018 问题 :使用 深度端到端网络 训练的 说话人验证系统 易受 对抗样本 的攻击。 本文 :提出了一个白盒攻击,针对于在YOHO或NTIMIT数据集上训练的深度端到端网络。两个黑盒攻击,第一个是用NTIMIT训练的系统生成对抗样本,用于攻击用YOHU训练的系统;第二个是使用Mel频谱特征训练的系统生成对抗样本,用于攻击使用MFCCs训练系统;è从而证明,即使使用不同的特征不同的系统生成的对抗样本也能显著降低系统的准确率。 说话人验证系统的实现流程: 输入一个未知话语 ,一组说话人k所产生的n个注册话语 ,输出为一个介于0~1之间的实数,评估未知话语 是否属于说话人 所产生的概率。 端到端的深度神经网络模型 :“ End-to-end text-dependent speaker verification ”基于这篇的端到端的依赖文本的说话人验证系统: 从上图看出,未知utterance和n个Enrollment 分别得到D维嵌入向量,其中n个Enrollment对应的嵌入向量做均值 通过余弦相似函数计算未知话语向量和均值向量之间的相似性 对其乘以一个标量再加一偏置,得到概率评估。 生成对抗样本 : ​​​​​​​ 解决的优化问题: 用

飞桨端到端开发套件揭秘:低成本开发的四大秘密武器

心不动则不痛 提交于 2019-11-26 10:35:58
11 月 5 日,在 Wave Summit+2019 深度学习开发者峰会上,飞桨全新发布和重要升级了最新的 21 项进展,在深度学习开发者社区引起了巨大的反响。 很多未到场的开发者觉得遗憾,希望可以了解飞桨发布会背后的更多技术细节,因此我们特别策划了一个系列稿件,分别从核心框架、基础模型库、端到端开发套件、工具组件和服务平台五个层面分别详细解读飞桨的核心技术与最新进展,敬请关注。 今天给大家带来的是系列文章之飞桨的端到端开发套件解读。 飞桨全新发布包含语义理解(ERNIE),目标检测(PaddleDetection),图像分割(PaddleSeg)和点击率预估(ElasticCTR)四大端到端开发套件,旨在通过模块化的设计和端到端的体验,满足企业低成本开发和快速集成需求。核心内容3503字,预计阅读时间4分钟。 1. 端到端开发套件的初心 飞桨发布端到端开发套件的初心,是为了更好满足开发者的低开发成本、快速集成需求而来的。开发者的时间、人力非常宝贵,效率提升非常重要。为了要解放开发者劳动力,降低开发的成本,同时能够快速的集成和部署,飞桨推出了端到端开发套件。 端到端开发套件具有以下三个通用特点:一是满足真正的工业场景中性能要求,保持性能领先;二是开发简单易用,高效解决问题;三是打通端到端流程,落地高效易部署。 对于端到端体验的流程中,数据处理也是非常重要的环节