深度学习

深度神经网络(DNN)的正则化

好久不见. 提交于 2020-08-05 07:52:17
    和普通的机器学习算法一样,DNN也会遇到过拟合的问题,需要考虑泛化,这里我们就对DNN的正则化方法做一个总结。 1. DNN的L1&L2正则化     想到正则化,我们首先想到的就是L1正则化和L2正则化。L1正则化和L2正则化原理类似,这里重点讲述DNN的L2正则化。     而DNN的L2正则化通常的做法是只针对与线性系数矩阵$W$,而不针对偏倚系数$b$。利用我们之前的机器学习的知识,我们很容易可以写出DNN的L2正则化的损失函数。     假如我们的每个样本的损失函数是均方差损失函数,则所有的m个样本的损失函数为:$$J(W,b) = \frac{1}{2m}\sum\limits_{i=1}^{m}||a^L-y||_2^2$$     则加上了L2正则化后的损失函数是:$$J(W,b) = \frac{1}{2m}\sum\limits_{i=1}^{m}||a^L-y||_2^2 + \frac{\lambda}{2m}\sum\limits_{l=2}^L||w||_2^2$$     其中,$\lambda$即我们的正则化超参数,实际使用时需要调参。而$w$为所有权重矩阵$W$的所有列向量。     如果使用上式的损失函数,进行反向传播算法时,流程和没有正则化的反向传播算法完全一样,区别仅仅在于进行梯度下降法时,$W$的更新公式。     回想我们在

异常检测算法演变及学习笔记

我们两清 提交于 2020-08-05 07:46:21
【说在前面】本人博客新手一枚,象牙塔的老白,职业场的小白。以下内容仅为个人见解,欢迎批评指正,不喜勿喷![认真看图][认真看图] 【补充说明】异常检测,又称离群点检测,有着广泛应用。例如金融反欺诈、工业损毁检测、电网窃电行为等! 一、基于时间序列分析 关于时间序列分析的介绍,欢迎浏览我的另一篇博客: 时间序列分析中预测类问题下的建模方案 ,这里不再赘述。 1. 基于同比和环比 适合数据呈周期性规律的场景中。例如: 监控APP的DAU的环比和同比,及时发现DAU上涨或者下跌 监控实时广告点击、消耗的环比和同比,及时发现变化 当上述比值超过一定阈值,则判定出现异常。 2. 基于统计学模型预测 移动平均MA是一种分析时间序列的常用工具,它可过滤高频噪声和检测异常点。 根据计算方法的不同,常用的移动平均算法包括简单移动平均、加权移动平均、指数移动平均。 在序列取值随时间波动较小的场景中,上述移动均值与该时刻的真实值的差值超过一定阈值,则判定该时刻的值异常。 当然,还有ARMA、ARIMA、SARIMA等适用于时间序列分析的统计学模型,可以预测信号并指出其中的异常值。 3. 基于时间序列分解 STL是一种单维度时间指标异常检测算法。大致思路是: (1)先将指标做STL时序分解,得到seasonal、trend、residual成分。 (2)用ESD算法对trend

攻克机器学习硕士学位,我的那些年与必备技能!

时光总嘲笑我的痴心妄想 提交于 2020-08-05 07:19:30
编者按: 人工智能发展日趋成熟,也成为众多开发者职业生涯的首选方向。然而相较于其他领域,人工智能中的深度学习、机器学习、计算视觉、神经网络等技术更为错综复杂,进修难度也更胜一筹。对此,对于入门和想要进阶的学生及开发者群体,该如何攻克?在本文中,来自英国萨里大学机器学习与计算机视觉专业硕士Richmond Alake将从自身学业历程出发,分享一下其在读机器学习硕士的收获,以及相关的经验与课程,希望能帮助大家有所收获。 作者 | Richmond Alake,已获作者翻译授权 译者 | 鹿未来 ,责编 | 屠敏 头 图 | CSDN 下载自东方 IC 出品 | CSDN(ID:CSDNnews) 以下为译文: 其实,每所大学的课程不会有太大差异。所以,大家可以从本文了解机器学习和计算机视觉理学硕士的一些内容。除了在学习期间获得的东西之外,我还会分享更多学术知识,以及作为一名计算机视觉工程师职位相关的其他信息。 攻读机器学习硕士需要具备哪些必备技能? 研究生期间都会做一些选题,这些课题主要是反映机器学习领域的未来一些发展方向。而且机器学习的每个课程里都涵盖了很多内容。因此,我在修读MSc(Master of Science)学位需要确保在学习这些课程之前,还需要具备以下前提条件: 理解线性代数和微积分(微分/优化) 了解统计和概率研究 具有编程语言背景 拥有计算机科学、数学

谷歌训练BERT仅23秒,英伟达A100破八项AI性能纪录,最新MLPerf榜单

﹥>﹥吖頭↗ 提交于 2020-08-05 07:08:04
  机器之心报道    编辑:泽南、张倩    在最新的 MLPerf 基准测试结果中,英伟达新出的 A100 GPU 打破了八项 AI 性能纪录,谷歌的 4096 块 TPU V3 将 VERT 的训练时间缩短到了 23 秒。华为昇腾 910 这次也跑了个分。      在距离推出不到一个月的时间里,内置超过 2000 块英伟达 A100 GPU 的全新 DGX SuperPOD 服务器就在各项针对大规模计算性能的 MLPerf 基准测试中取得了优异成绩。   在今天官方发布的 MLPerf 第三批 AI 训练芯片测试结果中,英伟达 A100 Tensor Core GPU 在全部八项基准测试中展现了最快性能。在实现总体最快的大规模解决方案方面,利用 HDR InfiniBand 实现多个 DGX A100 系统互联的服务器集群 DGX SuperPOD 系统也同样创造了业内最优性能。   行业基准测试组织 MLPerf 于 2018 年 5 月由谷歌、百度、英特尔、AMD、哈佛和斯坦福大学共同发起,目前已成为机器学习领域芯片性能的重要参考标准。此次结果已是英伟达在 MLPerf 训练测试中连续第三次展现了最强性能。早在 2018 年 12 月,英伟达就曾在 MLPerf 训练基准测试中创下了六项纪录,次年 7 月英伟达再次创下八项纪录。   最新版的 MLPerf 基准测试包含

豪掷5000亿元,腾讯云AI发力新基建

风格不统一 提交于 2020-08-05 05:18:39
  清晨,深圳福田区梅观路,一起交通事故,挡住了行人去路。该事故的详细信息,立马实时呈现在深圳交警交通指挥中心大屏上:事故位置出现 1 个红点、拥堵路段出现红线。指挥中心据此信息,立即调度附近交警铁骑,几分钟就完成了事故处置。   还是在福田区,一名住户因抑郁症试图自杀,楼道烟感报警器自动报警后,派出所、物业、消防等 “秒级” 出动、并迅速扑灭火情,一场火灾悲剧得以幸免。   深圳市民毕女士,和未婚夫定好日期,打算去领证,临到头四天前,领证必须要带的户口本丢了。但她仅用三天,就收到了补办的新户口本。   这便是深圳公安微信服务号打造的 “政务服务” 平台,简称 “深微平台”。据深圳公安官方数据显示,截至 5 月 13 日,“深微平台” 现有个人注册用户 1085.9 万人,实名用户 1006.6 万人,平均每两位深圳市民,就有一位在使用该平台。      图 | “深微平台”可以办理的部分(来源:深圳公安微信服务号)   早在 2017 年,“深微平台”每年可为深圳市民,节省约 427.6 万小时的办事时间(按一次到场用时 2 小时计算),相当于少跑 213.8 万趟。若以平均到场 1 次、花费 50 元计算,线上办理服务可为市民节省约 10 亿元的办事成本。   该平台背后的服务提供方,正是同在深圳的腾讯,而这只是腾讯云 AI 技术,在新基建应用方面的缩影之一。      图 |

百度飞桨适配MediaTek人工智能芯片,为智能产业落地开启新局

空扰寡人 提交于 2020-08-05 05:12:10
AI人工智能产业又一重磅合作!百度 飞桨 ( PaddlePaddle )深度学习平台携手IC设计领导厂商MediaTek,完成 Paddle Lite 轻量化推理引擎与MediaTek的NeuroPilot人工智能通用软件平台适配。 下载安装命令 ## CPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/cpu paddlepaddle ## GPU版本安装命令 pip install -f https://paddlepaddle.org.cn/pip/oschina/gpu paddlepaddle-gpu 如此一来,所有MediaTek的人工智能芯片APU (Artificial intelligence Processing Unit ) 都能够使用 Paddle Lite 快速部署。透过推进智能技术与产品的进步,双方有着共同的目标,即加速AI科技的普及与进步,让AI技术更好的为所有用户服务,并实现产业落地。 MediaTek芯片目前在智能音箱/智能带屏音箱领域市场占有率过半,与百度共同合作开发的智能音箱产品小度在家系列,AI识别技术获得市场好评,销量持续位居前茅。百度在 AI 技术及生态圈加大了布局, MediaTek 深耕边缘 AI 技术平台,双方以智能屏音箱小度在家产品的合作为基础

人工智能自拍之后,会怎样给自己P图?

不羁的心 提交于 2020-08-05 04:49:04
作者:数据叔 来源:大数据DT(ID:hzdashuju) 01 智能辅助创新 人工智能领域的发展前景广阔。 数学是个很重要的事情。 创意产业发展潜力无限,极大地推动了全球经济发展和社会进步,做出更多更重要的贡献。 未来将会是什么样的?生活中有哪些不同呢? 上面4句话,不能算是我写的,但也不是人工智能自动生成的,而是人机搭配干活不累的成果。 iOS自带的输入法有联想功能,你键入一个词之后,输入法会自动联想你接下来可能会输入的词。很多情况下,你接下来要输入的词确实在输入法的联想范围内。还有些时候,你不知道接下来该写什么,那么输入法的联想或许会给你一些思路,甚至你按它的联想接着写就行了。 iOS这个输入法的联想功能并不仅仅基于你自己的用词习惯,而是基于所有用户的用词习惯,也就是一个基于大数据的人工智能系统。 本文开头的那4句话,分别是我用人工智能、数学、创意和未来4个关键词作为句子的起始点,然后在输入法的联想词里进行选择,直到联想词里出现句号,并且自己也满意这样结束。 这4句话里,人工智能提供了选项,我做出选择,这既不是人类单独完成的作品,也不是人工智能单独完成的工作。有人把这种人工智能帮助人类进行创造性工作的模式称为 “智能辅助创新”。 智能辅助创新在《天才与算法》这本书里还有很多好玩的案例。这些案例不仅仅局限于文字创作,还有音乐、绘画等众多需要人类创作力的领域。

PyTorch官方教程书限时免费!500页内容带你上手最流行框架

最后都变了- 提交于 2020-08-05 04:43:05
去年 11 月,PyTorch 官方发布权威 PyTorch 教程书籍《Deep Learning with PyTorch》,但遗憾的是当时这本书只有前五章内容免费。现在,经过更新迭代后,PyTorch 终于发布了该书的免费版本。还不快来学? 机器之心报道,参与:魔王。 书籍地址: https:// pytorch.org/assets/deep -learning/Deep-Learning-with-PyTorch.pdf PyTorch 是当前最热的深度学习框架之一。自 2016 年诞生以来,PyTorch 迅速发展,成为广受开发者和研究人员喜爱的框架。根据 最近的一项统计 ,在 ICLR 2020 和 CVPR 2020 会议中,使用 PyTorch 的论文数远超 TensorFlow,研究人员对 PyTorch 的偏爱程度进一步加深。 然而,PyTorch 直到去年 11 月才提供官方权威的 PyTorch 教程书籍《Deep Learning with PyTorch》,且只有前五个章节的内容免费可看。 最近,PyTorch 官方终于放出了该书 V3.6.8 版本的全部内容。全书约 500 页,包含 15 个章节,内容详实,图文并茂。 这本书为使用 PyTorch 构建和训练神经网络提供了详细且易于上手的教程,使用的编程语言为 Python。 这本 PyTorch

“AI+医疗”发展势头强劲 正在引起一场医学革命

[亡魂溺海] 提交于 2020-08-05 04:35:43
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! “AI+医疗”是当下最火热的人工智能应用场景之一;人工智能技术已经成为医疗健康行业的有效辅助和有力支撑。正如我国著名学者周海中教授在30年前指出的那样:“随着社会的发展和科技的进步,人工智能技术将在医疗健康领域大显身手;其成果会不断涌现,应用前景令人期待。”“AI+医疗”目前发展势头强劲,它正在引起一场医学革命;其应用场景主要有以下几个方面。 在诊断方面 人工智能技术不但能够提供包括心脏、肝脏、肺部、胆脾、肠胃、膀胱、大脑等多种脏器医学影像数据的智能化识别和分析,而且可以为医院影像准段提供快速精准的医疗辅助诊断,从而提高临床诊疗的精准性与效率,减低医生工作强度的同时,减少漏诊与误诊几率,还可以为体检机构提供高质量的影像筛查,快速全面提升筛查诊断水平,并有效地缓解医疗资源紧张的问题。从应用效果来看,规模化使用人工智能技术将是未来医疗诊断的一个发展趋势。未来,人工智能诊断工具或许能够比人类医生更快、更准确地确立病因并给予诊断。 例如,美国西奈山伊坎医学院的研究人员最近采用人工智能算法,将胸部CT扫描结果和临床症状、暴露史及实验室检测结合起来,以快速诊断新冠肺炎(COVID-19)阳性患者。他们表示,在CT扫描和相关病史都可用的情况下,新的人工智能系统准确度与资深胸放射科医生相当

【Leetcode】《剑指offer-面试题43》n个骰子的点数

我的梦境 提交于 2020-08-05 04:24:24
我的个人 微信公众号: Microstrong 微信公众号ID: MicrostrongAI 微信公众号介绍:Microstrong(小强)同学主要研究机器学习、深度学习、计算机视觉、智能对话系统相关内容,分享在学习过程中的读书笔记!期待您的关注,欢迎一起学习交流进步! 知乎主页:https://www.zhihu.com/people/MicrostrongAI/activities Github:https://github.com/Microstrong0305 个人博客:https://blog.csdn.net/program_developer 题目链接 https://leetcode-cn.com/problems/nge-tou-zi-de-dian-shu-lcof/ 题目描述 解题思路 (1)递归解法 import math from typing import List class Solution: # 定义骰子最大点数 g_maxValue = 6 # 方法一:基于递归求骰子点数,时间效率不够高 def twoSum(self, n: int) -> List[float]: if n < 1: return [] # 定义n个骰子的最大点数 maxSum = n * self.g_maxValue # 所有可能的值出现的次数保存在列表中