神经网络

CDCN笔记

雨燕双飞 提交于 2020-08-12 17:08:19
提出了一种基于中心差分卷积(CDC)的新型帧级FAS方法,它能够通过聚合强度和梯度信息来捕获内在的详细模式。用CDC构建的网络,称为中心差分卷积网络(CDCN),相较于用普通卷积构建的网络,能够提供更稳健的建模能力。 此外,在一个专门设计的CDC搜索空间上,可利用神经结构搜索(NAS)发现更强大的网络结构(CDCN++),该网络结构可与多尺度注意力融合模块(MAFM)组装,进一步提升性能。在6个基准数据集上进行了综合实验,结果表明:1)所提出的方法不仅在数据集内部测试中取得了优异的性能(特别是在OULU-NPU数据集(Protocol1)实现了0.2%的ACER),2)在跨数据集测试中也有很好的通用性(特别是从CASIAMFSD到Replay-Attack数据集,实现了6.5%的HTER)。 搜索一个中心差分卷积神经网络CDCN++: 来源: oschina 链接: https://my.oschina.net/u/4390196/blog/4286832

深度学习之注意力机制(Attention Mechanism)和Seq2Seq

ⅰ亾dé卋堺 提交于 2020-08-12 15:48:48
这篇文章整理有关注意力机制( Attention Mechanism )的知识,主要涉及以下几点内容: 1、注意力机制是为了解决什么问题而提出来的? 2、软性注意力机制的数学原理; 3、软性注意力机制、Encoder-Decoder框架与Seq2Seq 4、自注意力模型的原理。 一、注意力机制可以解决什么问题? 神经网络中的注意力机制(Attention Mechanism)是在计算能力有限的情况下,将计算资源分配给更重要的任务,同时解决信息超载问题的一种资源分配方案。在神经网络学习中,一般而言模型的参数越多则模型的表达能力越强,模型所存储的信息量也越大,但这会带来信息过载的问题。那么通过引入注意力机制,在众多的输入信息中聚焦于对当前任务更为关键的信息,降低对其他信息的关注度,甚至过滤掉无关信息,就可以解决信息过载问题,并提高任务处理的效率和准确性。 这就类似于人类的视觉注意力机制,通过扫描全局图像,获取需要重点关注的目标区域,而后对这一区域投入更多的注意力资源,获取更多与目标有关的细节信息,而忽视其他无关信息。通过这种机制可以利用有限的注意力资源从大量信息中快速筛选出高价值的信息。 二、软性注意力机制的数学原理 在神经网络模型处理大量输入信息的过程中,利用注意力机制,可以做到只选择一些关键的的输入信息进行处理,来提高神经网络的效率,比如在机器阅读理解任务中,给定一篇很长的文章

零起点PYTHON机器学习快速入门 PDF |网盘链接下载|

这一生的挚爱 提交于 2020-08-12 15:48:31
点击此处进入下载地址 提取码:2wg3 资料简介: 本书采用独创的黑箱模式,MBA案例教学机制,结合一线实战案例,介绍Sklearn人工智能模块库和常用的机器学习算法。书中配备大量图表说明,没有枯燥的数学公式,普通读者,只要懂Word、Excel,就能够轻松阅读全书,并学习使用书中的知识,分析大数据。本书具有以下特色:独创的黑箱教学模式,全书无任何抽象理论和深奥的数学公式。首次系统化融合Sklearn人工智能软件和Pandas数据分析软件,不用再直接使用复杂的Numpy数学矩阵模块。系统化的Sklearn函数和API中文文档,可作为案头工具书随时查阅。基于Sklearn Pandas模式,无须任何理论基础,全程采用MBA案例模式,懂Excel就可看懂。 资料目录: 第 1 章 从阿尔法狗开始说起1 1.1 阿尔法狗的前世今生.......1 1.2 机器学习是什么.....2 1.3 机器学习大史记.....3 1.4 机器学习经典案例......... 11 第 2 章 开发环境......13 2.1 数据分析首选 Python.....13 2.2 用户运行平台.......18 2.3 程序目录结构.......19 2.4 Spyder 编辑器界面设置.20 2.5 Python 命令行模式.........26 2.6 Notebook 模式......27 2.7

NeoML:用于构建,训练和部署机器学习模型的开源库

半世苍凉 提交于 2020-08-12 15:18:21
ABBYY推出了NeoML,这是一个用于构建,培训和部署机器学习模型的开源库。NeoML 现已发布到GitHub(https://github.com/neoml-lib),支持深度学习和传统机器学习算法。 跨平台框架针对在云环境,台式机和移动设备上运行的应用程序进行了优化。较高的推理速度与平台独立性的结合使该库成为需要无缝客户体验和设备上数据处理的移动解决方案的理想选择。 开发人员可以使用NeoML来构建,训练和部署用于对象识别,分类,语义分段,验证和预测建模的模型,以实现各种业务目标。例如,银行可以开发模型来管理信用风险并预测客户流失,电信公司可以分析营销活动,零售和快速消费品(F MCG)的表现,可以通过面部识别和数据验证来建立远程客户识别。该框架的主要优势之一是其对可用云资源的有效利用。 NeoML被设计为一种通用工具,用于处理和分析各种格式的数据,包括文本,图像,视频和其他格式。它支持C ++,Java和Objective-C编程语言; Python将很快添加。 NeoML的神经网络模型支持100多种层类型。它还提供20多种传统ML算法,例如分类,回归和聚类框架。该库是完全跨平台的-可在包括Windows,Linux,macOS,iOS和Android在内的所有流行操作系统上运行的单一代码库-并且针对CPU和GPU处理器进行了优化。 “

洞悉2020年AI产业新趋势,青年科学家们如是说

北城余情 提交于 2020-08-12 14:48:37
  日前,麻省理工科技评论中国、DeepTech 联合 COLMO AI 科技家电举行的一场线上 TR35 青年科学家分享会圆满落幕,已累计吸引超过 10 万在线点播。   这次分享会主要围绕 “ AI 重构未来 ” 的主题展开,针对新基建浪潮、市场环境变化、AI 芯片、机器人、AI 技术产业趋势等时下热点,邀请了来自投资机构、学术界、产业界的多方专家精英进行了专业分享和讨论。      本次活动的嘉宾阵容包括韩国成均馆大学教授、美的集团洗衣机事业部研究院院长高弘锡,上海交通大学研究员、博士生导师、非夕机器人首席 AI 科学家卢策吾,快手 AI 平台部、Ytech 西雅图人工智能实验室、FeDA 商业化智能实验室负责人刘霁,赛灵思人工智能业务高级总监、前深鉴科技联合创始人兼 CEO 姚颂, 瑞莱智慧创始人兼 CEO 田天,真格基金投资总监尹乐等。   嘉宾在观念的交流与碰撞之间,为我们展现了 AI 领域最新的技术走向和市场趋势解读。    智能家电正在告别 “ 伪 ” 智能   美的集团洗衣机事业部研究院院长高弘锡表示,近年来,随着智能家居、智慧生活概念的火热,很多厂家都开始跟风把物联网、语音交互等技术跟家电产品进行简单结合,这给消费者造成了不少认知上的偏差,很多产品并没有从实用和体验层面出发给用户生活带来切实有效的改变。    真正的智能家电还是应该从产品最本质的核心使用功能出发

傻瓜式无限P图,MIT朱俊彦团队“重写”深度生成模型

99封情书 提交于 2020-08-12 14:27:26
     作者 | 陈大鑫   编辑 | 丛末   复制一位老人的胡子,把胡子粘贴到全部孩子的眉毛上。该如何实现这样的操作呢?   让我们从塔尖生树的问题说起。   如何在教堂的塔尖上生成一棵树?——当然是使用P图软件啦!      但是P图软件一次只能修改一张图片,难道就没有那种能一键无限张P图的软件吗?   近日,来自MIT朱俊彦团队的一篇论文《Rewriting a Deep Generative Model》就很巧妙地 解决了这个问题,目前该论文已被接收为ECCV 2020 Oral,且代码已开源。   在这篇《重写深度生成模型》论文中,作者不是单独地对一张张图片进行编辑,而是很大胆地提出直接对深度网络的内部生成模型动刀编辑:      在这个规则编辑器中,深度生成模型G(z,w_0) 作为输入,这时模型的初始权重是 w_0,预训练模型G映射一个随机输入向量z到一个真实图像,将权重w_0改成w_1即可产生新的模型作为输出。   利用现有的模型能产生无限数量的图像,那么改变生成模型的规则就能让我们创造新规则下的无限张可改变图像。如下图所示,通过把塔尖的生成模型重写为“树”,一次操作即可在所有教堂的塔尖上都生成一棵树:       1    傻瓜式操作   那这么神奇的重写模型操作起来容易吗,够傻瓜式吗?   为了让读者更好地亲自编辑模型,作者特意创建了一个用户交互界面

自然语言处理中的语言模型简介

ぃ、小莉子 提交于 2020-08-12 13:47:02
作者|Devyanshu Shukla 编译|Flin 来源|medium 在这篇文章中,我们将讨论关于语言模型(LM)的所有内容 什么是LM LM的应用 如何生成LM LM的评估 介绍 NLP中的语言模型是计算句子(单词序列)的概率或序列中下一个单词的概率的模型。即 句子的概率: 下一个单词的概率: 语言模型 v/s 字嵌入 语言模型常常与单词嵌入混淆。主要的区别在于,在语言模型中,单词顺序很重要,因为它试图捕捉单词之间的上下文,而在单词嵌入的情况下,只捕捉语义相似度( https://en.wikipedia.org/wiki/Semantic_similarity ) ,因为它是通过预测窗口中的单词来训练的,而不管顺序如何。 语言模型的应用 语言是NLP的主要组成部分,在很多地方都有使用,比如, 情感分析 问答 总结 机器翻译 语音识别 生成语言模型 有不同的方法来生成语言模型,让我们逐一查看它们。 使用N-grams N-grams( https://en.wikipedia.org/wiki/N-gram ) 是给定语料库中N个单词的序列。对于“I like pizza very much”这句话,bigram将是 ‘I like’, ‘like pizza’, ‘pizza very’ 和 ‘very much’。 比方说,我们有一个句子‘students opened

符号主义对深度学习的意义浅谈

南楼画角 提交于 2020-08-12 11:52:36
符号主义人工智能经历过古典时期的专家系统阶段, 中期的知识图谱阶段, 和近期深度学习和符号主义的再次联姻。 那么一个很重要的问题是符号主义为什么会复兴,它对当下的机器学习又有何意义? 参考阅读: Reconciling deep learning with symbolic artificial intelligence: representing objects and relations ​ www.sciencedirect.com 首先, 当下的深度学习有三个最主要的问题,很低的数据使用效率, 泛化能力, 可解释性,都可以从符号主义得到极大帮助。 这一点也不难理解, 所谓符号,多数指我们语言中那些经常被使用的抽象概念,这些概念再不同的任务和环境中被广泛使用组成新的概念,比如红色,圆形等,如果能够在不同任务中学习到这些最基本的元素, 那么无疑将极大的改善数据使用效率和泛化能力。同时, 从视频,声音等信息中提取出的这种符号,几乎一定是和我们的自然语言有所对应,和我们的认知概念有所对应,因此,提取这些符号将极大助力模型的可解释性。从这两个角度看, 符号的确可以解决深度学习的几个根本问题。 更加重要的是,符号的使用和我们的推理认知能力极为相关,这也是为什么在第一代的人工智能时代人们如此重视符号, 因为它是逻辑思维的载体,有了符号我们可以在符号基础上罗列各种运算,进行关系预测和推理等

如何配置一台高效的GPU(深度学习)服务器

梦想的初衷 提交于 2020-08-12 11:27:55
目前GPU深度学习服务器在AI、视频处理、科学计算等领域都有广泛应用。随着NVIDIA推出更多的GPU硬件和工具软件,如何配置一台属于自己的GPU服务器,在开发者的工作中成为了重中之重。 文章大概: 1、硬件平台的搭建 o 深度学习服务器的性能需求 o NVIDIA GPU的性能特点 o 硬件环境的配置搭配要点 2、软件环境的配置 o 深度学习环境的系统配置,环境搭建 o NVIDIA CUDA的安装 o 介绍NVIDIA Deep Learning 相关SDK工具,包括类似于Transfer Learning Toolkit,CuDNN,CuBlas, TesnorRT… o NVIDIA GPU Cloud 介绍 o 成熟的解决方案或者案例 最近开始学习深度学习(Deep Learning)技术,特别是google的Tensorflow深度学习包开源后,深度学习已经成为大数据领域的重大计算革命,配合Teras顶层框架,使得Deep learning的学习成本降低。(百度也开源了飞桨开源平台也不错) 目前Deep learning技术应用越来越广,一切数据都是图,CNN卷积神经网络技术充满了神奇的计算魅力。DL技术广泛应用于:图像处理、人脸识别、自动驾驶、聊天机器人、AI人工智能、机器语言翻译、图片推荐系统、声音处理、音乐作曲、机器写作等领域。 现今,日益完善的深度学习技术和

22课时、19大主题,CS 231n进阶版课程视频上线

故事扮演 提交于 2020-08-12 10:21:48
  机器之心报道    编辑:小舟、杜伟    讲 CS231n 的 Justin Johnson 在密歇根大学推出了一套计算机视觉的进阶课程。   计算机视觉在日常生活中已经无处不在。从搜索引擎、图像理解、地图、医疗、无人机、自动驾驶到各类手机 app,都离不开计算机视觉。这些应用中有许多像图像分类和目标检测这样的视觉识别任务,而神经网络方面的进展大大提高了视觉识别系统的性能。    来自密歇根大学的 Justin Johnson 在 2019 年秋季推出了一套新的课程,该课程深入探讨了基于神经网络的计算机视觉深度学习方法的细节。这一课程近日已在 YouTube 上开放 。      课程视频链接:https://www.youtube.com/playlist?list=PL5-TkQAfAZFbzxjBHtzdVCWE0Zbhomg7r    课程概况   这套 2019 年秋季的计算机视觉课程名为「Deep Learning for Computer Vision」,课程讲授者是来自密歇根大学的 Justin Johnson。作为斯坦福大学李飞飞教授的学生,Justin Johnson 曾和李飞飞一起讲授斯坦福大学计算机视觉经典课程 CS231n。      Justin Johnson,图源:https://web.eecs.umich.edu/~justincj/。