神经网络

顶会论文看不懂?阿里巴巴技术专家为你全方位解读!

非 Y 不嫁゛ 提交于 2020-09-28 01:43:08
简介: 由阿里云开发者社区联合新零售智能引擎事业群共同打造的《KDD 论文精华解读》电子书重磅发布!覆盖推荐系统、图神经网络预训练、买家秀视频标题生成、在线电视剧的受众竞争力预测和分析等 10+ 内容,免费下载电子书感受科技的震撼! 想知道数据挖掘技术最新科技动态?不知道国际数据挖掘顶会 KDD 每年在讲啥?高手过招给你劝退了?别慌,这本电子书集合了 12 位阿里巴巴技术专家对 KDD 精华论文的解读,还附带论文的原文内容哦,点击下方链接立即下载电子书,马住先,刷着刷着万一找不到了! 免费下载 >>《KDD 论文精华解读》>> 或者复制该链接到浏览器完成下载或分享: https://developer.aliyun.com/topic/download?id=690 亮点解读 12 篇论文原文呈现 覆盖优势特征蒸馏、图神经网络预训练、图表示学习中的负采样、买家秀视频标题生成、在线电视剧的受众竞争力预测和分析、可控的多兴趣推荐框架等 10+ 数据挖掘顶级内容,一次性掌握! 案例解读,不怕你看不懂 每篇论文都有阿里巴巴领域专家对内容进行深入的分析、提炼,并结合阿里巴巴经济体内实践案例分析该技术的应用方式。 KDD 论文“学习伴侣”,大数据工程师必备枕边书 ! 原文链接 本文为阿里云原创内容,未经允许不得转载。 来源: oschina 链接: https://my.oschina.net

人均百万奖金,达摩院青橙奖结果揭晓:钟南山院士寄语,DenseNet作者黄高获奖

六月ゝ 毕业季﹏ 提交于 2020-09-27 23:53:24
「你们处在最好的时候,要记得把握机遇。」——颁奖嘉宾钟南山院士。 机器之心报道,编辑:蛋酱、泽南。 10 位青年科学家,每人 100 万人民币奖金。今天上午,阿里巴巴达摩院青橙奖第三届获奖名单正式揭晓。 在 20 进 10 的最终答辩环节之后,达摩院院长张建锋正式公布了本届达摩院青橙奖学者名单,分别为: 梁文华 国家呼吸研究所 杨诗武 北京大学 赵保丹 浙江大学 聂礼强 山东大学 姜宇 清华大学 冷静文 上海交通大学 何向南 中国科学技术大学 杜子东 中国科学院计算技术研究所 邓岳 北京航空航天大学 黄高 清华大学 在他们之中,最年轻者仅有 28 岁,获奖者的平均年龄也只有 32 岁。除了 100 万人民币奖金之外,每位获奖者还将获得阿里全方位的科研资源支持。 特别值得注意的是,今年的颁奖嘉宾是钟南山院士。在为青橙奖颁奖的前一天,84 岁的钟南山院士刚刚因抗击新冠肺炎疫情斗争中的杰出贡献被授予「共和国勋章」。在 9 月 9 日线上颁奖典礼现场,钟南山以 VCR 寄语的方式表达了他对青年科学家的期待: 「我 35 岁以前还在农村做锅炉工,完全没有机会搞科研。当代青年学者思想的活跃、知识的多元令我印象深刻。你们处在一个最好的机遇时代,要记得把握机遇,年轻人既要有热情,更要有激情。你们要做出一个典范,让研究产生社会效益和经济效益。」钟南山院士说道。 青橙奖设立于 2018 年

基于忆阻器的神经网络应用研究

喜你入骨 提交于 2020-09-27 23:20:42
来源:文章转载自期刊《微纳电子与智能制造》,作者:陈 佳,潘文谦,秦一凡,王 峰,李灏阳,李 祎,缪向水。 摘 要 基于忆阻突触器件的硬件神经网络是神经形态计算的重要发展方向,是后摩尔时代突破传统冯·诺依曼计算架构的有力技术候选。综述了国内外忆阻硬件神经网络的近期发展现状,从器件发展和神经网络两个方面,详细阐述了忆阻器这一新兴信息器件在神经形态计算中所发挥的角色作用,讨论了依然存在的关键问题和技术挑战。忆阻器为实现存算一体化架构和超越摩尔定律提供了技术障碍突破的可行方案。 引 言 在当今数据量爆炸式增长的背景下,传统计算架构遭遇冯·诺依曼瓶颈,晶体管微缩,摩尔定律已难以延续,这已成为继续提升计算系统性能过程中难以克服的技术障碍[1-4]。神经形态计算概念的提出无疑是可以实现技术突破的一大曙光,人脑信息处理系统的复杂程度是最先进的超级计算机也无法媲美的。在已报道的神经形态计算架构芯片中,其计算能力显著提高,并且体积和能耗远小得多。因此,神经形态计算架构的发展在软件和硬件领域都被极度重视,有望替换当前计算系统架构。 而在众多用于实现神经形态计算的硬件元件中,忆阻器以其高集成度、低功耗、可模拟突触可塑性等特点成为一大有力备选。忆阻器早在1971年就由蔡少棠教授[5]以第4种无源基本电路元件的概念提出,2008年由惠普实验室首次在 Pt/TiO2/Pt三明治叠层结构中通过实验验证[6]

如何提高强化学习效果?内在奖励和辅助任务

随声附和 提交于 2020-09-27 16:53:24
     文字整理:智源社区 吴继芳   如何能够提高强化学习效果?   这是美国密西根大学教授Satinder Singh长期以来致力于解决的问题。在2020北京智源大会上,Satinder Singh教授对这个问题进行了深度阐释,他通过Meta-Gradient方法来学习发现以往强化学习智能体中需要手动设置的参数:内在奖励和辅助任务问题。   Satinder Singh从近期关于强化学习的两个研究工作出发,针对如何通过数据驱动的方式学习到内在奖励函数,他提出了一个学习跨多生命周期(Lifetime)内部奖励函数的Meta-Gradient框架,同时设计了相关实验证明学习到的内在奖励函数能够捕获有用的规律,这些规律有助于强化学习过程中的Exploration和Exploitation,并且可以迁移到到不同的学习智能体和环境中。   针对于如何在数据中发现问题作为辅助任务,他扩展通用辅助任务架构,参数化表示General Value Functions,并通过Meta-Gradient方法学习更新参数发现问题。实验证明这个方法可以快速发现问题来提高强化学习效果。   Satinder Singh,美国密西根大学教授,Deep Mind科学家,AAAI Fellow。主要研究兴趣是人工智能(AI)的传统目标,即构建能够学习在复杂、动态和不确定环境中具有广泛能力的自主智能体

机器学习排序算法:RankNet to LambdaRank to LambdaMART

半腔热情 提交于 2020-09-27 04:47:01
使用机器学习排序算法LambdaMART有一段时间了,但一直没有真正弄清楚算法中的所有细节。 学习过程中细读了两篇不错的博文,推荐给大家: 梯度提升树(GBDT)原理小结 徐博From RankNet to LambdaRank to LambdaMART: An Overview 但经过一番搜寻之后发现,目前网上并没有一篇透彻讲解该算法的文章,所以希望这篇文章能够达到此目的。 本文主要参考微软研究院2010年发表的文章 From RankNet to LambdaRank to LambdaMART: An Overview $^1$,并结合自己的理解,试图将RankNet、LambdaRank和LambdaMART这三种算法的所有算法细节讲解透彻。 1. 概述 RankNet、LambdaRank和LambdaMART是三个关系非常紧密的机器学习排序算法。简而言之,RankNet是最基础,基于神经网络的排序算法;而LambdaRank在RankNet的基础上修改了梯度的计算方式,也即加入了lambda梯度;LambdaMART结合了lambda梯度和MART(另称为GBDT,梯度提升树)。这三种算法在工业界中应用广泛,在BAT等国内大厂和微软谷歌等世界互联网巨头内部都有大量应用,还曾经赢得“Yahoo!Learning To Rank Challenge(Track 1)

深度学习算法原理——LSTM

断了今生、忘了曾经 提交于 2020-09-27 04:04:31
1. 概述 在 循环神经网络RNN 一文中提及到了循环神经网络RNN存在长距离依赖的问题,长短期记忆(Long Short-Term Memory,LSTM)网络便是为了解决RNN中存在的梯度爆炸的问题而提出。在LSTM网络中,主要依靠引入“门”机制来控制信息的传播。 2. 算法原理 2.1. LSTM的网络结构 LSTM的网络结构如下所示(图片来自参考文献): 与循环神经网络RNN相比,LSTM的网络结构要复杂的多。 在LSTM网络中,通过引入三个门来控制信息的传递,这三个门分别为遗忘门(forget gate),输入门(input gate)和输出门(output gate)。门机制是LSTM中重要的概念,那么什么是“门”以及门机制在LSTM中是如何解决长距离依赖的问题的。 2.2. 门机制 现实中的“门”通常解释为出入口,在LSTM网络的门也是一种出入口,但是是控制信息的出入口。门的状态通常有三种状态,分别为全开(信息通过概率为1),全闭(信息通过概率为0)以及半开(信息通过概率介于0和1之间)。在这里,我们发现对于全开,全闭以及半开三种状态下的信息通过可以通过概率来表示,在神经网络中,sigmoid函数也是一个介于0和1之间的表示,可以应用到LSTM中门的计算中。 2.3. LSTM的计算过程 如下是LSTM的网络结构的具体形态,如下所示(图片来自邱锡鹏老师的课件): 其中

强化学习(九)Deep Q-Learning进阶之Nature DQN

淺唱寂寞╮ 提交于 2020-09-26 17:36:57
    在 强化学习(八)价值函数的近似表示与Deep Q-Learning 中,我们讲到了Deep Q-Learning(NIPS 2013)的算法和代码,在这个算法基础上,有很多Deep Q-Learning(以下简称DQN)的改进版,今天我们来讨论DQN的第一个改进版Nature DQN(NIPS 2015)。     本章内容主要参考了ICML 2016的 deep RL tutorial 和Nature DQN的论文。 1. DQN(NIPS 2013)的问题     在上一篇我们已经讨论了DQN(NIPS 2013)的算法原理和代码实现,虽然它可以训练像CartPole这样的简单游戏,但是有很多问题。这里我们先讨论第一个问题。     注意到DQN(NIPS 2013)里面,我们使用的目标Q值的计算方式:$$y_j= \begin{cases} R_j& {is\_end_j\; is \;true}\\ R_j + \gamma\max_{a'}Q(\phi(S'_j),A'_j,w) & {is\_end_j \;is\; false} \end{cases}$$     这里目标Q值的计算使用到了当前要训练的Q网络参数来计算$Q(\phi(S'_j),A'_j,w)$,而实际上,我们又希望通过$y_j$来后续更新Q网络参数。这样两者循环依赖

Graph Convolution Neural Network

无人久伴 提交于 2020-09-26 13:37:23
文章目录 往期文章链接目录 Convolutional graph neural networks (ConvGNNs) GCN Framework GCN v.s. RecGNN What is Convolution Spatial-based ConvGNNs Message Passing Neural Network (MPNN) Introduction to MPNN Shortage of the MPNN framework GraphSAGE (SAmple and aggreGatE) Overview of GraphSAGE Aggregator Fuctions PATCHY-SAN Overview of PATCHY-SAN Two problems considered in PATCHY-SAN Steps of PATCHY-SAN 往期文章链接目录 往期文章链接目录 Convolutional graph neural networks (ConvGNNs) Convolutional graph neural networks (ConvGNNs) generalize the operation of convolution from grid data to graph data. The main idea is to

迄今最激进的人脸识别禁令来了!企业在公共场所也不得使用

一世执手 提交于 2020-09-26 10:13:12
      与以往城市仅止步于限制政府部门的人脸识别应用不同,波特兰市在公共和私人场合的双重禁止人脸识别的应用,可能为其他城市开辟类似的数字隐私政策提供了一个路线图,这也是隐私倡导者所希望的结果。    撰文 | 微胖   飞机飞过天空,天空之火,不过,那是硅谷的山火。在山火引发世人关注的同时,位于美国西北部俄勒冈州波特兰市的糟糕局势也在引发各方密切关注,甚至惊动联合国。   自5月底黑人男子弗洛伊德被暴力执法致死,引爆新一轮全美反种族主义示威以来,近期,俄勒冈州波特兰市一名白人男子在示威活动中被枪杀。三个月来,持续升温的民愤、种族主义和警察暴力犹如一道道旋涡, 搅得时局天翻地覆,但更让人惊讶的是,就在这样的混乱中,本周三,波特兰市议会却通过了一项立法,该立法 被广泛认为是迄今为止最激进的人脸识别技术市政禁令。      两项法令不仅禁止 波特兰所有市政部门使用人脸识别技术 ,还禁止 私人公司在公共场所使用这项技术。   人脸识别系统在美国基本上不受监管,特别是私人企业的使用。奥克兰、旧金山和波士顿也只是禁止政府部门使用人脸识别技术,而波特兰禁止企业在公共场所使用该技术的禁令可谓开创先河。   一 为什么禁止所有市政部门使用?   全面禁止市政部门使用该技术,背后逻辑既与当前糟糕局势有关,更与「市情」密切相关。   市议会委员Jo Ann Hardesty将对高科技执法工具的担忧

使用LSTM-RNN建立股票预测模型

社会主义新天地 提交于 2020-09-26 04:56:28
  硕士毕业之前曾经对基于LSTM循环神经网络的股价预测方法进行过小小的研究,趁着最近工作不忙,把其中的一部分内容写下来做以记录。   此次股票价格预测模型仅根据股票的历史数据来建立,不考虑消息面对个股的影响。曾有日本学者使用深度学习的方法来对当天的新闻内容进行分析,以判断其对股价正面性/负面性影响,并将其与股票的历史数据相结合,各自赋予一定的权重来对近日的股价进行预测 [1] 。该预测方法取得了一定的效果。   而这里我没有引入消息面的影响,主要出于以下几点考虑:   1.消息的及时性难以保证:很多时候,在一只股票的利好/利空消息出来之前,其股价已经有了较大幅度的增长/下跌。信息的不对称性导致普通群众缺乏第一手消息源。   2.消息的准确性难以保证:互联网上信息传播速度极快,媒体之间经常会出现相互抄袭新闻的情况,而这种抄来的新闻(非原创新闻)往往没有经过严格的审核,存在着内容虚假,夸大宣传的可能性。一旦分析模型错用了某条谣言或真实性不高的新闻,很有可能得出错误的预测结果。   3.语言的歧义性:一条新闻,其正面性/负面性往往存在着多种解读。例如“习主席宣布中国将裁军30万”——新华每日电讯2015.09.04。这条新闻一般意义上可以解读为:中央政府深入推进改革,精兵简政,大力发展国防军工事业。这是一种正面性的解读。而在使用机器学习模型时,如传统的奇异值分解算法(SVD)