深度学习

直播预告: NeurlPS 2020 专场二| AI TIME PhD

馋奶兔 提交于 2020-12-17 21:35:27
⬆⬆⬆ 点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 12月11日晚7:30-9:00 AI TIME特别邀请了3位优秀的讲者跟大家共同开启NeurlPS 2020专场二! 哔哩哔哩直播通道 扫码 关注AITIME哔哩哔哩官方账号 观看直播 链接: https://live.bilibili.com/21813994 ★ 邀请嘉宾 ★ 刘乾: 北京航空航天大学与微软亚洲研究院联合培养博士,主要关注在上下文建模、语义解析、组合泛化等话题, 目前以第一作者身份在ACL、EMNLP、NeurIPS等会议发表若干论文。 报告题目: 基于解析式学习的组合泛化研究 摘要: 近年来,深度学习模型在各种任务上都取得了非常大的成功。然而,不同于人类可以从少量样本中快速学习,深度学习模型的成功仍依赖于大量训练数据。那么,深度学习模型是否有可能拥有人类这种快速学习的能力呢?一个关键问题就在于深度学习是否可以拥有组合泛化能力。 组合泛化是人类的一种基本而又必不可少的能力,通过理解已知部件的未知组合,人类可以利用有限的语言元素理解无限的自然语言世界。因此,越来越多研究者关注在组合泛化这个问题上,尤其是在AI编程领域。 2018年,纽约大学和Facebook的科学家们提出一个组合泛化领域的经典测试基准SCAN,测试任务是将诸如“run after walk”这样的自然语言解析成诸如“WALK

26万人的巨复杂考勤自动核算,比亚迪搞定了!

心不动则不痛 提交于 2020-12-17 14:10:15
先行者实践 企业数字化轰轰烈烈二十年,却始终在实践探索的峭壁上攀援。一方面作为技术手段的数字信息科技快速演进,将企业数字化导入泛摩尔定律循环,如逆水行舟不进则退;另一方面数字经济也深刻改变着人类社会,数字化驱动企业商业模式、业务逻辑、思维理念持续迭代,如物竞天择适者生存。 企业数字化目前还没有一种“完美模式”放之四海而皆准,但我们尝试观察那些持续走在数字化前沿的企业,用场景实践案例的方式构建一套多样化、百家争鸣“教科书”式的方法论,帮领先者镌刻经验,为后来者导引方向! 2020年疫情带来的巨大冲击,打破了整个行业发展的格局,企业数字化以洪流之势涌进产业链的各个环节,勇者前进。回顾企业数字化二十年,经验、机遇并存。企业数字化究竟是什么?怎么做?如何实现企业数字化的价值? 本文为中国软件网联合“STP^技术智库”推出的《先行者实践——数字化场景案例系列报道之五》。用数字化技术实现考勤自动核算,在很多人看来,这似乎并不是一件难事,无外乎计计考勤算算工资,没什么太大的难题。对于100人、1000人,甚至10000名员工以内、考勤规则简单的公司来说,这或许不是难事。但如果是20多万名员工、拥有1000多种考勤规则,它就变成了一个天大难题。这个HR科技领域“哥德巴郝猜想”被比亚迪集团华东信息部经理欧阳志东团队攻克了。他向我们展现了一种数字化先行者的新境界。 欧阳志东,高级工程师

python OpenCV与NAOqi库在机器人点球比赛中的应用

情到浓时终转凉″ 提交于 2020-12-17 13:47:31
前言 近期我省举办的机器人大赛刚刚落下帷幕,有幸参与其中的NAO机器人点球比赛,凭借着较好的运气取得了吉林省第一名。本文将从比赛的各个方面讲述所用程序及策略,所用程序代码如有不足之处,以及更好的逻辑优化,欢迎大家在评论区留言。 本文章不提供源代码,仅提供部分核心代码供大家交流学习。 完整代码后续会发到CSDN上供大家下载 NAO机器人点球比赛简介 简而言之,就是队伍分别担任进攻方和防守方,进攻方共三次机会,每次进球记一分,最后以得分数判别胜负。进攻方要求只能触球一次;守方无限制。并要求机器人具备 识别足球 的功能。 使用环境 python2.7(为了适应NAOqi库) NAOqi(本文不再过多介绍,更多信息请查阅我的前几篇文章) opencv 策略分析 由于比赛使用的是8mm的绿色草坪,NAO会由于草坪出现走路不稳的情况,我们采用了使用海报纸将nao机器人的脚包起来,降低机器人脚部与地面的摩擦,使机器人能在草坪上正常移动。 第二点,也是最重要的一点,所有的一切都是建立在让机器人 成功识别 的前提下进行的 。这里我们使用的是opencv中的霍夫圆检测搭配naoqi中的“ALVideoDevice”模块来调用nao的摄像头。这一点会在后面详细说明。 在机器人识别成功并且走到球附近后,根据球的相对位置,控制机器人进行微调,然后调用Choregraphe中预设好踢球的程序

如何利用Python做数据分析 需要学习哪些知识

ぐ巨炮叔叔 提交于 2020-12-17 13:33:05
根据调查结果,十大最常用的数据工具中有八个来自或利用Python。Python广泛应用于所有数据科学领域,包括数据分析、机器学习、深度学习和数据可视化。不过你知道如何利用Python做数据分析吗?需要学习哪些知识?下面就给大家讲解一下。 与数据分析相关的Python库很多,比如Numpy、pandas、matplotlib、scipy等,数据分析的操作包括数据的导入和导出、数据筛选、数据描述、数据处理、统计分析、可视化等等。接下来我们看一下如何利用Python完成数据的分析。 生成数据表 常见的生成方法有两种,第一种是导入外部数据,第二种是直接写入数据,Python支持从多种类型的数据导入。在开始使用Python进行数据导入前需要先导入pandas库,为了方便起见,我们也同时导入Numpy库。代码是最简模式,里面有很多可选参数设置,例如列名称、索引列、数据格式等等。 检查数据表 Python中使用shape函数来查看数据表的维度,也就是行数和列数。你可以使用info函数查看数据表的整体信息,使用dtypes函数来返回数据格式。Isnull是Python中检验空值的函数,你可以对整个数据表进行检查,也可以单独对某一列进行空值检查,返回的结果是逻辑值,包含空值返回True,不包含则返回False。使用unique函数查看唯一值,使用Values函数用来查看数据表中的数值。 数据表清洗

机器学习实用指南:如何从数据可视化中发现数据规律?

£可爱£侵袭症+ 提交于 2020-12-17 10:55:34
机器学习实用指南:如何从数据可视化中发现数据规律? 点击上方“ AI有道 ”,选择“置顶”公众号 重磅干货,第一时间送达 本系列为《Scikit-Learn 和 TensorFlow 机器学习指南》的第四讲。上文请见下面这篇文章: 机器学习实战指南:如何入手第一个机器学习项目? 目前为止,我们已经对数据有了初步的认识,大体上明白了我们要处理的数据类型。现在,我们将进入更深入的研究。 首先,确保已经划分了测试集并放置一边,我们只会对训练集进行操作。另外,如果训练集很大,可以从中采样一些作为探索集(exploration set),方便进行快速处理。在我们这个例子中,数据集比较小,所以直接在训练集上处理即可。我们还要创建一个训练集的复制副本,这样就不会改动原来的训练集了。 housing = strat_train_set.copy() 1. 地理数据可视化 因为数据集中包含了地理位置信息(经纬度),所以创建所有地区的散点图来可视化数据是个好主意(如下图所示)。 这看起来有点像加州,但是很难看出任何规律。我们设置参数 alpha = 0.1,这样就更容易看出数据点的密度了(如下图所示)。 housing.plot(kind="scatter", x="longitude", y="latitude", alpha=0.1) 现在,我们可以很清晰地看出这些密度较大的区域了。 通常来说

致考研!谈谈我是如何考上北大的

∥☆過路亽.° 提交于 2020-12-17 10:54:27
致考研!谈谈我是如何考上北大的 点击上方“ AI有道 ”,选择“置顶”公众号 重磅干货,第一时间送达 图:北大未名湖畔 明天就是 2019 年全国硕士研究生入学考试的日子了。许久没有关注考研信息,今天颇有感慨,想跟大家谈一谈我的考研之路。我将分几个方面来说,可能比较琐碎,但都是我的真实经历,希望能给你一些经验和心得。 很多读者朋友通过博客、知乎、微信公众号认识我,看我的文章,但是可能对我也并不了解。我是 2012 年考入北大硕士的,2015 年顺利毕业,现在主要从事机器学习、深度学习相关领域的研究和工作。 好了,正文开始! 1. 为什么考研? 这是一个很多在大学阶段考研之前大家都会想的一个问题,我也不例外。我本科就读于一所 211 高校。其实,对于是否考研这个问题,我从入学开始就比较确定的,一定会考研。因为我觉得高考并没有发挥正常,心里总有一个名校梦,当时就给自己设定了要考研、继续深造的志愿。应该说,我是学习型的,虽然刚入学的时候也想加入一些社团、学生会,但后来觉得用处不大,或者说自己也不适合,没有时间和精力。索性安心上课、自习,倒也轻松。不过,机缘巧合,也先后担任过班级的学委和班长,这方面对自己的锻炼也挺大的,收获了不少东西。 有的读者可能会问:既然刚开始就准备考研,那么肯定从大一就开始死学吧?对我而言其实不然。虽然我也始终把学习放在第一位,争取每个学年的奖学金

CTR点击率预估论文集锦

不羁的心 提交于 2020-12-17 06:47:53
前言 CTR预估对于搜索、推荐和广告都是非常重要的一个场景,近年来CTR预估技术更新迭代,层出不穷。这篇文章将记录CTR预估著名模型的相关论文。以下按照年份整理。 1.2020年 ( DFN ). Ruobing Xie. Deep Feedback Network for Recommendation ,2020,IJCAI(CCF-A). 出自腾讯微信团队. ( DMR ). Zequn Lyu. Deep Match to Rank Model for Personalized Click-Through Rate Prediction , AAAI (CCF-A), 出自阿里团队。 ( DTS ). Shu-Ting Shi. Deep Time-Stream Framework for Click-through Rate Prediction by Tracking Interest Evolution , AAAI (CCF-A), 出自南京大学和阿里合作。 ( UBR4CTR ). Jiarui Qin. User Behavior Retrieval for Click-Through Rate Prediction , SIGIR (CCF-A), 出自上海交通大学。 ( InterHAt ). Zeyu Li. Interpretable Click

清华大学教授:唐杰——深度分析:人工智能的下个十年

℡╲_俬逩灬. 提交于 2020-12-16 16:05:25
来源:图灵人工智能 唐杰教授从人工智能发展的历史开始,深入分析 人工智能近十年的发展 ,阐述了 人工智能在感知方面取得的重要成果 ,尤其提到 算法 是这个 感知时代 最重要、最具代表性的内容。 重点讲解了 BERT、ALBERT、MoCo2 等取得 快速进展的算法 。最后说到 下一波人工智能浪潮的兴起 ,就是实现 具有推理、可解释性、认知的人工智能 。 作者:唐杰教授 人工智能对社会和经济影响的日益凸显,各国政府也先后出台了对人工智能发展的政策,并将其上升到国家战略的高度。截至目前,包括美国、中国和欧盟在内的多国和地区颁布了国家层面的人工智能发展政策。 在这个时代背景下, 我们需要考虑人工智能未来十年会怎样发展。 首先,我们需要从人工智能的发展历史中找到灵感。 我们再深入分析 AI 近十年的发展,会看到一个重要的标志:人工智能在感知方面取得重要成果。人工智能在语音识别、文本识别、视频识别等方面已经超越了人类,我们可以说 AI 在感知方面已经逐渐接近人类的水平。从未来的趋势来看,人工智能将会有一个从感知到认知逐步发展的基本趋势,如下图所示: 首先,我们来看看 AI 在感知方面做了哪些事情。在感知方面,AlphaGo、无人驾驶、文本和图片之间的跨媒体计算等取得了快速发展。从宏观来看,算法是这个感知时代最重要、最具代表性的内容。如果把最近十年的重要算法进行归类,以深度学习为例进行展示的话

【计算机视觉】常用图像数据集

感情迁移 提交于 2020-12-16 12:59:04
图像数据集 模型需要好的数据才能训练出结果,本文总结了机器学习图像方面常用数据集。 MNIST Link 机器学习入门的标准数据集(Hello World!),10个类别,0-9 手写数字。包含了60,000 张 28x28 的二值训练图像,10,000 张 28x28 的二值测试图像。 最早的深度卷积网络 LeNet 便是针对 MNIST 数据集的,MNIST 数据集之所以是机器学习的 “Hello World”,是因为当前主流深度学习框架几乎无一例外将 MNIST 数据集的处理作为介绍及入门第一教程,其中 Tensorflow 关于 MNIST 的教程非常详细。 COCO Link COCO 是一个大规模的对象识别、分割以及 Captioning 数据集。具有以下特点: Object segmentation Recognition in context Superpixel stuff segmentation 330K images (>200K labeled) 1.5 million object instances 80 object categories 91 stuff categories 5 captions per image 250,000 people with keypoints 以 2014 年的数据为例,其包含两种文件类型(训练、验证文件均有)

最新综述:多标签学习的新趋势

别说谁变了你拦得住时间么 提交于 2020-12-16 03:26:43
这里给大家带来一篇武大刘威威老师、南理工沈肖波老师和 UTS Ivor W. Tsang 老师合作的 2020 年多标签最新的 Survey,我也有幸参与其中,负责了一部分工作。 论文链接: https://arxiv.org/abs/2011.11197 上半年在知乎上看到有朋友咨询多标签学习是否有新的 Survey,我搜索了一下,发现现有的多标签 Survey 基本在 2014 年之前,主要有以下几篇: 1. Tsoumakas 的《Multi-label classification: An overview》(2007) 2. 周志华老师的《A review on multi-label learning algorithms》(2013) 3. 一篇比较小众的,Gibaja 《Multi‐label learning: a review of the state of the art and ongoing research》2014 时过境迁,从 2012 年起,AI 领域已经发生了翻天覆地的变化,Deep Learning 已经占据绝对的主导地位,我们面对的问题越来越复杂,CV 和 NLP 朝着各自的方向前行。模型越来越强,我们面对的任务的也越来越复杂,其中,我们越来越多地需要考虑高度结构化的输出空间。多标签学习,作为一个传统的机器学习任务,近年来也拥抱变化