知识图谱

详解凸优化、图神经网络、强化学习、贝叶斯方法等四大主题

主宰稳场 提交于 2020-11-25 10:46:52
加入AI行业拿到高薪仅仅是职业生涯的开始。现阶段AI人才结构在不断升级,对AI人才的要求也不断升高,如果对自己没有很高的要求,其实很容易被快速发展的趋势所淘汰。 为了迎合时代的需求,我们去年推出了 《机器学习高端训练营》 班。这个训练营的目的很简单: 想培养更多高端的人才,帮助那些即将或者目前从事科研的朋友,同时帮助已从事AI行业的提高技术深度。 在本期训练营(第四期)中我们对内容做了大幅度的更新,一方面新增了对前沿主题的讲解如 图神经网络(GCN,GAT等) ,另外一方面对核心部分(如凸优化、强化学习)加大了对 理论层面上的深度 。 除此之外,也会包含 科 研方法论、元学习、解释性、Fair learning 等系列主题。 目前在全网上应该找不到类似体系化的课程。 课程仍然采用 全程直播 授课模式。 那什么样的人适合来参加高阶班呢? 从事AI行业多年,但技术上总感觉不够深入,感觉在技术上遇到了瓶颈; 停留在使用模型/工具上,很难基于业务场景来提出新的模型; 对于机器学习背后的优化理论、前沿的技术不够深入; 计划从事尖端的科研、研究工作、申请AI领域研究生、博士生; 打算进入最顶尖的AI公司比如Google,Facebook,Amazon, 阿里,头条等; 读ICML,IJCAI等会议文章比较吃力,似懂非懂感觉,无法把每个细节理解透; 01 课程大纲 第一部分:凸优化与机器学习

AntV 图可视分析解决方案,来啦~

試著忘記壹切 提交于 2020-11-25 09:48:35
相信大多数小伙伴们都是带着疑问进来的:什么是 AntV ?什么是图可视分析?什么是解决方案?解决方案都有啥?为什么要写它?哈哈哈,小伙伴们稍安勿躁,此篇文章就是来回答这些问题的~ 什么是 AntV? AntV 是蚂蚁集团全新一代数据可视化解决方案。数据可视化呢,就是数据通过某种技术手段,直观展示在人们眼前。这种技术就是可视化技术,对于常规的统计数据,我们有 AntV 的 G2/G2Plot,把它们转化为折柱饼图展示(图左);对于地理位置信息,我们有 AntV 的 L7,将它们展示在地图上(图中);对于关系数据呢,我们有 AntV 的 G6,将它们展示在画布上(图右) 什么是图可视分析? 如上右图所示,关系数据也被称为图数据,将关系数据可视化出来,即为图可视化,在图可视化的基础上,附加交互,布局,算法,分析方案等,完成一个分析任务,即为图可视分析。 什么是解决方案? 顾名思义是解决问题的方案,方案的设计往往遵循 SCQA 模型: Situation(背景),Complication(冲突),Question(问题),Answer(答案)。因此,解决方案以解决问题为导向,深入分析问题发生的背景,其中产生冲突的痛点问题,以及如何解决。 解决方案都有啥? AntV 可视分析解决方案,是一份针对图可视分析 需求方(普通用户,图领域分析师) 与 实现方(图分析业务的产品,设计,前端同学

通过金融文档结构化实践,挖掘海量非结构化数据的应用落地潜力

微笑、不失礼 提交于 2020-11-23 05:19:30
本文内容整理自 PaperWeekly 和 biendata 在 B 站组织的直播回顾,点击文末 阅读原文 即可跳转至 B 站收看本次分享完整视频录像,如需嘉宾课件,请在 PaperWeekly 公众号回复关键词 课件下载 获取下载链接。 作者简介: 杨慧宇,现达观数据高级技术专家,负责 NLP,RPA 等技术在金融行业的实践应用。 随着技术的发展和社会的变革,金融行业在近些年逐渐暴露了各种危机。 第一点,金融行业虽然在大众印象中是暴利行业,但实际上行业年均复合增长率已经呈现出下降的趋势,并且面临着诸如即将上市的蚂蚁集团、微信支付以及像陆金所等互联网金融公司所带来的影响和竞争。 第二点是人力成本,中国的人口红利在逐渐消失,劳动力成本也在不断上升,尤其像新时代的 90 后员工不愿意天天进行重复性的工作,希望能够在工作中体现出自己独一无二的价值,这一点实际上也是很大的痛点。 第三点,金融行业领域监管越来越严格。证监会、交易所都在不断地发布新的监管规则,而金融企业内部的合规、风控这些机构就要随之进行更新,这些都离不开信息技术的支持。随着监管的越来越严格,企业内部所造成的文书工作的增加也会带来很多工作上的负担,比如要进行很多信息上的披露,上市公司要发布各种各样事件的曝光,这些都会给大家带来工作上的负担。但是因为文件越来越多,人工处理文本的能力,却无法得到相应的提升,这样就会造成工作上的疏忽

论文浅尝

[亡魂溺海] 提交于 2020-11-17 03:55:17
论文笔记整理:谭亦鸣,东南大学博士生。 来源:WWW 2020 链接: https://dl.acm.org/doi/pdf/10.1145/3366423.3380114 概述 这篇论文关注的任务是:基于给定文本的“多跳问题生成”(多关系问题)。 作者提出的方法大致可以描述为: 1.基于实体的上下文关系,将分布于文本中的实体融合为一个实体图; 2.通过证据关系及类型,从实体图中抽取子图,构成推理链(同时也获得对应的局部文本信息); 3.基于推理链,构建了一个整合的“生成-评价”网络模型,实现多跳问题的生成。 其中,作者将生成过程(生成器)设计为一个强化了问题句法和语义合理性的seq2seq模型; 在评价方面,作者通过建立一个混合监督学习与强化学习的评价机制,同时用于生成模型的优化。 本工作使用的数据集为:HotpotQA 问题生成方法的主要作用是构建伪训练标注集用于弥补数据集不足的问题。 背景与动机 本工作主要关联的一个NLP是:多跳机器阅读理解:即使机器完全理解文本语义,并回答一般的问题(尤其是需要学习推理)。因此这里的问题生成主要基于包含多实体/关系的文本数据。 从现有的问题生成方法上看: 1. 基于模板的方法受限于手写模板对于问题类型的覆盖能力; 2. 目前的 seq2seq 问题生成方法无法捕获和合成多个句子之间的证据(evidence,本质上,连续的relation)。

蚂蚁集团-算法专家/高级专家杭州/北京/上海

假如想象 提交于 2020-11-13 13:32:28
面试速度快!HC充足! 蚂蚁集团-算法专家/高级专家杭州/北京/上海 职位要求: 1、 面向花呗、借呗、网商银行、芝麻信用、财富平台实际业务应用,开发基于大数据、大规模分布式集群的传统机器学习建模和深度学习建模; 2、 算法产品化建设,参与模型在线实时计算框架开发落地; 3、 算法研究和创新,研究成果与业务场景相结合; 4、 特征工程开发及应用。 职位描述 1、 计算机、数学、统计学、软件工程、电子信息等相关专业背景,硕士及以上学历; 2、 在智能营销、搜索、推荐、广告、知识图谱、用户画像、自然语言处理等方向有两年以上实际工作经验,对上述方向至少其中之一有深入研究; 3、 精通传统机器学习算法、深度学习算法建模,深入了解算法优化方法,具备独立编码建模能力; 4、 熟悉至少一种主流深度学习训练框架(Keras/Tensorflow/PyTorch); 5、 熟练使用C/C++、Python、Java中的至少一种编程语言,熟悉多线程编程,内存管理,设计模式,熟悉Linux开发环境; 6、 熟悉Hadoop,MapReduce等分布式并行处理技术,具备 Storm、Flink、Spark等大数据开发实施经验,熟练Hive SQL语言。 蚂蚁集团-内容推荐算法 我们是蚂蚁金融数字金融线的内容算法团队,负责蚂蚁财富、保险、微贷等金融场景中等内容分发、内容带货和内容智能生产算法。在这里

手把手教你薅羊毛,1 元体验业内领先AI技术!

£可爱£侵袭症+ 提交于 2020-11-11 19:50:43
双十一的套路早已看透,为何你还甘心成为“尾款人”在商家的层层套路中痛并快乐着。不要急~百度大脑 AI 产品双十一年终狂欢活动钜惠开启! 无需尾款,没有套路,只有硬核低价。 百度大脑人脸识别技术系列产品 1.7 折限时抢购,实名认证首单一元购,适用于金融核验、线上实名认证、考勤通行管理、安全防控等场景。 百度大脑语音识别技术采用领先国际的流式端到端语音语言一体化建模方法识别,提供高度拟人的语音合成服务。应用场景丰富,覆盖泛阅读娱乐、教育培训、交通物流、智能硬件领域,让语音大有所为。 百度大脑语言与知识技术凝聚百度在自然语言处理、知识图谱领域的十年技术累积和产业实践。广泛应用于新闻媒体、泛互联网、舆情口碑分析、交通物流等领域。 仅需 1 元就可体验业内领先的 AI 技术。 百度大脑 EasyDL 零门槛 AI 开放平台,提供一站式 AI 服务、高精度训练效果、多种灵活部署方式,不仅赋能工业制造领域,在生产安全、零售快消、智能硬件等领域也有广泛应用,目前已超过 70 万企业用户利用 EasyDL 平台落地 AI 应用。 百度大脑文字识别技术提供多种场景下精准的图像文字识别技术服务,超高识别准确率可以让您的应用看图识字,而且提供 50+ 产品全线免费体验~ ‍ 百度大脑内容审核技术一站式解决文章内容、用户评论审核问题,为企业内容安全保驾护航,应用场景丰富,覆盖视频直播、社区社交、教育培训

三、Neo4j查询语言Cypher相关命令介绍

泄露秘密 提交于 2020-11-10 18:44:44
上一篇文章我们介绍的图数据库Neo4j,这篇文章我们来看一下它的查询语言——Cypher。Cypher是一种声明式图查询语言,表达高效查询和更新图数据库。关注专栏 《知识图谱系列》 了解更多相关知识~ 目录 一、简介 1.1 常用的命令和函数 1.2 数据类型 二、常用的命令 2.1 CREATE命令 2.1.1 创建没有属性的节点 2.1.2 创建具有属性的节点 2.2 MATCH命令 2.3 RETURN命令 2.4 关系 2.4.1 创建没有属性的关系 2.4.2 创建有属性的关系 2.5 WHERE命令 2.5.1 布尔运算符 2.5.2 比较运算符 2.5.3 使用WHERE子句创建关系 2.6 DELETE命令 2.6.1 删除节点 2.6.2 删除节点和关系 2.7 REMOVE命令 2.8 SET命令 2.9 ORDER BY 命令 2.10 UNION命令 2.11 LIMIT和SKIP命令 2.12 MERGE命令 2.13 NULL值 2.14 IN命令 一、简介 1.1 常用的命令和函数 Cypher查询语言也叫做CQL,它常用的命令如下: CQL常用的函数如下所示: 1.2 数据类型 CQL的数据类型跟Java语言类似,它们用于定义节点或关系的属性。 二、常用的命令 2.1 CREATE命令 2.1.1 创建没有属性的节点 语法如下: CREATE (

5G行业的四大神兽

老子叫甜甜 提交于 2020-11-07 00:46:41
作者 | 中国软件网 墨马 校对 | 中国软件网 赵满满 物理学上有四大神兽。 拉普拉斯兽、薛定谔的猫、芝诺的乌龟和麦克斯韦妖,分别对应着经典力学、量子力学、微积分和热力学第2定律。 国内5G行业的应用场景也有四大神兽。 远程教育、远程医疗、车路协同和智慧工厂。 物理学上,拉普拉斯兽能推演万物;薛定谔的猫能超越生死;芝诺的乌龟能缩地成寸;麦克斯韦妖能操控世界。 5G行业,远程教育能给未来教育巨大想象空间;远程医疗能保证全息影像信息的大数据传输;车路协同能提升智能交通效率和安全;智慧工厂则是未来制造业创新发展的主战场,能给传统工厂带来新一轮产业革命。 国内5G行业应用场景的四大神兽,会给企图进化成“神”的人类,带来什么? 01 远程教育vs 拉普拉斯兽 19世纪初,整个物理界晴空万里。 牛顿带来万物光明,匍匐在老爵爷门下的拉普拉斯宣称,当下的客观世界是过去的果和未来的因。 这就是大名鼎鼎的“谛听神兽”拉普拉斯兽,能明察大道,善推演万物。 它神通广大,无所不知,只要动动手指和眼睛,记录下某一刻宇宙中每个原子确切的位置和动量,就能用牛顿简洁公式,瞬间算出宇宙的过去与未来。 同样,远程教育的出现,也印证了互联网的神通广大,给未来教育巨大想象空间。 疫情期间的“停课不停学”,把远程教育推到了风口浪尖,也让教育信息化迈上了一个新台阶。经过疫情洗礼后的远程教育,已经搭上了“新基建”的东风

开放数字世界中的复杂图数据挑战 —— 以教育与开源场景为例

我的未来我决定 提交于 2020-11-06 23:58:16
摘要: 开源开放的数字世界开始成为时代的潮流,云原生、数据中台、智能PRA开始成为数字世界中的新一代中流砥柱。随着第四范式的普遍流行,各个行业中的数字化转型都会带了海量的具有无限关联的复杂图数据。本报告将以教育与开源两个场景为例,说明其背后的具有普适性规律的数据网络这一统一模型,并通过实际案例来说明这些数据网络的构建及其上层的典型应用,进而归纳出当下复杂图数据场景中的若干关键挑战,呼吁更多的专家学者们加入到这个前沿的研究领域中来。 本文为数据学院学术沙龙第8期的主题演讲,主题为: 走向复杂图数据科学时代 。 一、开篇:走向复杂图数据科学时代 观察数字化时代下各种复杂信息系统得到的大数据,直接反映的往往是一个个孤立的 数据 和分散的 链接 ,但这些反映相互关系的链接整合起来就是一张 图 或 网络 。例如,基因数据构成基因网络,万维网数据反映出社会网络,GitHub开发者行为数据则反映了 社会代码协作网络 。数据的共性、网络的整体特征隐藏在数据网络中,往往以复杂关联的数据网络这样一种独特的形式存在,因此要理解这些图数据就要对其后面的复杂数据网络进行深入分析,催生出 复杂图数据科学 这一新兴研究领域。随着图数据的越来越普遍,数据科学所面临的科学问题本质上可能就是 图数据网络 科学问题, 复杂图数据分析 应该是数据科学的重要基石。

二、图形数据库Neo4j的简介与安装

谁都会走 提交于 2020-11-06 23:57:27
今天来说一下图形数据库——Neo4j。它由Neo Technology开发的开源图数据库,该公司从2000年起就开始研发图数据库,目前Neo4j已经成为领先的图数据库产品。思科、惠普、德意志等跨国企业均成为其客户。知识图谱系列的文章都将收录在我的个人专栏 《知识图谱系列》 中,欢迎大家关注~ 目录 一、Neo4j简介 1.1 简介 1.2 图形数据结构 二、Neo4j安装 2.1 Linux下安装Neo4j 2.1.1 检查jdk 2.1.2 下载Neo4j 2.1.3 上传并解压 2.1.4 配置环境变量 2.1.5 修改配置文件 2.1.6 测试 2.2 Windows下安装Neo4j 三、简单使用 一、Neo4j简介 1.1 简介 Neo4j是一个高性能的,NOSQL图形数据库,它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的所有特性。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态的表中——但是他们可以享受到具备完全的事务特性、企业级的数据库的所有好处。 ——摘自《百度百科》 Neo4j的特点:1、直观的图模型存储。2、完全支持ACID事务。3、基于磁盘的持久存储。4