机器学习

机器学习画图模板ML Visuals更新

元气小坏坏 提交于 2021-01-04 09:34:51
去年推荐的机器学习画图模板ML Visuals前几天已经更新,ML Visuals 现在包含了 100 多个可用的自定义图形,可以方便我们在任何论文、博客、PPT 中使用这些资源。伸手党福利好吧! 我们来看一下几个图,秀一下: 项目地址: https://github.com/dair-ai/ml-visuals ​ github.com 赶紧fork+star吧。 机器学习算法-自然语言处理交流群 已建立机器学习算-自然语言处理微信交流群!想要进交流群进行学习的同学,可以直接加我的微信号: HIT_NLP 。加的时候备注一下: 知乎+学校+昵称 (不加备注不会接受同意,望谅解) ,即可。然后我们就可以拉你进群了。群里已经有非得多国内外高校同学,交流氛围非常好。 推荐阅读 谷歌最新28页高效 Transformer 模型综述 30页少样本学习综述!Learning from Very Few Samples Papers with Code 2020 全年回顾 最新14页《图神经网络可解释性》综述论文 陶大程等人编写!最新41页深度学习理论综述 使用PyTorch时,最常见的4个错误 加拿大蒙特利尔大学助理教授刘邦招收2021/2022年博士生 【EMNLP2020】基于动态图交互网络的多意图口语语言理解框架 一文搞懂 PyTorch 内部机制 AAAI 2021论文接收列表放出!

NLP生成任务痛点!58页generation评价综述

主宰稳场 提交于 2021-01-04 09:34:34
作者单位:微软,华盛顿大学 (jianfeng gao等人) 论文 Evaluation of Text Generation: A Survey 注:文末附【深度学习与自然语言处理】交流群 NLP领域的生成问题一直就是一个非常火的topic,衍生出了各种细化的问题,如摘要,对话生成,标题生成,代码生成等,任何一个都是一堆研究者关注的问题,但是评价始终是阻挠该方向真正突破的痛点。到底是BLEU好,还是ROUGE好,到最后还是不如人工评价好,难顶啊! jianfeng gao等人对生成评价问题做了一个58页的详细综述,对这个问题的发展进程,未来趋势做了详细的看法,对这个方向感兴趣的可以了解,这个方向是一个可以出Best paper的方向,奥利给! 机器学习算法-自然语言处理交流群 已建立机器学习算-自然语言处理微信交流群!想要进交流群进行学习的同学,可以直接加我的微信号: HIT_NLP 。加的时候备注一下: 知乎+学校+昵称 (不加备注不会接受同意,望谅解) ,即可。然后我们就可以拉你进群了。群里已经有非得多国内外高校同学,交流氛围非常好。 推荐阅读 机器学习画图模板ML Visuals更新 谷歌最新28页高效 Transformer 模型综述 Papers with Code 2020 全年回顾 最新14页《图神经网络可解释性》综述论文 陶大程等人编写!最新41页深度学习理论综述

未来已来,腾讯AI计算网络

a 夏天 提交于 2021-01-04 08:41:18
欢迎大家前往 腾讯云+社区 ,获取更多腾讯海量技术实践干货哦~ 作者:由 鹅厂网事 发表在 云+社区 "鹅厂网事"由深圳市腾讯计算机系统有限公司技术工程事业群网络平台部运营,我们希望与业界各位志同道合的伙伴交流切磋最新的网络、服务器行业动态信息,同时分享腾讯在网络与服务器领域,规划、运营、研发、服务等层面的实战干货,期待与您的共同成长。 毫无疑问,人工智能是近年IT界最火的研究方向,特别在2016年Alpha GO这一标志性事件后,国内外科技巨头持续加大对人工智能的投入。目前,人工智能的主要方向如图像识别、语音识别等等都是通过机器学习的方式,借助强大的计算平台对海量数据进行分析、计算,随着数据量的增长,单机性能已逐渐无法满足计算的需求,需要使用高性能计算(HPC, High Performance Computing)集群来进一步提升计算能力。 HPC集群是将多个计算节点组织在一起协同计算的分布式系统,它一般使用iWARP/RoCE/IB等RDMA(Remote Direct Memory Access)技术来完成计算节点内存间数据的快速交换。如图1所示,RDMA网卡可以从发送节点地址空间中取出数据,直接传送到接收节点的地址空间中,整个交互过程无需内核内存参与,从而大大降低了服务器侧的处理时延。同时,网络作为HPC集群的一部分,任何传输阻滞都会造成计算资源的浪费

金融反欺诈模型----项目实战--机器学习

被刻印的时光 ゝ 提交于 2021-01-04 08:06:23
机器学习:从源数据清洗到特征工程建立谈金融反欺诈模型训练 本文旨在通过一个完整的实战例子,演示从源数据清洗到特征工程建立,再到模型训练,以及模型验证和评估的一个机器学习的完整流程。由于初识机器学习,会比较多的困惑,希望通过借助这个实战的例子,可以帮助大家对机器学习了一个初步的认识。 本文旨在通过一个完整的实战例子,演示从源数据清洗到特征工程建立,再到模型训练,以及模型验证和评估的一个 机器学习 的完整流程。由于初识机器学习,会比较多的困惑,希望通过借助这个实战的例子,可以帮助大家对机器学习了一个初步的认识。 【数据来源】 本文的数据来源于Lending Club网站的公开数据,数据集为自LendingClub平台发放的2016年Q3的总计99122条贷款记录。 Lending Club是美国最大的P2P网贷交易平台,利用网络技术直接连接了个人投资者和个人借贷者,缩短资金流通的细节,绕过传统的大银行等金融机构,使得投资者和借贷者都能得到更多实惠。对于投资者来说,可以获得更好的回报;对于借贷者来说,则可以获得相对较低的贷款利率。 在借贷行业中,投资者向借贷者提供贷款以获取利息。如果借贷者顺利偿还贷款,投资者则获得利息收益。如果借贷者无法偿还贷款,投资者则损失贷款本金。因此,对于投资者来说,需要预测借贷者无法偿还贷款的风险,最大程度地避免投资损失,最大程度地实现投资回报。 【实施步骤】

Golem 项目白皮书

Deadly 提交于 2021-01-03 16:46:20
Golem项目概览宏大愿景和核心特征 Golem是第一个真正去中心的全球算力市场。Golem结合灵活的开发工具,帮助开发者 发布软件并赚钱,进而改变了算力任务的组织和执行方式。通过实现去中心微服务和 异步任务执行,Golem致力于成为建设未来互联网的基石。通过大幅降低计算价格,复 杂的应用,如CGI渲染,科学计算,机器学习(人工智能)将惠及每个人。 通过P2P网络连接电脑,使应用所有者和个体用户(算力“请求方”)可以从其他用户租 用算力(算力“供应商”)。这些算力资源可以完成对计算时间和计算能力有一定要求 的计算任务。在当下,算力资源被中心化云服务商把控,受制于封闭网络,外部支付 系统,和死板的运营模式。Golem还有一个核心内置的特性—基于以太的支付转账系 统,可以实现算力买家(请求方),卖家(供应商),及软件开发者之间的直接支付。 Golem作为去中心算力市场的支柱功能可以看作为是一种基建即服务(Iaas),也是一 种平台即服务(PaaS)。通过集成一些专属软件后,Golem会展现其真正的潜力。任何 有兴趣的第三方可以在Golem基础上自行创建和部署软件并通过应用注册市场进行发 布。在转账支付框架下,开发者可扩展和自定义支付方式,实现独特的赚钱方式。 Golem生态系统 Golem的商业应用可以归结为这样的现实,因为近年来的科技进步,算力资源市场可以根据全 新理论重新架构

超炫酷动态排序图、视频,我都帮你用Python实现了

五迷三道 提交于 2021-01-03 16:25:44
↑↑↑点击上方 蓝字 ,回复 资料 ,10个G的惊喜 先看一下最终效果,这是一张Python生成的GIF,还可以输出MP4格式的视频,到底怎么做的? 且听我娓娓道来——数据集、代码、详细做法全部讲清楚。 数据集获取方式 大家可以去国家统计局的网站,搜索想要的数据,比如本例中我们需要的是人口数据,如下图所示,下载数据即可,我比较喜欢csv格式。 把数据整理一下,如下图的格式: 核心函数 代码部分大家请看下面的的截图,这里我们只看一下核心函数的主要参数,非常重要!!! 函数FuncAnimation(fig,func,frames,init_func,interval,blit)是绘制动图的主要函数,其参数如下: fig 绘制动图的画布名称 func自定义动画函数,即下边程序定义的函数update frames动画长度,一次循环包含的帧数,在函数运行时,其值会传递给函数update(n)的形参“n” init_func自定义开始帧,即传入刚定义的函数init,初始化函数 interval更新频率,以ms计 blit选择更新所有点,还是仅更新产生变化的点。应选择True,但mac用户请选择False,否则无法显示 其实原理就是生成每个年份的柱状图,然后用FuncAnimation绘制GIF 配置视频 大家运行上面代码的时候还是会出错的,报错信息:RuntimeError:

Feature selection using SelectFromModel

眉间皱痕 提交于 2021-01-03 14:23:25
SelectFromModel sklearn在Feature selection模块中内置了一个SelectFromModel,该模型可以通过Model本身给出的指标对特征进行选择,其作用与其名字高度一致,select (feature) from model。 SelectFromModel 是一个通用转换器,其需要的Model只需要带有 conef_ 或者 feature_importances 属性,那么就可以作为SelectFromModel的Model来使用. 如果相关的 coef_ 或者 featureimportances 属性值低于预先设置的阈值,这些特征将会被认为不重要并且移除掉。除了指定数值上的阈值之外,还可以通过给定字符串参数来使用内置的启发式方法找到一个合适的阈值。可以使用的启发式方法有 mean 、 median 以及使用浮点数乘以这些(例如,0.1*mean )。 根据基础学习的不同,在estimator中有两种选择方式 第一种是基于L1的特征选择,使用L1正则化的线性模型会得到稀疏解,当目标是降低维度的时候,可以使用sklearn中的给予L1正则化的线性模型,比如LinearSVC,逻辑回归,或者Lasso。但是要注意的是:在 SVM 和逻辑回归中,参数 C 是用来控制稀疏性的:小的 C 会导致少的特征被选择。使用 Lasso,alpha 的值越大

即将改变世界的力量:2021年最具影响力的科技预测

谁都会走 提交于 2021-01-03 10:58:29
注定将在人类历史上留下浓墨重彩一笔的2020年,不知不觉间已近尾声。许多在今年经历了疫情冲击和经济下行的企业,早已将期待的目光投向了即将到来的2021年。 而在2020年抗击新冠疫情、推动经济复苏的过程中,科技展现出了无以伦比的巨大力量。那么在2021年,有哪些重要的技术值得我们持续关注?又有哪些行业将会因为科技的持续发展进步而获益匪浅? 面对以上问题,来自全球数百家企业的CIO和CTO给出了他们的回答。 IEEE年度调研报告:AI和机器学习、5G及IoT技术将成为2021年最重要的技术 近日,全球最大的专业技术组织IEEE(Institute of Electrical and Electronics Engineers,电气与电子工程师协会)发布了一项调研报告《IEEE全球CIO、CTO访问调研:2021年的机遇和挑战,以及关键的科技趋势》(以下简称《IEEE全球CIO、CTO访问调研》)。 这项在美国、英国、中国、印度、巴西等五个国家开展的调研活动,共计对350名企业CIO(首席信息官)和CTO(首席技术官)进行了访问。访问话题主要聚焦于全球新冠疫情背景下新兴技术的应用,以及对2021年最重要的科技、受科技影响最大的行业等话题进行了探讨。 据该调研报告显示:人工智能与机器学习、5G与物联网技术,将会成为2021年最重要的科技。 人工智能与机器学习在后疫情时代日益发挥重要作用

黑马Python视频教程免费分享(基础班+就业班,全套完整版)

别来无恙 提交于 2021-01-03 07:34:59
黑马Python基础班+就业班全套视频教程分享给大家,希望对正在学习Python或者打算学习Python的朋友有帮助哈~ 话不多说,直接上图: ( 文末附百度云链接 ) 一、Python基础班 1. Linux基础 2. Python基础 3. 面向对象 4. 飞机大战项目 二、Python就业班 三、本套黑马Python视频教程下载 百度云链接: https://pan.baidu.com/s/1-BvsyqiRYJmBfMZSxRLP0Q 提取码: w8ya 注意 : 如果上面的百度云链接失效了的话,大家可以关注我的微信公众号“Python联盟”,然后回复“007”也可以获取的哈~ 四、拓展 简单是Python编程的首要原则,当有选择的时候,应该选择一个简单的。Python没有什么要做的,这意味着它不仅是可能的,而且非常简单地以巴洛克风格设计程序,只为解决简单的问题。因此,编程应该记住,代码的简单性最容易丢失,但最难恢复。 这意味着,当您可以选择要表达的函数时,不需要引入额外的类;避免使用强大的第三方库通常有助于您为紧迫的问题场景设计更合适的短函数。但它的根本意图是让你减少对未来的计算,专注于解决手头的问题。以简单和优雅为指导的代码比希望包含所有未来变量的代码更容易在将来进行修改。 作为一种动态类型语言,Python非常灵活。这意味着对于如何构建特性没有严格的规则

云原生Meetup:基于 WeDataSphere Prophecis 与 KubeSphere 构建云原生机器学习平台

倾然丶 夕夏残阳落幕 提交于 2021-01-02 14:03:34
“大规模机器学习平台的技术基础已经逐渐完善,与大数据计算相关的框架也越来越多,这些奠定了大规模机器学习平台的技术基础。 Prophecis 是微众银行大数据平台团队开发的一站式机器学习平台,提供多种模型训练调试方式,集成多种开源机器学习框架,具备机器学习计算集群的多租户管理能力,基于 KubeSphere 提供生产环境全栈化容器部署与管理服务。” Prophecis现已开源,扫码可以访问项目Github地址: 本文分享自微信公众号 - WeDataSphere(gh_273e85fce73b)。 如有侵权,请联系 support@oschina.cn 删除。 本文参与“ OSC源创计划 ”,欢迎正在阅读的你也加入,一起分享。 来源: oschina 链接: https://my.oschina.net/u/3334446/blog/4810867