机器学习

2019.1.22 文献阅读日记,内容理解篇 :用于无监督医疗检测的自动心电图噪声监测和分类系统《Automated ECG Noise Detection and Classification...

☆樱花仙子☆ 提交于 2020-11-19 07:46:00
以下是对文章内容的理解,在这里做个笔记,便于回顾,没有什么技术含量,就是一个学习日记笔记,嘻嘻。 文章内容的思路: 一、框架包括: 1.改进的集合经验模式分解 modified ensemble empirical mode decomposition (CEEMD),CEEMD全称为 complete ensemble empirical mode decomposition,完全集合经验模式分解。 2.短期时间特征提取 3.基于决策规则的噪声噪声监测和分类 二、框架的处理步骤: 1.首先使用修改的CEEMD算法分解ECG信号,区分ECG分量与噪声和伪像。 2.根据提取的高频HF和低频LF信号计算诸如最大绝对幅度,零交叉数,和自相关函数的局部最大峰值幅度的短期时间特征。 3.提出了一种基于决策规则的算法,用于检测噪声的存在,并将处理后的ECG信号分为六个信号组: (1)无噪声心电图 noise-free ECG, (2)基线漂移心电图 ECG+BW, (3)肌肉伪迹心电图 ECG+MA, (4)电力线干扰心电图 ECG+PLI (5)基线漂移电力线干扰心电图 ECG+BW+PLI (6)基线漂移 肌肉伪迹心电图ECG+BW+MA 该框架简化了单个和组合ECG噪声的检测和分类流程,如下图(文献原图): 上图说明了该框架的主要组成部分,用于检测和分类的单一和组合心电图的声音

目标检测论文解读之RCNN

送分小仙女□ 提交于 2020-11-19 05:22:24
前言 最近准备开始认真的梳理一下目标检测的相关算法,组合成一个目标检测算法系列。之前看到了一张特别好的目标检测算法分类的甘特图,但忘记是哪里的了,要是原始出处请提醒我标注。 我也会按照这个图来讲解目标检测算法。 背景介绍 什么是目标检测 所谓目标检测就是在一张图像中找到我们关注的目标,并确定它的类别和位置,这是计算机视觉领域最核心的问题之一。由于各类目标不同的外观,颜色,大小以及在成像时光照,遮挡等具有挑战性的问题,目标检测一直处于不断的优化和研究中。 目标检测算法分类 上面那张甘特图已经说明了目标检测算法主要分为两类,即: Two Stage目标检测算法。这类算法都是先进行区域候选框生成,就是找到一个可能包含物体的预选框,再通过卷积神经网络进行分类和回归修正,常见算法有R-CNN,SPP-Net,Fast-RCNN,Faster-RCNN和R-FCN等。 One Stage目标检测算法。这类算法不使用候选框生成,直接在网络中提取特征来预测物体的分类和位置。常见的One-Stage算法有:YOLO系列,SSD,RetinaNet。 RCNN算法 贡献 RCNN是第一个使用卷积神经网络来对目标候选框提取特征的目标检测算法。同时,RCNN使用了微调(finetune)的技术,使用大数据集上训练好的分类模型的前几层做backbone,进行更有效的特征提取。 RCNN总览 看下图: 首先

大佬云集!百度NLP-ERNIE团队招聘算法小伙伴啦!

戏子无情 提交于 2020-11-19 02:52:16
来百度NLP-文心(ERNIE)团队做 最强 的预训练,发 最好 的 paper,支持 最核心 的业务(搜索、广告),做三项全能的 NLP 弄潮儿。 我们是负责百度NLP语义理解技术与平台文心(ERNIE) 研发团队。 ERNIE 致力于预训练语义理解技术研发与应用,提升NLP任务效果,深度支持百度核心业务线。 近一年来,文心( ERNIE )取得多项荣誉: 2019年12月,我们首次突破 90 分大关登顶通用语言理解评估基准GLUE; 2020年1月,我们提出的预训练语言生成技术 ERNIE -GEN 在多个语言生成任务取得 SOTA; 2020年3月,我们在 SemEval-2020 上取得了5项世界冠军; 2020年7月,我们提出的多模态语义理解技术 ERNIE -ViL登顶视觉常识推理权威榜单VCR; 2020年7月9日,我们荣获2020世界人工智能大会最高奖。 在这里,你可以利用中国自主研发的 飞桨 ( PaddlePaddle )深度学习平台,进行高效的多机多卡训练,千亿级别的数据等待你的挖掘。这里有良好的团队氛围和资深、耐心的指导人带你探索新一代NLP技术。在这里,我们在使用业界领先的预训练语言理解技术提升真实工业场景的应用效果。 现在,我们在招人。 欢迎应届毕业 1~2 年的同学(社招)投递简历 (校招同学也可以转简历喔), base 北京 。 工作职责

《失控》摘录与读后感

大兔子大兔子 提交于 2020-11-19 02:42:53
  书名:失控   作者:凯文·凯利   来源:长清图书馆   阅读用时:176天   正文: 之前在网上看到张经理推荐这本书,然后就借了,拿到手时候还惊叹“这本比《逻辑学》还厚呢”,但还是硬着头皮看完了。本文虽说叫读后感,但大部分都是对原文的摘录,觉得有用的一些句子都抄下来了。 这本书讲的是自然和机器的运行之道,向前追溯到了宇宙大爆炸之后的混沌状态,向后写到了目前流行的并行计算和一些先进的机器学习算法,其实书里面有些内容已经涉及到现在如火如荼的深度学习了,但是本书写于1994年。不得不说这本书的确很好,对复杂系统和自组织系统的设计研发有重要指导意义。而我一直想研究的是人的自主意识、认知和记忆的形成与运行方式,所以这本书的内容给了我很大启发,感谢作者的创作和译者的工作,这群译者也是一群有趣的人。 原文摘录: 1、这些过往经历的主人把它们当作是零碎的半记忆片段,带有生硬的“拼凑”色彩,漫无目的的飘荡, 2、记忆在某种程度上是与时间和空间捆绑在一起的,而与时间和空间捆绑在一起则正是真是的一种定义, 3、记忆必须以某种方式进行组织,以尽可能容纳超过其存储空间的想法, 4、他不可能有一个架子来存放过去所有的念头,也无法为将来可能出现的每一个想法预留位置, 5、脑海重现经历,实际上对其重新进行了组合,并且每次回忆起来都会重新组合, 6、相关联;特征映像;其所具备的一般性质, 7

VS Code有哪些奇技淫巧?

大城市里の小女人 提交于 2020-11-18 18:22:48
不同的开发工具,都能俘获各自的一批忠实的用户和支持者。 VS Code、Eclipse、IDEA、atom....到底哪一款开发工具更好?一直存在这样一个争论。 VS Code这几年作为一款热门的开发工具,逐渐受到更多开发者的欢迎。 它之所以如此受欢迎,和它不断的创新突破是离不开的。 即便如此,还是有很多用户觉得VS Code不好用。 这一点不难理解,让一个用过工具A的同学突然迁移到工具B,哪怕它已经非常完美,但是依然可以找出非常多可挑剔的点。 这里面一是由于使用习惯造成的原因,还有就是开发者对这款新工具不够了解。 但是有一点应该很清楚,作为当下热门的开发工具,很多其他开发工具具备的优秀功能,VS Code同样支持。 为了让大家能够更加清晰的了解VS Code,今天就来给大家介绍一些它的高效用法。 集成终端 在VS Code中,能够直接打开终端。这使得,无论是调试代码,还是执行终端命令行工具,都无需切换窗口,避免一些时间的浪费。 要想使用VS Code终端,需要首先安装它。安装步骤非常简单,只需要如下几步: 启动VS Code shift+cmd+p 打开命令面板,输入 shell command 点击确认 这样,就完成了VS Code集成终端的开发。 批量重命名 名称,在开发过程中占据着至关重要的地位。函数名、类名、变量名....在编写代码过程中经常会和各种名称打交道。

机器学习中的 Shapley 值怎么理解?

爱⌒轻易说出口 提交于 2020-11-18 10:43:37
我第一次听说 Shapley 值是在学习模型可解释性的时候。我知道了 SHAP,它是一个框架,可以更好地理解为什么机器学习模型会那样运行。事实证明,Shapley 值已经存在了一段时间,它们最早起源于 1953 年的博弈论领域,目的是解决以下情况: 一群拥有不同技能的参与者为了集体奖励而相互合作。那么,如何在小组中公平分配奖励? 当一个「旧」概念被应用到另一个领域,如机器学习,关于它是如何获得新的应用是非常有趣的。在机器学习中,参与者是你输入的特征,而集体支出是模型预测。在这种情况中,Shapley 值用于计算每个单独的特征对模型输出的贡献。 如何计算 Shapley 值?大多数时候,你倾向于在文献中看到这个等式: 让我们把它分解一下。在一个联盟游戏(前面描述的场景)中,我们有一组 N 个玩家。我们还有一个函数 v,它给出了这些参与者的任何子集的值,也就是说,S 是 N 的子集,然后 v(S)给出了该子集的值。因此,对于一个联合博弈(N,v),我们可以使用这个方程来计算玩家 i 的贡献,即 Shapley 值。 现在我不知道你会怎么想,但当我第一次遇到这个等式时,我的第一反应如下图: 我很难理解为什么它看起来是这样的。我花了一些时间研究之后,终于开始有了一些理解。所以,我们开始吧! 好吧,我们要做的第一件事是重写初始方程: 乍一看,这个公式似乎并没有变容易,但请不要着急。很快

我的第一个 Kaggle 比赛学习

ぃ、小莉子 提交于 2020-11-18 04:58:32
背景 Titanic: Machine Learning from Disaster - Kaggle 2 年前就被推荐照着这个比赛做一下,结果我打开这个页面便蒙了,完全不知道该如何下手。 两年后,再次打开这个页面,看到清清楚楚的 Titanic Tutorial - Kaggle ,完全傻瓜式的照着做就能做下来。当年是什么蒙蔽了我的眼睛~ Target use machine learning to create a model that predicts which passengers survived the Titanic shipwreck Data Titanic: Machine Learning from Disaster - Kaggle train.csv Survived: 1=yes, 0=No test.csv gender_submission.csv: for prediction PassengerId: those from test.csv Survived: final result Guide to help start and follow Titanic Tutorial - Kaggle Join the Competition Here! Submit a initial result : NoteBook Learning

[深度基础]·小白如何快速入门深度学习

拥有回忆 提交于 2020-11-18 04:57:10
[深度基础]·小白如何快速入门深度学习 个人主页--> https://xiaosongshine.github.io/ 随着近年深度学习的兴起,很多研究者都投入这个领域当中,由于各个大学都将自己的课程放到了网上,出现了很多学习资源和网络课程,而且很多大公司如 Google.Facebook 都将 自己的开源框架放到了 Github 上,使得深度学习的人门越来越简单,很多麻烦的重复操作已经通过框架简化了 ,这也让我们每个人都能有机会接触深度学习 。 网上有各种各样的学习经验分享,有的人注重理论知识的积累,看了很多书,但是 动手实践的经验为 0; 也有 一 些人热衷于代码的实现,每天学习别人已经写好的代码 。 对于这两种情况,我认为都是不好的,深度学习是理论和工程相结合的领域,不仅仅需 要写代码的能力强,也需要有理论知识能够看懂论文,实现论文提出来的新想法 ,所以我们的学习路线应该是理论与代码相结合,平衡两边的学习任务,不能出现只管-边 而不学另外 -边的情况,因为只有理论与代码兼顾才不至于一旦学习深入,就会发现自己会有很多知识的漏洞。 在入门深度学习领域之前,需要一定的 Python语言基础和微积分、线性代数的基础,下面将给出的学习建议,以及继续深入了解深度学习领域的学习建议 。 对于微积分和线性代数需要掌握的知识并不多.对于做积分只需要知道导数和偏导数

6位图灵奖得主,10多位院士,19个分论坛:北京智源大会邀你共同探索AI下一个十年

房东的猫 提交于 2020-11-18 03:53:56
编者按: 届时也请大家关注我们的“AI科技女性专题”,还有精彩的AI TIME论道,6月智源大会见! 长按上图或点击「阅读原文」免费注册参会 2020年,是一个十年的结束,也是下一个十年的开始。 过去十年,人工智能在深度学习算法、大规模算力和新型芯片、互联网收集的海量数据等因素的共同驱动下,经历了波澜壮阔的迅速发展,开始深刻改变我们生活、学习和工作的方方面面。 未来十年,人工智能将如何发展,如何影响整个社会?这将是一项复杂的系统工程——如何构建多学科开放协同的创新体系,如何推进人工智能与经济社会发展深度融合,如何建立人工智能安全可控的治理体系,如何与各国携手开展重大共性挑战的研究与合作?这些问题都亟须全球学术和产业界有识之士共同探索。 2020年6月21-24日 , 第二届 北京智源大会 ( 官网:https://2020.baai.ac.cn )将邀请 包括6位图灵奖获得者、10多院士在内的上百位人工智能领袖 ,回顾过去,展望未来,深入系统探讨“ 人工智能的下一个十年 ”。 01 口碑盛会,内行人的视角 2019年,首届北京智源大会定位 “真正内行的AI盛会”,向世界展示了北京人工智能开放、活跃、重视可持续发展的面貌。 2020北京智源大会继续关注国际性、权威性和专业性,以营造学术氛围,促进国际交流与合作,打造世界人工智能学术高地

[Python人工智能] 二十四.易学智能GPU搭建Keras环境实现LSTM恶意URL请求分类

China☆狼群 提交于 2020-11-18 01:53:22
最近用笔记本跑Keras和TensorFlow深度学习代码,一个模型跑十几个小时还奔溃,真的头大!这篇文章简单讲解易学智能GPU搭建Keras环境的过程,并实现了LSTM文本分类的实验,本来想写Google Colab免费云,但看知乎评价也不太好(梯子常断网、时间限制、数据量小)。因此,选择一个评价较好的平台供大家学习(6块一小时),也希望大家推荐更好的平台,百度飞浆后续准备也学习下,希望这篇文章能解决自身电脑配置不足,需要GPU运行模型且服务器价格又不是太高的同学,加油! 如果个人电脑足够使用的同学,则可以看看这篇文章的LSTM文本分类代码,下一篇文章我将详细对比。基础性文章,希望对您有所帮助。 本专栏主要结合作者之前的博客、AI经验和相关视频及论文介绍,后面随着深入会讲解更多的Python人工智能案例及应用。基础性文章,希望对您有所帮助,如果文章中存在错误或不足之处,还请海涵~作者作为人工智能的菜鸟,希望大家能与我在这一笔一划的博客中成长起来。写了这么多年博客,尝试第一个付费专栏,但更多博客尤其基础性文章,还是会继续免费分享,但该专栏也会用心撰写,望对得起读者,共勉! Keras下载地址: https://github.com/eastmountyxz/AI-for-Keras TensorFlow下载地址: https://github.com/eastmountyxz/AI