聚类

[网络安全自学篇] 七十四.APT攻击检测溯源与常见APT组织的攻击案例

前提是你 提交于 2020-08-14 03:44:06
这是作者网络安全自学教程系列,主要是关于安全工具和实践操作的在线笔记,特分享出来与博友们学习,希望您喜欢,一起进步。前文分享了WannaCry蠕虫的传播机制,带领大家详细阅读源代码。这篇文章将分享APT攻击检测溯源与常见APT组织的攻击案例,并介绍防御措施。希望文章对您有所帮助~ 作者作为网络安全的小白,分享一些自学基础教程给大家,主要是关于安全工具和实践操作的在线笔记,希望您们喜欢。同时,更希望您能与我一起操作和进步,后续将深入学习网络安全和系统安全知识并分享相关实验。总之,希望该系列文章对博友有所帮助,写文不易,大神们不喜勿喷,谢谢!如果文章对您有帮助,将是我创作的最大动力,点赞、评论、私聊均可,一起加油喔~ 文章目录 一.什么是APT攻击 二.常见APT组织的攻击案例 1.海莲花(APT32) 2.摩诃草(APT-C-09) 3.蓝宝菇(APT-C-12) 4.SideWinder(T-APT-04) 三.APT攻击溯源及案例 1.溯源常见方法 2.基于机器学习和深度学习的APT溯源 3.时区溯源案例(白象) 4.关联分析案例(Darkhotel APT-C-06) 5.特征相似溯源(摩诃草) 6.0day漏洞溯源(Lazarus T-APT-15) 7.蜜罐溯源 四.安全防御建议 五.总结 PS:本文参考了github、安全网站和参考文献中的文章(详见参考文献)

独家 | 机器学习真实案例研究:基于文本描述的交易聚类

老子叫甜甜 提交于 2020-08-13 16:20:35
作者:Ravindra Reddy Tamma 翻译:方星轩 校对:欧阳锦 本文约 2200字 ,建议阅读 5分钟。 本文为大家介绍了在日常的电子交易中对用户的交易信息进行聚类分析和建模,提供了用户分析的思路和建议。 标签: 聚类 机器学习 我们正生活在数字技术时代。还记得你上次去到没有PayTM或BHIM UPI的商店是什么时候吗?很显然,这些数字交易技术已迅速成为我们日常生活的关键部分。 数字技术不仅是个人,也是各大金融机构的核心。依托着可靠的后台运行系统,执行多种选项的支付交易或资金转帐(例如,网上银行,ATM,信用卡或借记卡,UPI,POS机等)是一件非常顺利的事。 对于我们进行的每笔交易,都会针对它生成一个适当的描述消息,如下所示: 在本文中,我们将讨论一个金融机构的实际使用案例,该案例使用-聚类clustering(一种流行的机器学习算法)来为其客户群定制其产品。 本案例研究的动机 作为一家金融机构,始终根据客户的兴趣为他们量身定制报价,并以此来吸引现有客户群是很重要的事。对于任何金融机构而言,把握全方位的客户信息是一项重大挑战。 Twitter,WhatsApp,Facebook等社交媒体平台已成为描述客户兴趣和偏好的主要信息来源。金融机构使用第三方来源的数据通常会付出巨大的成本。即使如此,将社交媒体帐户映射到每一个客户也非常困难。 那么我们该如何解决呢? “A

轻量化AI服务再添两将!阿里云机器学习PAI DSW 2.0 & Alink商业版重磅发布

白昼怎懂夜的黑 提交于 2020-08-13 08:12:10
DSW 2.0:面向AI研发的集成开发平台 DSW(Data Science Workshop)是阿里巴巴PAI团队根据多年的AI算法和产品研发经验积累,围绕提高AI算法研发效率,降低研发成本而推出的一款适用于各类AI开发者的云端机器学习集成开发环境。DSW2.0是借助阿里云ECS,Docker和Kubernetes等云原生技术,能够在几分钟内帮用户完成环境搭建,相对DSW1.0开放更高的开发权限,满足各个层面客户的使用需求。 云原生架构 DSW借助阿里云ECS,Docker和Kubernetes等云原生技术,能够在几分钟内帮用户完成环境搭建。用户可以根据算法需要和成本考虑,选择阿里云ECS提供的包括CPU和异构计算GPU在内的所有资源规格。 满足不同层次开发习惯 结合交互式编程和命令行输入,DSW提供了三种编程入口: WebIde适用于工程化要求比较高的项目;JupyterLab适用于快速POC试验;Terminal入口可用于快速执行Shell命令,运行程序和简单的编辑等。 预装丰富插件 DSW还开发和预装了各种JupyterLab和WebIDE插件,比如广受深度学习开发者喜爱的可视化工具Tensorboard,用户在DSW内通过Launcher,Commands打开,甚至还可以使用%tensorboard魔法命令直接在Notebook中开启等多种方式使用Tensorboard

三维目标识别算法综述

廉价感情. 提交于 2020-08-13 02:53:46
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 目前三维点云数据的获取方法相对快捷,同时三维点云数据的采集不受光照影响,也规避了二维图像遇到的光照、姿态等问题,因此基于点云数据的三维物体识别也引起了人们的重视。 三维点云物体识别方法多是通过提取物体的特征点几何属性、形状属性、结构属性或者多种属性的组合等特征进行比对、学习,从而完成物体的识别与分类。可以分为以下四类方法: 1.基于局部特征的目标识别 基于局部特征的物体识别方法主要是通过局部来识别整体。该方法无需对处理数据进行分割,往往通过提取物体的关键点、边缘或者面片等局部特征并进行比对来完成物体的识别。其中,特征提取是物体识别中非常关键的一步,它将直接影响到物体识别系统的性能。基于局部特征的方式对噪声和遮挡有更好的鲁棒性,同时不受颜色和纹理信息缺乏的限制。由于局部特征描述子仅使用参考点邻域信息,所以不对场景进行分割即可处理复杂场景。但是局部特征描述子维度较高,需要消耗更多的内存,同时存在计算复杂度高,实时性差等问题。 点特征直方图(PFH)和快速点特征直方图(FPFH)是Rusu R B等人提出的相对早期的局部特征描述子。采用统计临近点对夹角的方式构造特征描述子,这也是局部特征描述子构造的典型方式,在此基础上形成了基于局部特征匹配的目标识别和位姿估计的经典框架,如下图所示。表1对典型的局部三维描述符进行了总结

人工智能中小样本问题相关的系列模型演变及学习笔记(四):知识蒸馏、增量学习

隐身守侯 提交于 2020-08-12 21:04:33
【说在前面】本人博客新手一枚,象牙塔的老白,职业场的小白。以下内容仅为个人见解,欢迎批评指正,不喜勿喷![握手][握手] 【再啰嗦一下】本文衔接上两个随笔: 人工智能中小样本问题相关的系列模型演变及学习笔记(一):元学习、小样本学习 【再啰嗦一下】本文衔接上两个随笔: 人工智能中小样本问题相关的系列模型演变及学习笔记(二):生成对抗网络 GAN 【再啰嗦一下】本文衔接上两个随笔: 人工智能中小样本问题相关的系列模型演变及学习笔记(三):迁移学习 一、知识蒸馏综述 知识蒸馏被广泛的用于模型压缩和迁移学习当中。 本文主要参考:模型压缩中知识蒸馏技术原理及其发展现状和展望 1. 基本概念 知识蒸馏可以将一个网络的知识转移到另一个网络,两个网络可以是同构或者异构。做法是先训练一个teacher网络,然后使用这个teacher网络的输出和数据的真实标签去训练student网络。 可以用来将网络从大网络转化成一个小网络,并保留接近于大网络的性能。 可以将多个网络的学到的知识转移到一个网络中,使得单个网络的性能接近emsemble的结果。 2. 知识蒸馏的主要算法 知识蒸馏是对模型的能力进行迁移,根据迁移的方法不同可以简单分为基于目标驱动的算法、基于特征匹配的算法两个大的方向。 2.1 知识蒸馏基本框架 Hinton最早在文章“Distilling the knowledge in a

词嵌入的经典方法,六篇论文遍历Word2vec的另类应用

谁说胖子不能爱 提交于 2020-08-12 06:46:23
  机器之心分析师网络    作者:王子嘉    编辑:Joni    在本文中,作者首先为读者普及了 word2vec 的基础知识,然后以六篇论文为示例详细介绍了当前研究如何利用经典 word2vec 进行拓展性研究。其中,作者重点介绍的部分是知识嵌入空间的生成过程,对于其完整应用感兴趣的读者可以参阅原论文。   随着深度学习的兴起,每个模型都需要一个输入,而我们现实生活中的对象(文字、图片)等等都不是数字,计算机无法处理。所以如何为每个任务确定一个合适的 “输入” 就变得尤其重要了,这个过程也被叫做表征学习。   word2vec 做的就是把文字变成对计算机有意义的输入,简单来说就是把这些东西映射到一个空间里,我们平时为了表示位置可能是三维空间,也就是 xyz,但是在图片啊、文本啊这种领域里,三维空间不太够,就可能去到另外一个 N 维空间,在这个空间里,就像三维空间里人的鼻子要跟嘴挨得近一样,我们也希望相似的东西在这个新的空间里也距离近,比如文本里的 “鼻子” 和“嘴”我们就也希望它们能挨得近一点,因为都属于五官,那么 “鼻子” 和“腿”就相对离得远一点。   顾名思义,word2vec 是把文字转换成计算机可以识别的输入,所以这个技术最开始应用、也是应用最多的地方就是自然语言处理领域(NLP)。其实在之前对于表征学习,我基于 ICLR 和 CVPR 做过两次 high

刷新五项SOTA,百度ActBERT:基于动作和局部物体视频文本特征模型

允我心安 提交于 2020-08-12 06:20:49
  机器之心发布    机器之心编辑部       全球计算机视觉顶会 CVPR 2020 上,百度共计有 22 篇论文被接收。这篇 Oral 论文中,百度提出了 ActBERT,该模型可以学习叙述性视频进行无监督视频文本关系,并提出纠缠编码器对局部区域、全局动作与语言文字进行编码。最终在 5 项相关测评任务上取得了 SOTA 结果。   ActBERT 在下游视频和语言任务上,即文本视频片段检索、视频描述生成、视频问答、动作步骤定位等任务上明显优于其他技术,展示了其在视频文本表示方面的学习能力。      论文:《ActBERT: Learning Global-Local Video-Text Representations》   论文链接: http://openaccess.thecvf.com/content_CVPR_2020/papers/Zhu_ActBERT_Learning_Global-Local_Video-Text_Representations_CVPR_2020_paper.pdf   现有利用 BERT 训练方式进行视频语言建模一般通过量化视频帧特征的方式,通过聚类离散化将视觉特征转化为视觉单词。但是,详细的局部信息,例如,互动对象,在聚类过程中可能会丢失,防止模型进一步发现细粒度的视频和文字对应关系。本文提出 ActBERT

数据挖掘工具主要有哪几种?

耗尽温柔 提交于 2020-08-12 05:28:48
数据挖掘 (Data Mining),也叫数据开采,数据采掘等,是按照既定的业务目标从海量数据中提取出潜在、有效并能被人理解的模式的高级处理过程。在较浅的层次上,它利用现有数据库管理系统的查询、检索及报表功能,与多维分析、统计分析方法相结合,进行联机分析处理(O乙心),从而得出可供决策参考的统计分析数据;在深层次上,则从数据库中发现前所未有的、隐含的信息。 随着数据量的爆炸式增长,我们需要借助一些有效的工具进行数据挖掘工作,从而帮助我们更轻松地从巨大的数据集中找出关系、集群、模式、分类信息等。下面小麦整理了市面上五款好用的数据挖掘工具,以供大家参考选择! 1.Rapid Miner Rapid Miner,原名YALE又一个学习环境,是一个用于机器学习和数据挖掘实验的环境,用于研究和实际的数据挖掘任务。毫无疑问,这是世界领先的数据挖掘开源系统。该工具以Java编程语言编写,通过基于模板的框架提供高级分析。 它使得实验可以由大量的可任意嵌套的操作符组成,这些操作符在XML文件中是详细的,并且是由快速的Miner的图形用户界面完成的。最好的是用户不需要编写代码。它已经有许多模板和其他工具,让我们可以轻松地分析数据。 2. KNIME Konstanz信息采集器是一个用户友好、可理解、全面的开源数据集成、处理、分析和探索平台。它有一个图形用户界面,帮助用户方便地连接节点进行数据处理。

无脑带你遍历用户生命价值与流失挽救(下):流失分析与产品化

假如想象 提交于 2020-08-12 05:14:50
前言: 第一篇是从用户生命周期出发,用一个短视频的案例来做分析,阐述了用户价值体系。 本文下篇,将从价值与流失的分析角度来做一些分享。本文涉及到的知识点有:用户生命周期、流量方向的分析方法论、用户分群、用户挖掘、算法、渠道归因、拉新、端承接、运营、产品等。除了遍历这些知识外,文章的核心部分是关于两个数据产品的(关于数据产品方向文章没有做更多阐述)。 用户水池与流失 关于流失与召回,这个是长久不衰的一个话题。在业务活动中,涉及到的角色还是蛮多的,比如产品角色、运营角色、数据分析角色、甚至渠道市场角色都有。 本文将从数据分析的角度来探索一个关于流失的业务场景,以及通过驱动运营、投放等一系列的动作来应对流失挽救,这些落地就成为一个系统化的工作。 曾经繁荣的第三方应用市场,这几年前来逐渐走向没落。从百度巨资吞了 91 助手,到应用手机厂商崛起达到顶峰,整个应用市场已经经历过多轮洗牌。 “荚,再见!豌豆荚、PP 助手宣布下架,从此再无免费软件?” 你是否还记得豌豆荚这些应用?它们也曾在繁华的第三方应用市场里激起过一点浪花。 到现在,不管是应用宝、360 手机助手、华为、小米等应用商店,都在构建自己的城池。 记得在 2016 年左右一个拓新的成本从之前的几块钱升到 10 块钱、最高时能到几十元,留住老用户或许一条短信、一点积分、活动就可以,相对的成本是很低廉的。从用户生命周期与成本来讲

太牛了!98 年后浪科学家,首次挑战图片翻转不变性假设,一作拿下 CVPR 最佳论文提名

我的未来我决定 提交于 2020-08-11 18:01:40
出品 | AI科技大本营(ID:rgznai100) 刚刚结束的CVPR大会, 总共收到6424篇论文中,仅有26篇获得最佳论文提名,占0.4%的比例。 其中,康奈尔大学大四学生林之秋,以第一作者身份提交的“Visual Chirality”(视觉手性)一文获得最佳论文提名,成为唯一一个还在本科阶段,年龄最小的第一作者获奖者。 论文中,林之秋等人首次挑战了常规神经网络训练中图片”翻转不变性“(flip-invariant) 的这一假设。这篇文章在多种领域(人脸,互联网图片,数字处理图像)上利用卷积神经网络发现了许多常人难以捕捉的”视觉手性“线索,并通过自监督训练在多项数据集上达到了60%甚至到90%的精度。 这次取得最佳论文提名并非偶然,实际上,林之秋的学霸光环从进入大学后一直很耀眼。 大一,他同时选修了计算机和数学两个专业,因为成绩极为优异,他受计算机系的邀请以助教身份给高年级同学讲课,还为康奈尔科技学院(Cornell Tech)的硕士生编写预修课程。 大二开始,他选修了博士课程,开始从事科研工作。 到了大三,林之秋当上了机器学习高阶课程的助教,给博士生的期末试卷打分。 大学毕业,他的成绩在学院上千名学生中名列前三,被授予学院最高荣誉,并受院长邀请,代表学院在毕业典礼上举旗。 不过,学霸此次获得最佳论文提名并不像大学期末考试那样相对容易。林之秋提到