大数据

基于Storm构建实时热力分布项目实战

给你一囗甜甜゛ 提交于 2021-01-29 04:20:42
基于Storm构建实时热力分布项目实战 下载地址: 百度云盘 Storm是实时流处理领域的一柄利器,本课程采用最新的Storm版本1.1.0,从0开始由浅入深系统讲解,深入Storm内部机制,掌握Storm整合周边大数据框架的使用,从容应对大数据实时流处理! 适合人群及技术储备要求 这是一门非常具有可操作性的课程,适合Java工程师正处于瓶颈期想提升自己技术、想转型做大数据的开发者,更适合对于大数据感兴趣、想从事大数据 研发工作的同学。本课程将手把手带你从零循序渐进地讲解Storm各方面的技术点,让你轻松胜任实际大数 据实时流处理的工作,稳拿高薪! 技术储备要求 熟练掌握Java SE、Linux即可 课程目录:第1章 课程导学引见课程相关背景,学习建议等等1-1 -导学试看1-2 -OOTB环境运用演示1-3 -授课习气与学习建议第2章 初识实时流处置StormStorm作爲近几年Hadoop生态圈很火爆的大数据实时流处置框架,是成爲大数据研发工程师必备的技艺之一。 本章将从如下几个方面让大家关于Storm有微观上的看法:什麼是Storm、Storm的展开史、Storm比照Hadoop的区别、Storm比照Spark Streaming的区别、Storm的劣势、Storm运用现状及展开趋向、Storm运用案例分享...2-1 -课程目录2-2 -Storm是什麼2-3

工作总结:涉及数据库、软件测试等内容

戏子无情 提交于 2021-01-29 03:04:24
前言 本人是一名测试工程师,以下内容是工作或者学习过程中的整理归纳,方便以后回顾。 每天努力一点点,每天进步一点点,加油。 点击下面子标题,跳转进去查看具体篇章。 一、Mysql数据库 Mysql数据库学习及总结 Mysql数据库调优篇 二、软件测试 1、功能测试 功能测试_通用方法 功能测试_报表测试 功能测试_测试用例设计方法 2、性能测试 性能测试_基础知识 性能测试_Jmeter使用手册(一) 性能测试_Jmeter使用手册(二) 性能测试_Google Chrome抓包分析 性能测试_Fiddler抓包工具 性能测试_LoadRunner代理谷歌 性能测试_LoadRunner常见错误问题 性能测试_LINUX命令篇 性能测试_调优篇 3、其他测试 APP应用测试 白盒测试方法 大数据测试 来源: oschina 链接: https://my.oschina.net/u/4369794/blog/4929165

个推异常值检测和实战应用

有些话、适合烂在心里 提交于 2021-01-28 23:22:43
日前,由又拍云举办的大数据与 AI 技术实践|Open Talk 杭州站沙龙在杭州西溪科创园顺利举办。本次活动邀请了有赞、个推、方得智能、又拍云等公司核心技术开发者,现场分享各自领域的大数据技术经验和心得。以下内容整理自个推资深算法工程师令狐冲现场分享: 令狐冲(花名),个推资深算法工程师,目前负责个推深度学习相关研发工作,对 AI 算法有深入的了解及丰富的实践经验,擅长将大数据分析与深度学习神经网络相结合,为业务落地输出算法产品化能力。 大家好,我是来自个推的令狐冲,今天主要分享大数据中的异常值检测和实战应用,围绕研究背景、异常值检测方法、异常检测实战应用等话题,结合相关实战数据介绍异常值检测算法的最新进展情况。 研究背景 异常值检测是大数据分析中一个重要的研究方向,实时异常值自动检测有助于运营人员快速发现系统异常问题。我们常说的异常值通常是相对于正常值来表述的,要结合实际业务来讲一个值是否正常,也就说这是一个业务描述。如果我们要解决一个业务问题,首先要做的就是将这个问题数学化,将业务描述转化为数学描述,这样你才可以使用适合的算法或使用其他分析方法来解决。 对于异常值而言,从数学上看可以看做一个离群点。当然在实际业务中,考虑到业务的结合情况不同,有些异常值看似是离群点,但是从全局业务上看也可能是一个正常值。具体情况需要结合结果来分析,不过我们大致可以使用离群点来代表异常值。

用最少人力玩转万亿级数据,我用的就是MongoDB!

。_饼干妹妹 提交于 2021-01-28 12:40:07
本文根据杨亚洲老师在〖deeplus直播第258期〗线上分享演讲内容整理而成。 (文末有获取本期PPT&回放的方式,不要错过) 杨亚洲 OPPO MongoDB负责人 负责OPPO数万亿级数据量文档数据库MongoDB内核研发、性能优化及运维工作,一直专注于分布式缓存、高性能服务端、数据库、中间件等相关研发。 本文主要 分享内容如下: MongoDB在OPPO互联网推广经验分享-如何把一个淘汰边缘的数据库逐步变为公司主流数据库; 谈谈当前国内对MongoDB误解(丢数据、不安全、难维护)? MongoDB跨机房多活方案-实现成本、性能、一致性"三丰收"; MongoDB线程模型瓶颈及其优化方法; 并行迁移:MongoDB内核扩容迁移速率数倍/数十倍提升优化实践; 百万级高并发读写/千亿级数据量MongoDB集群性能数倍提升优化实践; 万亿级数据量MongoDB集群性能数十倍提升优化实践; 磁盘800%节省-记某服务接口千亿级数据迁移MongoDB,近百台SSD服务器节省原理; 展望:借助MongoDB完善的分布式、高可用、机房多活等功能,如何实现NoSQL、NewSQL融合; 其他-那些年我们踩过的坑。 一、如何把MongoDB从淘汰边缘变为公司主流数据库? 背景 入职前多个大数据量业务使用MongoDB,使用中经常超时抖动; 多个核心业务忍受不了抖动的痛苦,准备迁移回MySQL;

Smartbi Eagle自助分析平台,助力英大人寿开启数据化运营之路

白昼怎懂夜的黑 提交于 2021-01-28 09:19:49
面对汹涌而来的数字化浪潮,英大泰和人寿保险股份有限公司(以下简称英大人寿)有幸站在巨人的肩膀上,从零起步,基于 Smartbi Eagle 打造了以 “ 自助 ” 为核心的 “ 数据之家 ” 自助分析平台 ,基本实现了保险公司业务人员自助访问并使用公司数据的目标。自助分析允许用户在不依赖 IT 团队的情况下对数据进行加工、分析和可视化,只需要简单的拖拉拽就可以快速生成一张清晰的报表,解决了业务人员零门槛获取数据的难题。但是,大部分的业务人员还是很难真正将这款 “ 工具 ” 使用起来。对于他们来说,学习门槛太高,且更习惯于使用 Excel 进行数据分析。所以,市面上大部分自助分析工具的使用对象往往局限于 “ 报表工程师 ” ,离业务人员的普及还有一段很长的距离。那么,要如何将自分析真正推广起来?最好的做法是把自助分析从 “ 工具 “ 层面提升到 “ 文化 ” 层面,提供一站式的 自助分析解决方案 ,基于这个目标,英大人寿结合自身情况进行了一些探索。 建设背景 在当前的数字化背景下,英大人寿面临的高频业务需求已呈现持续扩大的趋势。而对于数据分析工作,经常会遇到这样的尴尬情况:会数据分析的人不懂业务,而懂业务的人却不会数据分析。往往一个数据分析需求的完成,最大的时间成本不是花在真正的取数、分析阶段,而是在前期的需求沟通阶段。在这种配合模式下,业务的数据分析需求总是在无尽的排期和等待中

零基础零代码实现可视化报表

|▌冷眼眸甩不掉的悲伤 提交于 2021-01-28 09:09:23
当今时代,传统的报表工具已经很难满足人们对于数据可视化的期望了,而大数据处理工具却可以为人们提供了更多的选择。微金时代的RDP报表工具操作简便,可直接上手使用,无需编码,就可以制作各种复杂、炫酷的报表。 RDP报表工具表格式报表功能和亮点 根据中国特色的报表需求,研发出的轻量级的企业级Web报表工具。仅需简单拖拽式配置,即可制作出各种复杂、炫酷的报表。支持中国式复杂报表的处理,例如: Excel清单报表、交叉报表、分组报表、多源分片式报表、分块报表、表单报表、图形报表、回写报表、假设分析报表、二次计算报表、套打报表、段落式报表、预警报表、组合报表等。 RDP报表工具大屏功能和亮点 RDP大屏,仅在可视化效果上就有数百种选择,令传统报表工具望尘莫及,使用人员只需要通过拖拽方式即可实现精美的数据可视化报表。支持30多种可视化元素组件,自由式布局,自适应屏幕展示降低开发的难度、不用开发人员具备较强的前端能力也可配置出交互友好、展现形式炫丽的大屏幕分析报表,最终将业务数据可以更好的呈现给终端用户。 如果手机端也想显示大屏幕报表的话,可以将设计好的大屏幕中的组件,按照流式布局展示,通过拖拽排列显示顺序,部分图表不适合在移动端展示,可以通过点击隐藏按钮隐藏。 RDP报表工具移动端功能和亮点 RDP报表移动端可视化设计,使用人员灵活拖拽、所见即所得设计器设计出来的报表,可以用于H5页面

我们的大脑,足以理解大脑本身吗?

早过忘川 提交于 2021-01-28 07:13:36
来源: 利维坦 树突(红色)神经元的分支过程,接收突触信息的突出棘的渲染,以及来自小鼠大脑皮层的饱和重建(多色圆柱体)。© Lichtman Lab at Harvard University 利维坦按: 关于大脑,你可以用这句话来自问:你 凭什么 觉得自己可以理解它呢?你或许会回答说:凭大脑。即,凭借大脑来理解大脑。但问题是,这两个“大脑”的信息匹配度或许存在很大差异。这就如同文中博尔赫斯那篇关于帝国地图的精妙描述:所有地图的绘制之所以能够以比例成图,就在于忽略掉了现实的很多细节,可试想,如果真要绘制一幅 囊括一切 细节 的地图,那么这张地图无疑与真实国度的比例相同了。 同理,鉴于我们目前对于脑内的这坨物质理解十分有限,所以,如何再描述“理解”可谓十分重要了。也许,未来人类对于人脑的理解可以非常接近我们的人脑地图“比例”,但,无限接近也仅仅是无限接近。 在去年秋天一个寒冷的夜晚,紫红的太阳缓缓坠落,我坐在哈佛大学郊外的办公室里,透过落地窗凝视着窗外的虚无,思考着关于老鼠大脑的数据集。 与此同时,我回想起波士顿市中心那些没有窗户的冰冷房间,那里的高性能计算中心存储着我宝贵的48TB数据。作为博士实验的一部分,我用了13万亿个字节来记录数据,并研究 老鼠大脑的视觉皮层是如何对运动做出反应的 。 如果将数据集按双倍行距打印出来,需要1160亿张纸。但当我写完关于这些数据的故事时

5G改变的速度更重要是生活和社会的革命

一曲冷凌霜 提交于 2021-01-28 05:12:18
支付方式的更迭是智慧零售的一个重要标志,基于数据和技术驱动,无论是扫码还是刷脸支付,都便于零售业更高效地服务顾客,对会员顾客消费行为和特点进行分析管理,制定更精准的营销策略,提升会员价值和门店的运营效率。 未来,刷脸支付会逐步推广至全国各大商业场景,对于需要推广商户的服务商而言,掌优电子科技移动支付系统,可无缝对接支付宝、微信支付刷脸支付设备,赋能服务商,开拓更宽阔的刷脸支付市场。刷脸支付,智慧医疗,智慧校园,智慧银行,餐饮超市酒店,无感停车场,各场景解决方案,软件定制开发,支付设备批发,详细请百度“掌优电子 魏” 5G带来新的生活场景,也会带来新的支付场景,进而可能衍生出多样化的支付方式。5G 普及后,更多的感应设备可以用于支付中,比如人脸识别、体态识别、声纹等等。一边是识别用户,另一边是识别商品,这两头达到无感的程度,需要 5G 的信息传输速度,需要识别人与物,让万物互联。 各行各业关于5G的建设正在如火如荼地进行中,人们对 5G 其实可以有非常大的想象空间,未来 5G 和大数据等技术的结合,还将变革众多产业,为全球带来新一轮发明和创新浪潮。5G时代的到来极大改善了网络条件,移动互联网更加发达,与线下场景的联动也更为频繁,扫码支付得以进入快车通道。 随着5G和AI技术的发展,刷脸支付已经成为越来越受欢迎的支付方式。据中国支付清算协会的报告,今年以来人脸识别在手机解锁、身份验证

阿里云联合帆软发布企业级BI分析解决方案,解决数据应用难题

ぐ巨炮叔叔 提交于 2021-01-28 02:30:37
近日,阿里云MaxCompute大数据计算平台联合帆软正式发布企业级BI分析解决方案,MaxCompute成为帆软FineBI与FineReport官方数据源。此次专为企业数据分析实现的产品集成,将极大解决企业数据分析及报表应用难题,助力企业业务效率进一步提升。 MaxCompute 是阿里云提供的面向分析的企业级SaaS模式云数据仓库,服务着数以万计的客户和阿里巴巴集团。MaxCompute基于自身Serverless架构,提供快速、全托管的在线数仓服务,在消除传统数据平台的资源扩展性和弹性限制方面极具优势,同时强调面向分析的便捷性与体验,使用户经济高效的分析处理海量数据,并便捷的对接BI分析工具,真正实现从数据到洞察的高效转化。 帆软作为中国专业的大数据BI和分析平台提供商,致力于为全球企业提供一站式商业智能解决方案,旗下两款主要产品FineReport、FineBI本次与MaxCompute实现互联互通,帮助企业更好的开展以问题为导向的探索式分析工作。 目前,该联合方案已在工业和医药行业客户中得到应用和实践落地。客户基于MaxCompute构建数据仓库,对主题数据域和业务数据域的数据进行处理,各种主题数据在数仓经过分析后,向上对FineBI提供数据源查询。FineBI可通过JDBC接口连接到MaxCompute数据仓库,用户可在FineBI通过即席查询进行自助式报表处理

大数据智慧解决方案——案例分享

久未见 提交于 2021-01-27 22:45:30
在数字经济 大数据是无论如何都绕不开的一个话题 就好比阳光、水与生命 产品分析需要大数据,用户分析需要大数据! 市场分析也需要大数据! 仅仅大数据系统研发、应用开发和大数据分析三大类就能细分出近百个工作岗位 随着国家战略的支持和数字经济的蓬勃发展,大数据越来越重要,不但有越来越多的人转行加入大数据,越来越多的企业也在做智数转型。 因此在当下,无论你是不是大数据从业者,分在数字经济时代的你都需要充充电了。 来源: oschina 链接: https://my.oschina.net/u/4967171/blog/4927769