大数据

同事月薪10000,而我只有7000,分析发现缺了这些东西

ⅰ亾dé卋堺 提交于 2021-01-01 18:03:20
在互联网行业工作的朋友们,你们有没有发现一个问题,明明做着同一份工作,有些人拿着1万元的高薪,而有些人只能拿7000元。我分析了30位互联网人士得出了这份结论,你们之间差了这份有结果的数据分析报告。 试问一个没有结果的数据分析报告,又怎么能够打动领导呢?同样是工作一个月同事的业绩是为企业扩展20个推广渠道,增加1000万曝光,而你却是为企业扩展20个推广渠道,这是不是完全不一样的呢?要写有结果的分析报告,这里我告诉大家具体要在那些方面体现。 1.基本框架 哪怕是万丈高楼,也需要地基牢固。分析报告要有层次,架构清晰、主次分明,这样能让看的人更容易懂。 2.实事求是 分析之前,先想一想今天的数据,和你预测的数值差了多少?完成了吗?然后实事求是的写上去。这样的报告在办公室里很常见,常常是领导或业务部门随口要个数。 分析结论一定要基于紧密的数据分析推到过程,不要有猜测性的结论,过于主观的东西没有说服力。 3.图表化 将数据分析报告图表化,用图表代替数字的堆砌会让人更佳形象直观的看清问题和结论,但要注意,图表也不能过多,让读者无所适从。 4.逻辑性 分析报告要有逻辑性: (1)数据是怎么来的。 (2)发现了什么问题。 (3)总结问题发生的原因. (4)如何解决这种问题。这样一个简单明了强逻辑关系的分析报告就能让绝大多数人接受。 5.数据可靠 要有可靠的数据

内部开源系列之二 —— 经典案例

回眸只為那壹抹淺笑 提交于 2021-01-01 07:40:04
引子 InnerSource 的介绍,我似乎陷入了一种不知该从何讲起的尴尬局面,也就是所谓的破局,理论?历史?案例?实践?文化?曾几何时,脑子灵光一闪,希望通过某个假想中的案例来阐述。从管理、文化、开发、协作、产品、生态、人才等多个角度来逐步细致将一个InnerSource贯彻到底。但是想法总归是想法,需要时间来慢慢的完善。难道是我的每周一篇文章时间定错了?还是应该将InnerSource单独拿出来,独立成系列?我陷入了思考和停滞状态。 于是有了此文,尝试将现有的InnerSource案例整理出来。 InnerSource 案例 在一个普遍推崇模仿、山寨的文化中,谈案例是最受欢迎的,我也顺着这个思路来写一篇试试水,以实际行动来验证下。 InnerSource 正如我在上一篇文章中所提到的,不是什么新的概念和实践,而是有很多学界和厂商都在研究、运行,下面笔者就列出一些业界公开的案例。 PayPal PayPal 是在2013年施行的InnerSource,主要是内部的开发效率遇到了严重的问题,由于PayPal是一家跨国公司,各个国家的清算情况又不尽相同,于是牵扯到沟通、协调、覆盖代码等问题,在施行InnerSource之前,PayPal施行过两种办法:自顶向下的强制和驻场。最终证明这都不可行。 PayPal从开放源代码软件中汲取了灵感,尤其是来自Apache软件基金会的实践

以友盟+U-Push为例,深度解读消息推送的筛选架构解决方案应用与实践

僤鯓⒐⒋嵵緔 提交于 2020-12-31 12:01:06
业务背景 友盟+消息推送U-Push日均消息下发量百亿级,其中筛选任务日均数十万,筛选设备每分钟峰值可达7亿+,本文将分享友盟+技术架构团队在长期生产实践中沉淀的筛选架构解决方案。 如何保证百亿级的下发量? 友盟+U-Push筛选是Push产品的核心功能,其中实时筛选是面向推送要求较高的付费Pro用户提供的核心能力之一,实现了用户实时打标、筛选、分发、触达的功能。友盟+U-Push的设备识别以device_token为基准,为保证尽可能的触达我们留存了近期所有可能触达客户的device_token,以10亿真实设备为例,每个设备安装10个集成友盟+SDK的应用可以产生10个device_token,牵扯到硬件环境变动导致的device_token漂移问题,可能产生更多device_token。 ( 图1.1.1 友盟+U-Push业务数据流简图) 图1.1.2 友盟+U-Push功能清单 U-Push筛选架构概览 2.1 上下行两个核心链路 U-Push服务由两个关键链路组成,下行链路保证客户消息的触达,上行链路承载终端采数和与客户服务端的数据同步。其中下行链路主要分为任务调度、筛选中心,上行链路主要服务是多种收数通道(为兼容历史问题)和设备中心,上行通过设备中心实现跟下行桥接。 图2.1.1 友盟+U-Push筛选业务场景 在U-Push服务中,依照业务场景不同定义了多种任务类型

Linux入门及企业服务器知识学习笔记

六月ゝ 毕业季﹏ 提交于 2020-12-31 09:23:59
1、 Linux是类UNIX操作系统,是一个基于POSIX移植操作系统接口和UNIX的多用户、多任务、支持多线程和多CPU的操作系统。 2、用于企业服务器、WEB网站平台、大数据、虚拟化、Android、超级计算机、云计算、物联网、人工智能等领域。 3、开源免费;迭代更新;性能稳定;安全性高; 多任务,多用户;多线程;多CPU; 耗资源少;内核小; 应用广泛; 入门简单。 4、企业服务器品牌及型号:DELL(大多数公司),HP,IBM,浪潮,联想 2014年-2016年DELL:(1U)R420,R430, R620,R630 (2U)R720,R730 HP:2U DL380 G7/G8 IBM:1U 3550/m3 ,3550/m5 2U 3650,4U 3850,8U 3950 5、服务器尺寸:1U=4.45cm 1U 2U 4U 6、服务器一般是双电源,双线AB路 7、一般企业服务器的CPU数量2-4颗,单颗CPU4核,内存16-256G(常见32G,64G)。做虚拟化的宿主机,CPU数量4-8颗,单颗CPU4核,内存48-128G,6-10个虚拟机。 8、常见服务器磁盘是3.5mm英寸,大部分机械硬盘,读取性能相比内存来说不高,硬盘接口:IDE,SCSI SATA SAS SSD,性能: SSD> SAS > SATA, 磁盘阵列卡RAID:整合多块硬盘,有冗余备份

数据应用场景之标签管理体系

匆匆过客 提交于 2020-12-31 08:17:43
一、标签简介 标签概念 标签,最初用来对实物进行分类和标记,例如标明物品的品名、重量、体积、用途等简要信息。后来逐渐流行到数据行业,用来标记数据,对数据快速分类获取和分析。 标签特点 精确描述定位和搜索,具有生命周期的特性,可以计算,配置和规则化处理。可以用标签来描述各种结构和非结构化[文档、图片、视频等]的数据,从而使这些内容被高效的管理。 描述特征:标签[手机颜色],特征[红色,白色]; 描述规则:标签[活跃用户],规则[每日登陆,产生交易]; 标签价值 精细运营的基础,有效提高流量精准和效率。 帮助产品快速定位需求数据,进行精准分析; 能帮助客户更快切入到市场周期中; 深入的预测分析数据并作出及时反应; 基于标签的开发智能推荐系统; 基于某类下的数据分析,洞察行业特征; 标签的核心价值,或者说最常用的场景:实时智能推荐,精准化数字营销。 二、标签定义 属性标签 属性标签是描述基本特征,不需要行为产生,也不是基于规则引擎分析,例如基于用户实名认证信息,获取:性别,生日,出生日期等特征。变动频率极小,且精准性较高。 行为标签 通过不同业务渠道埋点,捕捉用户的行为数据,基于这些数据分析,形成结果描述的标签,例如:分析用户「网购平台」,得到的结果拼多多,淘宝,京东,天猫等。这些都是需要通过行为数据来判断的标签。 规则标签 规则下分析出来的标签,更多是基于产品或者运营角度来看

GEE 2020 Geo for Good Summit

醉酒当歌 提交于 2020-12-31 04:38:48
GEE2020 由于疫情影响,2020GEE官方峰会(Geo for Good Summit)采取线上举行的方式,所有人可以免费开放申请。会议时间:10月20-21日。申请截止日期9月25日。想参会的老师同学,抓紧时间申请。 NO.壹 Event Details What will happen at the Geo for Good Summit this year? · Tune into the Opening remarks & Keynotes to hear what’s on our minds this year. · Learn about the latest updates to Google Earth Engine, Google Earth and more during Product Demos and Announcements. · Listen to others in the Geo for Good community talk about using mapping technology for social and environmental impact during the Lightning Talks. · Tune into the sessions and ask questions! Before the summit,

阿里云数据库李飞飞:云计算推动数据库向云原生快速演进

試著忘記壹切 提交于 2020-12-31 03:58:55
12月30日,阿里云云原生数据库PolarDB举行年度发布。过去的一年是阿里云数据库硕果累累的一年。11月,Gartner公布阿里云进入全球数据库领导者象限,是国产数据库几十年积累的重大突破;12月,中国电子学会公布PolarDB获得科学技术奖一等奖。阿里云数据库深耕11年,至今已服务客户10万余。 阿里巴巴集团副总裁、阿里云智能数据库事业部总裁李飞飞表示,云计算正在推动数据库向云原生快速演进,阿里云数据库已全面布局云原生。 关键词:深耕11年10万余客户 2020年11月,“完美日记“上市了。迅速崛起的“完美日记”,从2017年的全新品牌,到如今的 “国货之光”,成为今年创投圈的现象级案例。 快速的业务发展背后,是高压力的系统挑战。“完美日记”找到了阿里云数据库。阿里云服务天猫“双11”多个年头,已具备丰富的应对大流量经验。 2020年4月,“完美日记”三周年大促,最后一天压测,订单系统下单速度达到1万笔/每秒,对应PolarDB数据库的写入速度10万TPS,比半年前的系统吞吐提升了50倍。在4月14日活动当天,抢购开始瞬间系统涌进了几百万用户。每秒成交的订单数创历史新高,订单峰值比历史最高峰值再次提高了几倍,高峰业务流量比半年前提高了50倍。 “完美日记”只是阿里云数据库的一个案例,是阿里云数据库11年以来,服务的10万多客户中的其中一个。 阿里云数据库始于2009年。

四部门:加快构建全国一体化大数据中心协同创新体系

浪尽此生 提交于 2020-12-30 16:57:57
来源:Wind 香港万得通讯社报道,发改委、中央网信办、工信部、能源局联合发布《关于加快构建全国一体化大数据中心协同创新体系的指导意见》,要求加快构建全国一体化大数据中心协同创新体系,加强全国一体化大数据中心顶层设计。 文件提出,到2025年,全国范围内数据中心形成布局合理、绿色集约的基础设施一体化格局;全国范围内形成一批行业数据大脑、城市数据大脑,全社会算力资源、数据资源向智力资源高效转化的态势基本形成。 文件指出,统筹围绕国家重大区域发展战略,根据能源结构、产业布局、市场发展、气候环境等,在京津冀、长三角、粤港澳大湾区、成渝等重点区域,以及部分能源丰富、气候适宜的地区布局大数据中心国家枢纽节点。 以下为意见全文: 关于加快构建全国一体化大数据中心协同创新体系的指导意见 发改高技〔2020〕1922号 各省、自治区、直辖市及计划单列市人民政府,新疆生产建设兵团,国务院各部委、各直属机构: 数据是国家基础战略性资源和重要生产要素。加快构建全国一体化大数据中心协同创新体系,是贯彻落实党中央、国务院决策部署的具体举措。以深化数据要素市场化配置改革为核心,优化数据中心建设布局,推动算力、算法、数据、应用资源集约化和服务化创新,对于深化政企协同、行业协同、区域协同,全面支撑各行业数字化升级和产业数字化转型具有重要意义。为进一步促进新型基础设施高质量发展,深化大数据协同创新,经国务院同意

一篇文章带你了解SVG 转换知识

六月ゝ 毕业季﹏ 提交于 2020-12-30 14:03:18
SVG 转换在SVG图像中创建的形状。例如,移动,缩放和旋转形状。这是显示垂直或对角线文本的便捷方法。 一、转换简单示例 例: <svg xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink"> <rect x="50" y="50" height="110" width="110" style="stroke:#ff0000; fill: #ccccff" transform="translate(30) rotate(45 50 50)"> </rect> <text x="70" y="100" transform="translate(30) rotate(45 50 50)" >nhooo.com</text> </svg> 运行效果: 注: <rect>元素的transform 和 <text>的transform属性。 该属性指定要应用于形状的变换。在此示例中,应用了平移和旋转。两者都将在本文后面解释。 二、哪些元素可以转换? 可以将变换应用于所有SVG形状。还可以将变换应用于<g> 元素,从而一次性有效地变换整个元素组。也可以变换渐变和填充图案。 三、转换函数 转换函数不会自行转换SVG形状,而是会转换该形状的基础坐标系。因此,即使宽度以倍数显示

廖雪峰团队最新研磨的实战宝典终终终终终终于免费了!

家住魔仙堡 提交于 2020-12-29 22:22:25
众所周知,大数据技术正被广泛应用于电商、交通、工业、医疗等行业,大数据工程师已成为互联网行业炙手可热的岗位 。另一方面, 像月薪 20k 以上的大数据工程师,技能要求就很高,除了要熟练各种大数据框架,还要会搭建系统架构,解决实际业务问题等。今天给大家推荐一个福利—— 廖雪峰 最新研磨的 实战宝典 《 如何将大数据开发做到优秀 》 首次开放了! 内容出自开课吧 vip 课程“大数据高级开发实战班” ,为帮助大家特殊时期职场走得更加顺畅,现决定将这套价值 788元 的体系化学习宝典 免费 送给粉丝朋友。 如果你是 刚转行大数据不久的Java、PHP等程序员 或 入行新人, 这套学习宝典能帮你迅速摆脱工作困扰,巩固掌握优秀工程师的必会技能: 缺乏工作经验,想短时期内接触学习大数据开发项目; 接触不到核 心技术 , 不懂 底 层源码 , 不会 搭建 系统 架构 ,提升 太难 ; 业务逻辑欠缺 ,想 丰富实战 经验, 进大 厂冲击高薪。 一、高薪大数据工程师必备——实战项目经验 本部分选取 当下应用最广的 企业项目 ,基于 大厂脱敏数据 ,以 Spark 为主要核心框架,覆盖 Kafka、Hbase 及 Hadoop 等大数据生态技术,帮你 360 度 探索大数据在出行领域的技术落地,了解大数据架构的设计奥秘 ,增加简历含金量 。 01 大数据背景下的智慧出行 通过学习