大数据

再见,大数据杀熟!

丶灬走出姿态 提交于 2020-12-19 12:35:28
点击关注上方“ SQL数据库开发 ”, 设为“置顶或星标 ”,第一时间送达干货 10.1长假来了,突如其来的疫情让大家憋得太久,不少人都在此次小长假做了出游计划,在互联网如此发达的今天,出游免不了得通过网上订酒店、机票,但要警惕一种行为大数据杀熟。 在使用某款APP时发现自己预定的酒店价格比新用户更贵,同一时间买同样的机票或者预约车辆等,两个账号显示的价钱不一样等,这就是大数据杀熟。它是指同样的商品或服务时,老用户看到的价钱反而比新用户贵出很多的现象。 据央视新闻总结,常见“杀熟”套路主要有三种: ❶根据不同设备进行差别定价。比如针对苹果用户与安卓用户制定的价格不同; ❷根据用户消费时所处的不同场所。比如对距离商场远的用户制定的价格更高; ❸根据用户的消费频率的差异。一般来说,消费频率越高的用户对价格承受能力也越强。 大数据杀熟,这个近几年被频繁提及的乱象屡禁不止,终于等来了更规范的整治。 最近,央视二套财经频道点名了部分在线旅游平台或存在差异化定价的乱象。报道提到在线旅游平台针对不同消费特征的旅游者对同一产品或服务在相同条件下设置差异化的价格。 不过,这一行为从10.1日起明令禁止! 早在8月31日,文化和旅游部就印发了《在线旅游经营服务管理暂行规定》(以下简称《暂行规定》),将于2020年10月1日起正式施行。 针对大数据杀熟、非法删评论等现象,《暂行规定

大数据杀熟!我被美团会员割了韭菜

两盒软妹~` 提交于 2020-12-19 11:24:21
近日,自媒体“漂移神父”的一篇《我被美团会员割了韭菜》文章引发热议。大数据杀熟再次被搬上了台面。 文章讲述作者发现在开通美团外卖会员后,常点的一家店铺,配送费由2元涨至了6元。在向客服投诉后,配送费降至4元,然而非会员的账号显示依然是2元。 后续美团客服回电作者,表示补偿十元红包,并将账号提交给技术查找原因,但截止原文作者发稿并没接到任何处理结果。作者还发现,这种情况不是“个案”,几乎所有外卖商户,会员账号的配送费超出非会员配送费1至5元不等。 今年文化旅游行业10月1日起明令禁止大数据杀熟行为,而其他行业如电商、打车等领域仍存在着这种“行业潜规则”。大数据杀熟是指同样的商品或服务,老客户看到的价格反而比新客户要贵出许多的现象。经营者运用大数据收集消费者的信息,分析其消费偏好、消费习惯、收入水平等信息,将同一商品或服务以不同的价格卖给不同的消费者从而获取更多消费者剩余的行为。 有博主曾对大数据杀熟的来源、计算方法做了介绍。更有博主深入介绍了大数据杀熟的技术模型PSM,详细讲解了如何添加用户画像,提供了业务分析的计算公式和业务代码。感兴趣的小伙伴可以移步文章详细阅读。也欢迎大家在评论区分享出自己遭遇的大数据杀熟。 《2020年大数据杀熟行为10月1日起明令禁止。什么是大数据杀熟?有哪些表现形式?》 《一文带你揭秘并实现“大数据杀熟”背后的逻辑!》 以下是“漂移神父”

CDA LEVEL I 数据分析认证考试模拟题库(九)

主宰稳场 提交于 2020-12-19 09:36:28
嗨喽,各位同学又到了公布CDA数据分析师认证考试LEVEL I的模拟试题时间了,今天给大家带来的是模拟试题(一)中的41-45题。 不过,在出题前,要公布下上一期36-40题的答案,大家一起来看! 36、C 37、B 38、C 39、B 40、C 你答对了吗? 41.一个电瓶车制造商声称,其生产的电瓶车正常行驶条件下大于40公里,对一个由20辆电瓶车组成的随机样本作了试验,测得平均值为50公里,标准差为10公里。已知电瓶车的行驶距离服从正态分布,我们希望检验该制造商的产品同他所说的标准相符?我们应该选择( ) A.单侧t检验 B.双侧t检验 C.单侧F检验 D.双侧F检验 42.按组织市场调查的时间层次确定,调查可以分为( )。 A.经常性市场调查(不定期) B.定期市场调查 C.临时性市场调查(一次性) D.以上都是 43.(知识点2)盒须图(箱线图)中,Q1到其最近的内限距离为( )。 A.IQR B.1.5IQR C.0.5 D.0.75 44.如果一组数据不是对称分布,按照切比雪夫不等式,至少约有( )的观测值落在距均值4个标准差的区间范围内。 A.75% B.89% C.94% D.98% 45.假设一组数据的取值从−923到899。数据中最大绝对值为923。因此,我们用1000除每个值。因此,−923被规范化为−0.923,而899被规范化为0.899

必看!Linux内核初学者请查收这份学习资料

隐身守侯 提交于 2020-12-19 08:18:51
阅读本文大概需要 2 分钟。 某天,我的技术交流群里面的有个小伙伴分享了一个针对「Linux内核初学者」的GitHub仓库,我看了之后,觉得很赞,于是也觉得把这个好东西应该分享给大家。 这份资料由浅入深地带你剖析 Linux 内核,包括如何搭建 Linux 开发环境、Linux 命令、Linux内核通俗易懂、图文并茂地讲解,我看了一部分,整个给我的感觉是相比书本上的更容易看懂,如果你是内核大拿,这份资料也可以帮你巩固下基础知识。 不过这里面只包含一部分内核内容,作者还在不断更新中。 OK,废话不多说,我们直接看地址: https://github.com/ljrkernel/LearningLinuxKernel 这里贴一部分内容目录: 大家有兴趣,请移步: https://github.com/ljrkernel/LearningLinuxKernel 查看详细内容。 后台回复“ 加群 ”,带你进入高手如云交流群 推荐阅读: 高性能负载均衡架构如何实现 中国芯片的极限突围 Kubeadm 部署高可用 K8S 集群 Linux系统权限管理 一台计算机是如何把数据发给另一台计算机的 互联网下半场的网络效应 100 道 Linux 笔试题 42道计算机网络面试高频题+答案 ▼ 喜欢,就给我一个 “在看” 10T 技术资源大放送!包括但不限于:云计算、虚拟化、微服务、大数据、网络、

六星教育创始人

时光总嘲笑我的痴心妄想 提交于 2020-12-19 07:42:06
六星教育创始人Pack老师 资深架构师、六星负责人 2008年,Pack老师成立杰越云信息企业,随后研发出内部独有的云平台系统,可承载千万级并发量,业内轰动一时,引起广泛关注。 2016年,Pack老师创办六星教育企业,专注培养高级精英IT技术人才。随着成立六星在线教育事业部,并设六星VIP教学中心,提供了更多“人人平等”的学习机会。 2017年,六星教育成为IT类目编程语言认证机构及年度最具影响力机构。 2018年,再次创办子公司——杰越云信息全资软件开发公司,为学员提供了大批实习实训机会,与六星教育、杰越学院形成教学管理、辅导服务、实训平台三法合一的企业成熟模式。 随着授课人数的增加,已累计为 30W+学员进行授课讲解,业内盛名远扬,权威性十足。 至今,Pack老师 作为教研技术团队负责人,始终坚守岗位一线。他曾任 IBM、拓维等上市企业架构师、开发主管等职, 有 12年大型项目研发经验。 熟练PHP、大数据web架构技能,精通开源框架运用和Linux参数配置及优化。具有大容量高并发电商应用架构设计、Hadoop大数据云平台等项目架构经验,并有多年企业专业培训经验。 课堂氛围轻松,注重寓教于乐,善于剖析原理,深入浅出,对技术有独特见解,深受学生好评。 为企业输送大量 IT技术精英人才,给互联网行业连番注入新鲜血液,推动了整个社会经济的发展。 人生格言: 身为世范,为人师表

浅议大数据的分析价值

允我心安 提交于 2020-12-19 06:54:37
2015年,国务院颁布了大数据实施纲要通知《国务院关于印发促进大数据发展行动纲要的通知》,从国家层面上将大数据战略思想逐渐成型。随之,各行各业逐渐意识到海量数据的价值及重要性,分析数据并挖掘其潜在价值的需求不断加大。那么我们今天就来扒一扒:大数据能产生什么价值,值得我们去分析它? 一、什么是大数据 IDC以4V特征来定义大数据,即海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value);Amazon的John Rauser 将大数据定义为:任何超过了一台计算机处理能力的数据量。可见不同的主体对大数据的定义是不同,但有一个共同点,即数据必须是海量的。 一个人每天可以产生如下社保信息:身份、医保/养老/工伤/失业/生育等各险种的参保信息、财务、薪酬等敏感信息……. 一台工业设备每天可以产生的信息:第一、行为日志。访问信息、发送的控制指令等信息;第二、设备通信日志。包括数据连接建立时间、连接端口、访问外部节点信息、传输数据量等信息;第三、设备异常报警日志。如设备认证失败、异常行为类型等;第四、流量信息及阻断信息。 这些信息每天都在产生,久而久之汇聚成海量的数据,通过不同的终端以各种各样的形式存在。比如,存储于关系型数据库Oracle、PostgreSQL,数据文件XML,Hadoop数据源HDFS等

农业气象 永不过时的气象服务

痞子三分冷 提交于 2020-12-19 05:39:32
【加入读者交流群请扫码】 【前言】 连续推了四期《农产品期货的气象服务产品设计》,一篇比一篇阅读量低,可能有点不接地气吧,从第二篇就已经意识到这个问题了,但做事情还是要做的完整。农产品期货的气象服务在我国确实还没有大规模开展起来,原因很多,期待同行们一起分析讨论。我国是农业大国,“家里有粮,心里不慌”,气象为农服务我觉得永不过时,并且农业气象是一项非常值的讨论的课题。今天就跟大家聊聊农业气象。 【正文开始】 我国人口众多,吃饭问题是人们生存的头等大事。农业是衣食之源,粮食是人类最基本的生存资料。常言道“民以食为天”,如果在吃饭上出了问题,那就不用再谈什么社会发展了。尤其是在我国,如此大体量的人口,农业的重要性不言而喻,他是我国人民的命脉,不重视农业发展就等同于不尊重生命。所以设定了18亿亩的耕地红线, 设占 农业是我国国民经济的基础,全国14亿人口的粮食、肉类、蔬菜、水果等食物和纺织用纤维等,除少数年份为调剂品种而有进口外,都来自本国农业。如果农业不能提供粮食和必需的食品,那么人民的生活就不会安定,生产就不能发展,国家将失去自立的基础。此外,光保证量还不够,还需要在质上不断提升。当前人们的生活需求早就不满足吃饱饭的阶段,还需要吃好,绿色自然、品质优良的食品越来越受欢迎,而这些全部是我们农业要解决的问题。 农业的重要性就不再赘述了,该聊聊今天的主题农业气象了。我非农业气象专业

信息化和信息系统

馋奶兔 提交于 2020-12-19 05:02:47
1.1 信息系统与信息化 1.1.1 信息的基本概念   1 、信息的质量属性:     ( 1 )精确性,对事务状态描述的精准程度     ( 2 )完整性,对事务状态描述的全面程度,完整信息应包含所有重要事实     ( 3 )可靠性,指信息的来源、采集方法、传输过程是可以信任的,符合预期。     ( 4 )及时性,指获得信息的时刻与事件发生时刻的间隔长短 。昨天的天气信息不论怎样精确、完整,对指导明天的穿衣并无帮助,从这个角度出发,这个信息的价值为零     ( 5 )经济性,指信息获取、传输带来的成本在可以接受的范围之内     ( 6 )可验证性,指信息的主要质量属性可以被证实或者证伪的程度     ( 7 )安全性,指在信息的生命周期中,信息可以被非授权访问的可能性,可能性越低,安全性越高。   2 、信息是有价值的一种客观存在。信息技术主要为解决信息的采集、加工、存储、传输、处理、计算、转换、表现等问题而不断繁荣发展。信息只有流动起来,才能体现其价值,因此信息的传输技术(通常指通信、网络等)是信息技术的核心。信息的传输模型 ,如图     ( 1 )信源:产生信息的实体     ( 2 )信宿:信息的归宿或接收者     ( 3 )信道:传送信息的通道,如 TCP/IP 网络     ( 4 )编码器:在信息论中是泛指所有变换信号的设备     ( 5 )译码器

2020年3C消费电子行业内容营销报告

99封情书 提交于 2020-12-19 04:41:51
1、2020年1月-10月3C消费电子内容营销宏观市场概览 3C类品牌整体曝光时长位居前三,是剧综内容营销最重要品类之一 2020年前10月,共计超过118个3C品牌在国产剧综中有各类不同形式的软广合作,其中品牌合作数量排名第八,露出时长排名第三,可以看出,3C类品牌平均曝光时长较高。 3C类品牌覆盖6成剧综内容,vivo投放力度最大 2020年前10月,3C类品牌投放了近6成各类剧综内容,其中vivo在3C类品牌曝光时长和合作剧综内容方面遥遥领先,整体营销投 放力度最大。 2、2020年1月-10月3C消费电子剧综营销市场洞察 综艺:网综超电综成重点合作内容,3C曝光电视综艺集中度高 2020年前10月3C类27个品牌合作网络综艺29部,高于电视综艺,随着综艺题材越来越多样化、定制化,3C行业合作的综艺题材多达22种,除音乐、选秀外,宠物、曲艺、体育健身等新颖题材也吸引了3C消费电子品牌的合作; 2020年前10月3C软广曝光时长TOP10综艺中,老牌综艺、综N代占七成,10部综艺曝光时长占前10月3C品牌综艺总曝光时长的87%,3C综艺软广投放集中度高。 3C品牌广告投放覆盖8成头部剧集 2020年1月-10月播映指数TOP10剧集中,8部有3C消费电子品牌合作。 2020年1月-10月剧集3C品牌软广类型露出时长TOP10中,单主演互动植入、产品植入品牌露出时长占比均超20%

持续交付体系在高德的实践历程

可紊 提交于 2020-12-19 04:02:22
1. 前序 对于工程团队来说,构建一套具有可持续性的、多方面质量保证的交付体系建设,能够为业务价值的快速交付搭建起高速公路,也能为交付过程中的质量起到保驾护航的作用。本文为大家介绍持续交付体系在高德的演进与落地。 2. 持续交付 正如前序中所总结的,我们需要构建一套持续交付体系,从而保证在质量不下降的前提下,在业务价值交付上有更进一步的突破。那么我们先了解一下什么是持续交付以及集团在持续交付的建设上有哪些指引。 2.1 持续交付概念 引用Martin Fowler大师在2013年时发表的文章,对于持续交付的概念有如下的解释:Continuous Delivery is a software development discipline where you build software in such a way that the software can be released to production at any time. 在上述文中,可以提取几个关键词: 软件开发的标准化准则 可以做到随时随地的发布 什么情况下就可以算是团队达到了持续发布的状态呢?Martin Fowler大师也给出了标准的答案: Your software is deployable throughout its lifecycle Your team prioritizes keeping the