数据分析入门(一)

穿精又带淫゛_ 提交于 2020-02-29 12:14:33

1.数据分析概念

1.1数据分析

是指用适当的统计分析方法对收集来的大量数据进行分析,将他们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。

1.2数据分析包括

  • 描述性数据分析(初级数据分析):使用几个关键数据来描述整体的情况。指标:平均数,众数
    常见的分析方法包括:对比分析法、平均分析法、交叉分析法等。Excel可以实现。
  • 探索性数据分析(高级数据分析):EDA指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。主要包括:汇总统计、可视化
  • 验证性数据分析(高级数据分析):EDA出现之后,数据分析的过程就分为两步了,探索阶段和验证阶段。探索阶段侧重于发现数据中包含的模式或模型,验证阶段侧重于评估所发现的模式或模型。

1.3企业数据分析的目标

  • 进行市场分析和研究
  • 把握产品的市场动向
  • 指定产品研发和销售计划

2.数据分析的三大作用

2.1现状分析

  • 告诉你企业的整体运营情况,通过各项指标衡量企业的运营状况
  • 告诉你企业的各项业务构成,了解各项业务发展和变动情况
  • 通过日常同报完成,如日报,周报,月报

2.2原因分析

  • 有了现状分析,但不知好在哪里,差在哪里,就要进一步开展原因分析,做优化调整。
  • 原因分析通过专题分析完成。

2.3预测分析

  • 需要对企业未来发展趋势做预测,为企业提供参考与决策依据,使企业持续健康发展。
  • 预测分析通过专题分析完成,指定企业年度,季度计划时进行。

数据分析六大步骤

3.1明确分析目的和思路

  • 3.1.1明确分析目的
菜鸟会想 数据分析师会想
这张曲线图很好看,怎么做的? 数据变化背后真相是什么?
这些数据可以做什么样的分析? 从哪些角度分析数据才系统?
高级分析方法在这里能用嘛? 用什么分析方法最有效?
要做多少张图表? 图表是否表达出有效的观点?
除了为数据添加文字说明外还需要说什么? 数据分析的目的达到了吗?
数据分析报告要写多少页? 数据分析报告有说服力吗?
…… ……
  • 3.1.2确定分析思路
    《精益数据分析》这本书推荐
    1.熟悉分析方法论
    2.搭建分析框架
    3.再把分析框架体系化

3.2数据收集

是指按照确定的数据分析框架,收集相关数据的过程,它为数据分析提供素材和依据。
数据的主要来源:

  • 数据库
  • 互联网
  • 市场调研
  • 埋点(前端埋点、后端埋点)
自己埋点和接入第三方统计工具,现在有很多第三方统计工具,神策,Google Analytics、百度统计、CNZZ统计、友盟都是用的比较多的,操作简单又方便。自己埋点比较复杂,当然得到的统计数据更为准确高质量。

3.3数据处理

数据处理 是指对收集到的数据进行加工处理,形成适合数据分析的形式。
数据处理目的 是从大量杂乱、无规则的数据中,抽取有价值、有意义的数据。

3.4数据分析与数据挖掘

  • 3.4.1数据分析
    是指用适当的分析方法和工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程
    数据处理是数据分析的基础。比如处理空数据,选取有价值的特征等
    • 一般数据分析:EXCEL
    • 高级数据分析:SPSS、python
  • 3.4.2
    数据挖掘是一种高级的数据分析方法,它侧重解决四类问题:分类、聚类、关联和预测
    • 特征工程
    • sklear
    • TensorFlow

3.5数据展示

数据展现是指用通过表格和图形的方式来呈现数据
能用图说明问题的就不用表格,能用表格说明问题的就不用文字

  • matplotlib
  • seaborn
  • tableau

3.6撰写报告

  • 需要有一个好的框架,图文并茂,层次清晰
  • 需要有一个明确的结论。
  • 一定要有建议或解决方法

4.常见数据方法论

确定分析思路需要以营销、管理等理论为指导,一般把这些数据分析相关的营销、管理等理论统称为数据分析方法论。
没有业务思维,数据分析就是一堆废纸。
方法论在各种行业都是以各式各样的形式存在着的,它其实就是一个指南针,指导大方向。同样在数据分析中,如果方法论不正确或者不合理,后面的分析结果也就没必要看了,在一个不正确或不合理的方法论的指导下,得到的分析结果是不可能正确的。

4.1数据方法论与数据分析方法的区别

数据分析方法论主要用来指导数据分析师进行一次完整的数据分析,它更多的是指数据分析思路,比如主要从哪几个方面来开展数据分析?各方面包含什么内容和指标。所以数据分析方法论是从宏观的角度指导如何进行数据分析,它就像是一个数据分析的前期规划,指导着后期数据分析工作的开展。而数据分析法是指具体的分析方法,如:对比分析,交叉分析,相关分析等数据分析方法。数据分析法主要从微观角度指导如何进行数据分析。

数据分析方法论 数据分析方法
是对数据分析的宏观指导 主要是从微观角度指导数据分析
一个数据分析的前期规划(如:数据采用何种数据分析?有几个方面需要分析?各个方面有何指标?) 具体的分析方法
PEST、5W2H、逻辑树、4P等分析思路 对比分析法、交叉分析法、相关分析法、回归分析法等

4.2常见数据分析论例举

在这里插入图片描述

  • 4.3.1 PEST分析法
    PEST分析是指宏观环境的分析,P是政治(politics),E是经济(economy),S是社会(society),T是技术(technology)。分析一个企业所处的背景的时候,通常是通过这四个因素来进行分析企业所面临的状况。比如:
    在这里插入图片描述
  • 4.3.2逻辑树分析法
    逻辑树分析法是将一个已知问题当成树干,然后考虑这个问题和哪些问题有关。每想到一点,就给这个问题所在的树干加一个树枝,并标明树枝代表什么问题。逻辑树方法又称问题数、演绎树或分解树。
    在这里插入图片描述
    例如想分析为什么减肥一直失败,可以构造如下逻辑树:
    在这里插入图片描述
    逻辑树的适用要遵循一下原则:
  • 要素化:把相同问题归纳总结成要素;
  • 框架化:将各要素组成框架,遵循不重不漏原则;
  • 关联化:框架内的个元素保持必要的相互管理,简单不孤立。
    逻辑树的缺点:
    涉及相关问题可能会有遗漏。所以在用逻辑树分析法的时候尽量把设计的问题或要素考虑周全。
  • 4.3.3 4P营销理论
    4P营销理论产生于20世纪60年代的美国,将营销要素概括为如下图四类。如果需要了解公司的整体运营情况,就可以采用4P营销理论进行分析指导。
    在这里插入图片描述
    例如对于公司的业务分析可以按如下思路进行分析
  • 产品 公司提供什么产品和服务?哪个销量好?与用户需求是否一致?购买产品的有用户都是何人?
  • 价格 公司销售收入怎样?增长还是减少?用户接受的合理价格是多少?用户购买支付方式怎样?
  • 渠道 公司在各地区有多少销售渠道?用户通过何种渠道都买?公司渠道政策是否具有吸引力?
  • 推广(促销) 投入多少促销资源?效果如何?投放多少宣传广告?效果如何?
     
  • 4.3.4 5W2H分析法(七问分析法)
    5W2H分析法也叫七问分析法,从回答中发现解决问题的线索,即何因(why)、何事(what)、何 人(who)、何时(when)、何地(where)、何做(how)、何价(how much)。是一种常见用户 行为分析方法论。比如O2O的优惠营销信息给用户看,需要搞清楚,用户为什么需要这些优惠,用户的目的是什么?我们提供的优惠是什么?与用户想的是否一致?谁是我们的用户?用户有什么特征?用户喜好在哪个时间段购买?我们的营销活动应该开展在什么时候?用户在线下哪儿去消费?每个地区的线下有什么区别?用户应该怎样去享受优惠?用户去购买花费的成本是多少?我们应该投入多少成本?等等。
    在这里插入图片描述
    下图为5W2H分析在用户购买行为分析上的应用
    在这里插入图片描述
  • 4.3.5用户使用行为理论
    如果说5W2H分析法较价粗糙的话,用户使用行为更加精细。
    用户使用行为是指用户为获取、使用物品或服务所采用的各种行动,一般按照以下过程:对产品有一个认知、熟悉的过程,然后试用,再决定是否继续消费使用,最后成为忠实用户甚至分享产品。
    在这里插入图片描述
    APP同样也可以用用户使用行为轨迹来分析。下图是个简单的流程图,不同产品使用方式不同,具体 分析时在“使用”环节可以更为细致。
    在这里插入图片描述
  • 4.3.6 RFM模型
    传统企业和电商谈的较多的RFM模型,在众多的客户细分模型中,RFM模型是被广泛提到和使用的。RFM模型是网点衡量当前用户价值和客户潜在价值的重要工具和手段。RFM是Rencency(最近一次消费),Frequency(消费频率)、Monetary(消费金额)、三个质保首字母组合,如图所示:
    在这里插入图片描述
    RFM的含义:
  • R(Recency)最近一次消费时间:表示用户最近一次消费距离现在的时间。消费时间越近的客户 价值越大。1年前消费过的用户肯定没有1周前消费过的用户价值大。
  • F(Frequency)消费频率:消费频率是指用户在统计周期内购买商品的次数,经常购买的用户也就是熟客,价值肯定比偶尔来一次的客户价值
  • M(Monetary)消费金额:消费金额是指用户在统计周期内消费的总金额,体现了消费者为企业创利的多少,自然是消费越多的用户价值越大。
    基于这三个维度,将每个维度分为高低两种情况,我们构建出了一个三维的坐标系。
    在这里插入图片描述
  • 4.3.7 AARRR模型(用户增长模型)
    AARRR是Acquisition、Activation、Retention、Revenue、Refer,这五个单词的缩写,分别对应这一款移动应用生命周期中的5个重要环节。
    在这里插入图片描述
    获取用户(Acquisition)
        运营一款移动应用的第一步,毫无疑问是获取用户,也就是大家通常所说的推广。如果没有用户,就谈不上运营。
    提高活跃度(Activation)
        很多用户可能是通过终端预置(刷机)、广告等不同的渠道进入应用的,这些用户是被动地进入应用的。如何把他们转化为活跃用户,是运营者面临的第一个问题。
    提高留存率(Retention)
        有些应用在解决了活跃度的问题以后,又发现了另一个问题:“用户来得快、走得也快”。有时候我 们也说是这款应用没有用户粘性。
        我们都知道,通常保留一个老客户的成本要远远低于获取一个新客户的成本。所以狗熊掰玉米(拿 一个、丢一个)的情况是应用运营的大忌。但是很多应用确实并不清楚用户是在什么时间流失的,于是 一方面他们不断地开拓新用户,另一方面又不断地有大量用户流失。
        解决这个问题首先需要通过日留存率、周留存率、月留存率等指标监控应用的用户流失情况,并采取相应的手段在用户流失之前,激励这些用户继续使用应用。
    获取收入(Revenue)
         获取收入其实是应用运营最核心的一块。极少有人开发一款应用只是纯粹出于兴趣,绝大多数开发者最关心的就是收入。即使是免费应用,也应该有其盈利的模式。
        收入有很多种来源,主要的有三种:付费应用、应用内付费、以及广告。付费应用在国内的接受程度很低,包括Google Play Store在中国也只推免费应用。在国内,广告是大部分开发者的收入来源,而应用内付费在游戏行业应用比较多。
        无论是以上哪一种,收入都直接或间接来自用户。所以,前面所提的提高活跃度、提高留存率,对获取收入来说,是必需的基础。用户基数大了,收入才有可能上量。
    自传播(Refer)
        以前的运营模型到第四个层次就结束了,但是社交网络的兴起,使得运营增加了一个方面,就是基于社交网络的病毒式传播,这已经成为获取用户的一个新途径。这个方式的成本很低,而且效果有可能非常好;唯一的前提是产品自身要足够好,有很好的口碑。
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!