数据分析

Jike_Time

≯℡__Kan透↙ 提交于 2019-12-03 13:27:23
数据分析全景图 1. 数据采集 。它是我们的原材料,也是最“接地气”的部分,因为任何分析都要有数据 源。 2. 数据挖掘。 它可以说是最“高大上”的部分,也是整个商业价值所在。之所以要进行数 据分析,就是要找到其中的规律,来指导我们的业务。 因此数据挖掘的核心是挖掘数据 的商业价值,也就是我们所谈的商业智能 BI。 3. 数据可视化。 它可以说是数据领域中万金油的技能,可以让我们直观地了解到数据分析 的结果。 数据采集: 数据挖掘: 数据可视化: 学习数据分析就是从“思 维”到“工具”再到“实践”的一个过程。今天我会从更多的角度来和你分享我的学习经 验,我们可以把今天的内容叫作“修炼指南”。 借用傅盛的话来说,人与人最大的差别在于“认知”,所谓成长就是认知的升级。 很多人存在对“认知“的误解,认为认知不就是概念么?那么你有没有想过,针对同一个 概念,为什么不同的人掌握的程度是不一样的呢? 我们只有把 知识转化为自己的语言,它才真正变成了我们自己的东西 。这个转换的过程, 就是认知的过程。 先思考模型算法---选择工具--- 画图软件SketchBook 数据挖掘知识清单 来源: https://www.cnblogs.com/foremostxl/p/11797003.html

Pandas常用数据结构

為{幸葍}努か 提交于 2019-12-03 11:52:55
Pandas概述   Pandas(Python Data Analysis Library )是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。它是使Python成为强大而高效的数据分析环境的重要因素之一。   Pandas专用于数据预处理和数据分析的Python第三方库,最适合处理大型结构化表格数据   Pandas是2008年Wes McKinney于AQR资本做量化分析师时创建   Pandas借鉴了R的数据结构   Pandas基于Numpy搭建,支持Numpy中定义的大部分计算   Pandas含有使数据分析工作更简单高效的高级数据结构和操作工具   Pandas底层用Cython和C做了速度优化,极大提高了执行效率   Pandas 常用的数据结构有两种:Series 和 DataFrame Series简介   Series 是一个带有 名称 和索引的一维数组,在 Series 中包含的数据类型可以是整数、浮点、字符串、Python对象等。 来源: https://www.cnblogs.com/zry-yt/p/11794941.html

python数据分析必备神器:Anaconda

给你一囗甜甜゛ 提交于 2019-12-03 07:10:44
Anaconda 和 Jupyter notebook已成为数据分析的标准环境。 简单来说,Anaconda是包管理器和环境管理器,Jupyter notebook 可以将数据分析的代码、图像和文档全部组合到一个web文档中。 接下来我详细介绍下Anaconda,并在最后给出Jupyter notebook: 1.Anaconda是什么? 2.如何安装? 3. 如何管理包? 4.Jupyter notebook如何快速上手? 不过在开始前我需要强调下,下面的步骤你要亲自跟着敲一遍并在自己的电脑上实践。虽然下面你会遇到很多命令,给了谁都记不住的。但是别怕,也别中途放弃,因为你没必要记住命令,因为当你在后面学习数据分析用的多了,自然就记住了。 记不住也没关系,学会在哪查找就可以了。你只需要跟着上面步骤操作下,并理解了每一步是干什么的就可以了。后面遇到要做的事情,忘记了回头查这个文档就可以了。 刚开始学习的过程就像下面这个图,只要中途不放弃,自己实际操作一遍,我保证你可以熟练上手。 1.Anaconda是什么? Anaconda在英文中是“蟒蛇”,麻辣鸡(Nicki Minaj妮琪·米娜)有首歌就叫《Anaconda》,表示像蟒蛇一样性感妖娆的身体。 所有你看下面Anaconda的图标就像一个收尾互相咬住的“蟒蛇”。 你可能已经安装了 Python,那么为什么还需要 Anaconda

PyCharm中导入数据分析库

南楼画角 提交于 2019-12-03 06:45:00
虽然安装完 Anaconda 后,就可以直接使用 数据分析库 进行代码编写以及数据分析,但是有时候我还是习惯用PyCharm开发(毕竟有很多年的Android Studio 和IDEA的使用经验),如何在PyCharm中导入常用的数据分析库呢? (1)打开PyCharm,选择左下角的Terminal,更新pip python -m pip install -U pip (2)安装各种库命令 python -m pip install -U numpy scipy matplotlib pandas scikit-learn ipython jupyter sympy nose -U也可写成–user,如果之前安装过,想要更新,则写为 --upgrade (3)也可以简写(但是官方不推荐,使用简单的安装,可能会出问题,比如用-user安装的文件不会写入系统目录) pip install numpy pip install scipy pip install pandas pip install matplotlib 来源: CSDN 作者: SunnyRivers 链接: https://blog.csdn.net/Android_xue/article/details/85040823

如何用数据分析助力中国银行数字化转型?

萝らか妹 提交于 2019-12-03 04:56:50
近日,永洪科技签约中国银行,未来将通过永洪科技在商业智能领域的技术实力和完善的金融行业解决方案,助力中国银行打造用户体验完美、场景生态丰富的数字化银行。 中国银行是中国持续经营时间最久的银行,从1912年2月成立发展至今,中国银行已成为中国全球化和综合化程度最高的银行,在中国内地及57个国家和地区设有机构,拥有比较完善的全球服务网络,形成了公司金融、个人金融和金融市场等商业银行业务为主体,涵盖投资银行、直接投资、证券、保险、基金、飞机租赁等多个领域的综合服务平台,为客户提供全面的金融服务。 1994年,中国银行改为国有独资商业银行。 2004年8月,中国银行股份有限公司挂牌成立。 2006年6月、7月,中国银行先后在香港联交所和上海证券交易所成功挂牌上市,成为国内首家“A+H”同时发行上市的商业银行。 作为北京2008年夏季奥运会、北京2022年冬季奥运会官方合作伙伴,是中国唯一的“双奥银行”。 2018年,中国银行再次入选全球系统重要性银行,成为新兴市场经济体中唯一连续8年入选的金融机构。 而随着互联网、大数据、云计算、人工智能等技术的发展,中国步入数据化转型的快车道。虚拟化及电子化交易,成为大数据时代金融行业的发展特征。而金融企业在数字化转型上,对于自身大数据的需求越来越明显,场景也越来越具体化。能否充分利用自己的数据优势,将成为金融机构转型升级的关键。 因此

大屏数据可视化示例

强颜欢笑 提交于 2019-12-03 04:14:20
数据可视化:把相对复杂的、抽象的数据通过可视的、交互的方式进行展示,从而形象直观地表达数据蕴含的信息和规律。 数据可视化是数据空间到图形空间的映射,是抽象数据的具象表达。 数据可视化交互的基本原则:总览为先,缩放过滤按需查看细节。 大屏数据可视化是当前可视化领域的一项热门应用,通常可以分为信息展示类、数据分析类及监控预警类。 大屏数据可视化应用的难点并不在于图表类型的多样化,而在于如何能在简单的一页之内让用户读懂数据之间的层次与关联,这就关系到布局、色彩、图表、动效的综合运用。如排版布局应服务于业务,避免为展示而展示;配色一般以深色调为主,注重整体背景和单个视觉元素背景的一致性。 制作可视化大屏,最便捷有效的方式是使用DataV、帆软等报表工具,而本示例项目则使用ECharts自行开发。 地图数据可视化 - 基于ECharts Geo 3D图表展示 - 基于ECharts GL 热力图展示 - 基于ECharts & 百度地图 ECharts扩展示例 旭日图 - 基于ECharts V4.2 地理信息数据 - ECharts & Baidu Map 项目Git地址: https://github.com/yyhsong/iDataV 演示地址: https://yyhsong.github.io/iDataV 后记: 除自行开发可视化大屏外,还可以通过第三方服务来快速实现

R语言实战-云图

匿名 (未验证) 提交于 2019-12-03 00:43:02
Ŀ¼ 第一部分  入门 第2章  创建数据集 第3章  图形初阶 第4章  基本数据管理 第5章  高级数据管理 第二部分  基本方法 第6章  基本图形 第7章  基本统计分析 第三部分  中级方法 第8章  回归 第9章  方差分析 第10章  功效分析 第11章  中级绘图 第12章  重抽样与自助法 第四部分  高级方法 第13章  广义线性模型 第14章  主成分和因子分析 第15章  处理缺失数据的高级方法 第16章  高级图形进阶 后记:探索R的世界  357 附录A  图形用户界面  359 附录B  自定义启动环境  362 附录C  从R中导出数据  364 附录D  制作出版级品质的输出  366 附录E  R中的矩阵运算  374 附录F  本书中用到的扩展包  376 附录G  处理大数据  381 附录H  更新R  383 原文:https://www.cnblogs.com/LearnFromNow/p/9348355.html

三句话让你面试成功率提高50%

匿名 (未验证) 提交于 2019-12-03 00:37:01
这个题目真不是标题党,三句话听懂真能达到面试成功率提高 50% 的效果。 这些年我参与过不少面试,也面试过别人不少次。我参与的面试,基本都能拿到 offer ,印象中也就挂过一两次。从毕业找工作开始就被周围的人封为面霸,但是好多人可能都是以为我靠的是忽悠,其实是他们搞不懂面试的本质,更确切的说是不懂自我营销的艺术。后来我工作了,开始走上管理岗位了,也开始面试别人,但是大部分面试者实在太差劲了,交谈过程根本给不到我想要的东西,以至于我觉得中国的求职培训其实是很有必要的。如果你本身不太擅长面试,这篇文章教你的三句话,真的能让你面试成功率提高很多,甚至不止 50% 。但是希望读者们看了之后能多想一下,理清一下相关的逻辑套路,并真的把它应用到实践里面。这篇文章不是内含干货,而是全部都是干货。 1. 带一份工作计划过去 有的人看到这点,肯定说:我X,这么麻烦!写这么多字儿带过去要是面试还没通过岂不是亏了! 我想说的是:工作量没你想象的这么大,你只需要根据对应的职位要求和公司情况,草拟一份工作计划带过去,让人家知道你上任之后下一步的工作思路就可以了。一方面是展现你的专业实力,另外一方面也是展现你的诚意。 我记得切尔西老板阿布拉莫维奇谈到当年选择穆尼尼奥来当主教练的原因时说:“面试的时候,穆尼尼奥打开他的电脑,像我展示他的ppt,从建队思路,到转会市场的规划,具体到每个位置需要怎么补强