1.数据分析与可视化:
数据分析是指用适当的统计分析方法对收集到的大量的数据进行分析,提取有用的信息和形成的结论而对数据加以详细研究和概括总结的过程。
收集数据 -------> 提取信息------------> 形成结论 ---------> 借助图示化手段表示数据。
2.数据分析可视化流程:
- 定义分析目标
- 数据采集及预处理[数据的预处理就是数据清洗,清掉不满足条件的数据]
- 数据分析挖掘
- 数据可视化
3.1 可视化形式:
- 统计图(直方图、折线图、饼图)
- 分布图(热力图、散点图、气泡图)
3.2 常用工具:
- 绘图工具: matplotlib PyChart reportlab
- 平台工具: Jupyter Notebook, Pycharm
Matplotlib:
安装:pip3 install matplotlib
1.matplotlib的基本配置:
通过修改matplotlib.rcParams。rcParams是matplotlib存放设置的字典,修改字典键值对以改变matplotlib绘图的相关设置。
常用配置:
plt.rcParams['font.sans-serif']=['SimHei'] #中文支持 plt.rcParams['axes.unicode_minus']=False #正常显示负号 plt.rcParams['lines.linewidth']=5 #设置线条宽度 plt.rcParams['lines.color']='red' #设置线条颜色 plt.rcParams['lines.linestyle']='-' #设置线条样式
2.图形绘制:
2.1 直方图:plt.hist(data)
2.2 条形图:plt.bar(x,y)
2.3 折线图:plt.plot(x,y)
2.4 饼图:plt.pie(data)
2.5 散点图:plt.scatter(X,Y)
其他图形:极线图、阶梯图、堆积图、分块图、气泡图等官网有。
来源:51CTO
作者:所爱隔山海。
链接:https://blog.csdn.net/qq_39969226/article/details/101059695