Googleplaystore数据分析
本次所用到的数据分析工具:numpy、pandas、matplotlib、seaborn 一、分析目的 假如接下来需要开发一款APP,想了解开发什么类型的APP会更受欢迎,此次分析可以对下一步计划进行指导。 二、分析维度 本次只对以下八个维度进行分析: 三、数据处理 1、数据介绍 googleplaystore:谷歌应用商店App相关信息 导入数据: #导入分析包import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns df = pd.read_csv('./googleplaystore.csv', usecols=(0, 1, 2, 3, 4, 5, 6)) #简单浏览下数据 df.head() #查看行列数量 df.shape 数据量:10841*8 数据概览: 2、列名称理解: 3、数据清洗 # 查看各个列的非空数据量 df.count() App 10841 Category 10841 Rating 9367 Reviews 10841 Size 10841 Installs 10841 Type 10840 Price 10841 dtype: int64总共有10481条记录,可以看出Rating有很多null值。 清洗数据: #App列