淘宝商品

数据分析-淘宝用户行为分析

亡梦爱人 提交于 2019-11-27 06:09:59
一、项目背景和目的 项目数据来源于 https://tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1 ,通过此项目学习电商数据分析的指标与数据分析的基本方法。 二、分析维度 根据现有数据及分析目的,从四个维度进行分析: 第一个维度:用户购物情况整体分析 以PV、UV、平均访问量、跳失率等指标,分析用户最活跃的日期及活跃时段,了解用户行为习惯 第二个维度:商品购买情况分析 从成交量、人均购买次数、复购率等指标,探索用户对商品的购买偏好,了解商品的销售规律 第三个维度:用户行为转化漏斗分析 从收藏转化率、购物车转化率、成交转化率,对用户行为从浏览到购买进行漏斗分析 第四个维度:参照RFM模型,对用户进行分类,找出有价值的用户 三 、分析正文 分析步骤如下: 提出问题------理解数据------数据清洗------构建模型------数据可视化 (一)提出问题 用户最活跃的日期及时段 用户对商品有哪些购买偏好 用户行为间的转化情况 用户分类,哪些是有价值的用户 (二)理解数据 用户行为类型又分为四种: pv: 商品详情页pv,等价于点击 buy:商品购买 cart:商品加入购物车 fav:收藏 (三)数据清洗 包含数据导入(采用Navicat)、缺失值处理、一致化处理、异常值处理(2017.11.25到2017.12

Python爬取淘宝商品信息并对其进行数据分析

淺唱寂寞╮ 提交于 2019-11-26 19:52:51
上一篇文章 https://www.jianshu.com/p/9683898a4237 已经爬取了淘宝商品信息了现在对其进行数据分析 ####对商品标题进行文本分析 使用jieba分词器,对raw_title列每一个商品标题进行分词,通过停用表StopWords对标题进行去除停用词。因为下面要统计每个词语的个数,所以 为了准确性,在这里对过滤后的数据 title_clean 中的每个list的元素进行去重,即每个标题被分割后的词语唯一。 代码如下: # 将所有商品标题转换为list title = data.raw_title.values.tolist() ''' 遇到不懂的问题?Python学习交流群:821460695满足你的需求,资料都已经上传群文件,可以自行下载! ''' # 对每个标题进行分词,使用jieba分词 import jieba title_s = [] for line in title: title_cut = jieba.lcut(line) title_s.append(title_cut) # 导入停用此表 stopwords = [line.strip() for line in open('StopWords.txt', 'r', encoding='utf-8').readlines()] # 剔除停用词 title_clean = []