点击上方 蓝色字体 ,选择“ 设为星标 ” 回复”资源“获取更多资源 大数据技术与架构 点击右侧关注,大数据开发领域最强公众号! 暴走大数据 点击右侧关注,暴走大数据! 1.需求说明 1.1 需求 到现在为止的网页访问量 到现在为止从搜索引擎引流过来的网页访问量 项目总体框架如图所示: 1.2 用户行为日志内容 2.模拟日志数据制作 用Python制作模拟数据,数据包含: 不同的URL地址->url_paths 不同的跳转链接地址->http_refers 不同的搜索关键词->search_keyword 不同的状态码->status_codes 不同的IP地址->ip_slices #coding=UTF-8 import random import time url_paths = [ "class/112.html", "class/128.html", "class/145.html", "class/146.html", "class/131.html", "class/130.html", "class/145.html", "learn/821.html", "learn/825.html", "course/list" ] http_refers=[ "http://www.baidu.com/s?wd={query}", "https://www.sogou