大数据实战(一)
1.大数据应用领域 互联网领域 搜索引擎 推荐引擎 电信领域 用户画像 用户行为分析 医药生物领域 DNA分析 视频领域 视频存储 视频分析 金融领域 信用卡欺诈分析 用户分析 矿产勘探领域 矿产石油勘察预测 1.1大数据框架 1.2 Hadoop生态系统 1.3 Spark 生态系统 2.推荐系统的设计 2.1需求分析和用户调研 用户: 新用户→根据注册时候选择的标签多样性的推荐 老用户→根据以往历史习惯,个性化推荐 考虑主流用户还是小众群众。根据不同的用户推荐不同的东西,设计不同的推荐算法,综合使用 推荐什么 当用户购买的东西价格相近时,多考虑用户对内容主题的兴趣,用户购买的类别 当价格不同时,考虑用户购买物品的品牌、价格、内容 新品促销或者库存清理,考虑整体系统的获利 何时 公众号还是短信 推荐的周期,短期、长期还是周期性的 何地 2.2 推荐功能设计 个性化首页,老用户根据历史行为个性化推荐,新用户根据热度推荐,或者根据选择的标签推送 2.3 界面设计 如何将推荐结果呈现给用户? 如何收集用户信息和反馈数据? 2.3 架构设计 硬件资源的限制 用户数、item数 存储、接口 实时响应的要求 2.4 算法设计 优化准则 数据预处理 离线算法 在线算法 功能实现策略 推荐解释 2.5 系统评测设计 用户反馈 点击率?转换率?单次使用时长?重复使用率? A/B测试 将用户分为两组