快切

数据应用场景之标签管理体系

匆匆过客 提交于 2020-12-31 08:17:43
一、标签简介 标签概念 标签,最初用来对实物进行分类和标记,例如标明物品的品名、重量、体积、用途等简要信息。后来逐渐流行到数据行业,用来标记数据,对数据快速分类获取和分析。 标签特点 精确描述定位和搜索,具有生命周期的特性,可以计算,配置和规则化处理。可以用标签来描述各种结构和非结构化[文档、图片、视频等]的数据,从而使这些内容被高效的管理。 描述特征:标签[手机颜色],特征[红色,白色]; 描述规则:标签[活跃用户],规则[每日登陆,产生交易]; 标签价值 精细运营的基础,有效提高流量精准和效率。 帮助产品快速定位需求数据,进行精准分析; 能帮助客户更快切入到市场周期中; 深入的预测分析数据并作出及时反应; 基于标签的开发智能推荐系统; 基于某类下的数据分析,洞察行业特征; 标签的核心价值,或者说最常用的场景:实时智能推荐,精准化数字营销。 二、标签定义 属性标签 属性标签是描述基本特征,不需要行为产生,也不是基于规则引擎分析,例如基于用户实名认证信息,获取:性别,生日,出生日期等特征。变动频率极小,且精准性较高。 行为标签 通过不同业务渠道埋点,捕捉用户的行为数据,基于这些数据分析,形成结果描述的标签,例如:分析用户「网购平台」,得到的结果拼多多,淘宝,京东,天猫等。这些都是需要通过行为数据来判断的标签。 规则标签 规则下分析出来的标签,更多是基于产品或者运营角度来看

国际药厂裁员潮背后:中国摆脱“追随者”角色的新机会已出现丨专家观点

∥☆過路亽.° 提交于 2020-10-02 21:17:27
     6 月 26 日,法国制药公司赛诺菲 Sanofi(NYSE:SNY)宣布将在欧洲裁员 1680 人,包括法国员工约 1000 人。消息人士透露,赛诺菲期盼以此来节约成本和提高运营效率。这次裁员更多的是去年赛诺菲新上任 CEO Paul Hudson 宣布的策略调整计划的其中一个举措,目的是在 2022 年之前节省 20 亿欧元(约 22 亿美元)。   早在 2019 年年末,赛诺菲就开展了两个“大动作”:一是,斥资 25 亿美元收购生物技术公司 Synthorx。这次收购主要看中的是新一代 IL-2 抗癌 IO 药物 THOR-707,为的是加强赛诺菲在肿瘤免疫产品管线。   另一个是,放弃糖尿病和心血管领域疾病药物的研究。糖尿病药物 Lantus 曾是赛诺菲的 “明星药物” 之一,2017 年第三季度给公司带来超过 12 亿美元的收入,但随着竞争对手的“打压”,Lantus 销售直线下降,变成了“鸡肋”。其他的糖尿病药物及心血管药物也遭遇了同样的命运。    裁员及放弃部分管线的背后,是赛诺菲对肿瘤、神经性疾病、罕见病及疫苗等新赛道的布局,也是对基因治疗、细胞治疗、核酸药等新疗法所下的重注。 6 月 23 日,赛诺菲宣布与临床阶段 mRNA 治疗公司 Translate Bio 扩大合作关系,以潜在 19 亿美元的价格换取 Translate Bio 技术开发

ceph-mds的standby_replay高速热备状态

随声附和 提交于 2020-01-07 01:12:03
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> ceph的MDS是cephFS文件存储服务的元数据服务。 当创建cephfs后便会有ceph-mds服务进行管理。默认情况下ceph会分配一个mds服务管理cephfs,即使已经创建多个mds服务,如下: [root@ceph-admin my-cluster]# ceph-deploy mds create ceph-node01 ceph-node02 ....... [root@ceph-admin ~]# ceph -s cluster: id: 06dc2b9b-0132-44d2-8a1c-c53d765dca5d health: HEALTH_OK services: mon: 2 daemons, quorum ceph-admin,ceph-node01 mgr: ceph-admin(active) mds: mytest-fs-1/1/1 up {0=ceph-admin=up:active}, 2 up:standby osd: 3 osds: 3 up, 3 in rgw: 2 daemons active data: pools: 8 pools, 64 pgs objects: 299 objects, 137 MiB usage: 3.4 GiB used, 297 GiB /

Hadoop高可用集群——HA

℡╲_俬逩灬. 提交于 2019-12-30 11:40:10
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 在Hadoop2.0之前,HDFS的NameNode存在单点故障问题。所谓HA,集高可用(7*24小时不中断服务)。HA严格意义来说应分成各个组件的HA机制:HDFS的HA和YARN的HA。HDFS HA功能通过配置Active/Standby两个NameNode实现在集群中对NameNode的热备份来解决单点故障。如果出现故障(如:机器崩溃/机器需要升级维护),这时可以通过HA将NameNode很快切换到另一台机器。 HA 集群配置 环境准备 配置主机名及主机名和ip映射 关闭防火墙 ssh免密登录 安装JDK,配置环境变量 配置Zookeeper集群 解压Zookeeper到指定目录 $ tar -zxvf zookeeper-3.4.10.tar.gz -C /export/servers 在/export/servers/zookeeper-3.4.10/这个目录下创建 zkData mkdir -p zkData 重命名/export/servers/zookeeper-3.4.10/conf 这个目录下的 zoo_sample.cfg 为 zoo.cfg并修改 mv zoo_sample.cfg zoo.cfg //具体配置 dataDir=/export/servers/zookeeper-3.4