技术文章

洛伦兹曲线(Lorenz curve)提升指数、提升表和提升图

有些话、适合烂在心里 提交于 2021-02-17 21:57:53
洛伦兹曲线(Lorenz curve)也叫提升图或收益曲线 提升图主要通过随机选择比较模型表现。 绿色曲线比黄色曲线更加不平衡 基尼系数=A/(A+B) A+B为正方形一半恒定面积,A区间面积越大,基尼系数越大 Lift, Lift Table, and Lift Chart 提升指数、提升表和提升图 什么是Lift? I) Lift(提升指数)是评估一个预测模型是否有效的一个度量;这个比值由运用和不运用这个模型所得来的结果计算而来。 II) 一个简单的数字例子: i. 比如说你要向选定的1000人邮寄调查问卷。以往的经验告诉你大概20%的人会把填好的问卷寄回给你,即1000人中有200人会对你的问卷作出回应(response),用统计学的术语,我们说baseline response rate是20%; ii. 如果你现在就邮寄问卷,1000份你期望能收回200份,这可能达不到一次问卷调查所要求的回收率,比如说工作手册规定邮寄问卷回收率要在25%以上; iii. 通过以前的问卷调查,你收集了关于问卷采访对象的相关资料,比如说年龄、教育程度之类。利用这些数据,你确定了哪类被访问者对问卷反应积极。假设你已经利用这些过去的数据建立了模型,这个模型把这1000人分了类,现在你可以从你的千人名单中挑选出反应最积极的100人来,这10%的人的反应率(response rate)为60%。那么

gradle中的增量构建

て烟熏妆下的殇ゞ 提交于 2021-02-17 21:51:38
简介 在我们使用的各种工具中,为了提升工作效率,总会使用到各种各样的缓存技术,比如说docker中的layer就是缓存了之前构建的image。在gradle中这种以task组合起来的构建工具也不例外,在gradle中,这种技术叫做增量构建。 增量构建 gradle为了提升构建的效率,提出了增量构建的概念,为了实现增量构建,gradle将每一个task都分成了三部分,分别是input输入,任务本身和output输出。下图是一个典型的java编译的task。 以上图为例,input就是目标jdk的版本,源代码等,output就是编译出来的class文件。 增量构建的原理就是监控input的变化,只有input发送变化了,才重新执行task任务,否则gradle认为可以重用之前的执行结果。 所以在编写gradle的task的时候,需要指定task的输入和输出。 并且要注意只有会对输出结果产生变化的才能被称为输入,如果你定义了对初始结果完全无关的变量作为输入,则这些变量的变化会导致gradle重新执行task,导致了不必要的性能的损耗。 还要注意不确定执行结果的任务,比如说同样的输入可能会得到不同的输出结果,那么这样的任务将不能够被配置为增量构建任务。 自定义inputs和outputs 既然task中的input和output在增量编译中这么重要

PSi-Population Stability Index (PSI)模型分稳定性评估指标

喜欢而已 提交于 2021-02-17 21:51:05
由于模型是以特定时期的样本所开发的,此模型是否适用于开发样本之外的族群,必须经过稳定性测试才能得知。稳定度指标(population stability index ,PSI)可衡量测试样本及模型开发样本评分的的分布差异,为最常见的模型稳定度评估指针。其实PSI表示的就是按分数分档后,针对不同样本,或者不同时间的样本,population分布是否有变化,就是看各个分数区间内人数占总人数的占比是否有显著变化。公式如下: PSI实际应用范例: 1)样本外测试   针对不同的样本测试一下模型稳定度,比如训练集与测试集,也能看出模型的训练情况,我理解是看出模型的方差情况。 2)时间外测试   测试基准日与建模基准日相隔越远,测试样本的风险特征和建模样本的差异可能就越大,因此PSI值通常较高。至此也可以看出模型建的时间太长了,是不是需要重新用新样本建模了。 PSI揭秘拿破仑和希特勒为何 俄罗斯失败 PSI揭秘2008年美国华尔街金融危机 独裁者与信用危机 拿破仑和希特勒试图 俄罗斯和2007 - 08年的金融危机有何相似之处? 拿破仑试图在1812年 俄罗斯,希特勒于1941年重复了拿破仑的不端行为 - 两次 都以独裁者军队的严重失败而告终。拿破仑和希特勒的军队远远优于俄罗斯人。正是这场战斗的条件导致了这些失败。俄罗斯的冬天经常对这些军队的命运负责。实际上

深入了解Mysql索引

时间秒杀一切 提交于 2021-02-17 21:49:29
前言 欢迎关注我的微信公众号【 Mflyyou 】获取持续更新。 github.com/zhangpanqin/MFlyYou 收集技术文章及我的系列文章,欢迎 Star。 数据库中的索引是为了提高查询效率的,将像字典的目录一样。 当我们了解索引的原理之后,就没有必要去死记硬背所谓的 Mysql 军规之类的东西了。 本文内容 索引的类型:UNIQUE,FULLTEXT,SPATIAL,NORMAL(普通索引) 索引为什么会采用 B+ 树结构,为什么不是二叉树、B- 树 Mysql 中 B+ 树索引 和 Hash 索引应该选哪个 为什么索引的使用需要遵循 最左匹配原则 联合索引 、 聚簇索引 和 覆盖索引 分别是什么 索引添加的判断依据是什么 索引 Mysql 中常见的索引类型有: 普通索引 唯一索引 全文索引 空间索引 Mysql 中索引的数据结构有: B+Tree ,存储引擎 InnoDB 和 MyISAM 都支持。因为我们一般都是使用存储引擎 InnoDB 和 MyISAM ,我们都是使用 B+Tree 数据结构的索引。 HASH ,存储引擎 MEMORY 支持,存储引擎 InnoDB 和 MyISAM 不能手动定义 HASH 索引。 因此,我们详细了解 B+Tree 就行了。 我们先来介绍一下两种索引的数据结构的区别,感受一些各自的使用场景。 Hash 数据结构的索引

nacos注册中心和配置中心

无人久伴 提交于 2021-02-17 21:49:06
pom: <!-- https://mvnrepository.com/artifact/com.alibaba.cloud/spring-cloud-starter-alibaba-nacos-discovery 注册中心依赖--> < dependency > < groupId > com.alibaba.cloud </ groupId > < artifactId > spring-cloud-starter-alibaba-nacos-discovery </ artifactId > < version > 2.2.1.RELEASE </ version > </ dependency > <!-- https://mvnrepository.com/artifact/com.alibaba.cloud/spring-cloud-starter-alibaba-nacos-discovery 配置中心依赖--> < dependency > < groupId > com.alibaba.cloud </ groupId > < artifactId > spring-cloud-starter-alibaba-nacos-config </ artifactId > < version > 2.2.1.RELEASE </ version > </

腾讯云与阿里云竞争激烈:销售团队积极争取每一笔交易

喜欢而已 提交于 2021-02-17 21:47:13
7月3日消息,据国外媒体报道,疫情爆发后,企业的云服务需求急剧上升,而 腾讯云 也在借此机会努力追赶 阿里云 。 腾讯云 腾讯云 部门的一位知情人士表示,现在和阿里巴巴的竞争非常激烈,销售团队在和他们抢每一笔交易。 仅今年, 腾讯云 计算部门就招聘了超过3000名员工。2月,因企业视频带宽的需求激增,腾讯在八天内增添了100,000台云服务器,以支持当时刚刚推出两个月的产品,腾讯会议。 腾讯还扩大了自主研发的云服务器的使用,并承诺加快在武汉的数字产业中心的建设以处理中国中部的云和智慧城市项目。 今年5月,腾讯宣布,未来五年将投资人民币5,000亿元(约合706亿美元)于技术基础设施,包括云计算、数据中心和5G网络等领域。 其中,在数据中心方面,腾讯将陆续在全国新建多个百万级服务器规模的大型数据中心。 阿里也有类似表态。4月, 阿里云 宣布,未来3年再投2000亿元,用于云操作系统、服务器、芯片、网络等重大核心技术研发和数据中心建设。 据阿里介绍,达摩院XG实验室、平头哥等研究成果将率先应用在 阿里云 下一代数据中心。飞天云操作系统、含光800芯片、神龙服务器、自研云交换机、高性能低延时网络、大计算系统集群等核心自研技术将在云数据中心大规模部署。 研究机构Canalys的数据显示,第一季度中国云基础建设服务市场同比增长67%至39亿美元。阿里巴巴占据了44.5%的市场份额; 腾讯云

Consul替代Eureka

感情迁移 提交于 2021-02-17 21:19:01
原文:https://www.cnblogs.com/ityouknow/p/9340591.html 在上个月我们知道 Eureka 2.X 遇到困难停止开发了,但其实对国内的用户影响甚小,一方面国内大都使用的是 Eureka 1.X 系列,另一方面 Spring Cloud 支持很多服务发现的软件,Eureka 只是其中之一,下面是 Spring Cloud 支持的服务发现软件以及特性对比: Feature euerka Consul zookeeper etcd 服务健康检查 可配支持 服务状态,内存,硬盘等 (弱)长连接,keepalive 连接心跳 多数据中心 — 支持 — — kv 存储服务 — 支持 支持 支持 一致性 — raft paxos raft cap ap ca cp cp 使用接口(多语言能力) http(sidecar) 支持 http 和 dns 客户端 http/grpc watch 支持 支持 long polling/大部分增量 全量/支持long polling 支持 支持 long polling 自身监控 metrics metrics — metrics 安全 — acl /https acl https 支持(弱) spring cloud 集成 已支持 已支持 已支持 已支持 在以上服务发现的软件中,Euerka 和 Consul

浙大版《C语言程序设计(第3版)》题目集 练习2-9 整数四则运算 (10 分)

被刻印的时光 ゝ 提交于 2021-02-17 21:10:39
练习2-9 整数四则运算 (10 分) 本题要求编写程序,计算2个正整数的和、差、积、商并输出。题目保证输入和输出全部在整型范围内。 输入格式: 输入在一行中给出2个正整数A和B。 输出格式: 在4行中按照格式“A 运算符 B = 结果”顺序输出和、差、积、商。 输入样例: 3 2 输出样例: 3 + 2 = 5 3 - 2 = 1 3 * 2 = 6 3 / 2 = 1 思路:格式化输出。 代码如下: #include <stdio.h> int main() { int a, b, c, d, e, f; scanf("%d%d",&a,&b); c=a+b;//计算“+”的结果 d=a-b;//计算“-”的结果 e=a*b;//计算“*”的结果 f=a/b;//计算“/”的结果 printf("%d + %d = %d\n",a,b,c); printf("%d - %d = %d\n",a,b,d); printf("%d * %d = %d\n",a,b,e); printf("%d / %d = %d\n",a,b,f); return 0; }       来源: oschina 链接: https://my.oschina.net/u/4320155/blog/3657464

SSH断开重连机制提高SSH隧道的稳定性,

和自甴很熟 提交于 2021-02-17 21:00:52
Ubuntu中让SSH自动重连,简单的办法是安装autossh和expect。autossh负责自动重连,expect负责自动输入密码。 安装: sudo apt-get install autossh sudo apt-get install expect 新建一个sh脚本,例如:pastwall.sh,内容: #!/bin/bash HOST="xx.xxx.com" USER="yourname" PASS="yourpassword" CMD=$@ VAR=$(expect -c " spawn /usr/bin/autossh -M 2000 -N -v -D 127.0.0.1:7070 $USER@$HOST $CMD match_max 100000 expect \"*?assword:*\" send -- \"$PASS\r\" send -- \"\r\" expect eof ") echo "===============" echo "$VAR" 别忘记: $chmod u+x pastwall.sh 附: expect spawn、linux expect 用法 http://blog.csdn.net/ysdaniel/article/details/7059511 转帖自: http://www.cnblogs.com/coderzh

寒假集训——Find Metal Mineral

非 Y 不嫁゛ 提交于 2021-02-17 20:54:54
题目链接 题意:给出一颗生成树,1<=N<=10000,在某一个节点有k个机器人(k<=10),然后机器人从这里开始走,要求遍历完节点,随便停到什么地方.求最少的路程总和. 题解: 树形dp,关键是dp[u][i],i的定义,因为机器人可能从子树再跑回来,然后为了避免重复讨论,应该定义为:在u为根的子树上停了几个机器人.这样定义肯定不会重复,重点就是之后的横着怎么dp过去.考虑最后一个,枚举它:如果是0,那么一定是只有一个机器人进来然后绕了一圈走了,可以反证.如果是1,一定是1个,反证可以,之后i个就是i..... 然后就能这样dp过去.定位也很关键,对于每一个子树的选择是:必须只能选一个的背包. 重点:树形dp中i的正确不重复定义,有效避免枚举,然后在这基础上正确推出dp方程. #include <iostream> #include <cstdio> #include <cstring> #include <string> #include <cmath> #include <ctype.h> #include <limits.h> #include <cstdlib> #include <algorithm> #include <vector> #include <queue> #include <map> #include <stack> #include <set>