leaf

scikit-learn Adaboost类库使用小结

≯℡__Kan透↙ 提交于 2020-04-09 01:03:06
    在 集成学习之Adaboost算法原理小结 中,我们对Adaboost的算法原理做了一个总结。这里我们就从实用的角度对scikit-learn中Adaboost类库的使用做一个小结,重点对调参的注意事项做一个总结。 1. Adaboost类库概述     scikit-learn中Adaboost类库比较直接,就是AdaBoostClassifier和AdaBoostRegressor两个,从名字就可以看出AdaBoostClassifier用于分类,AdaBoostRegressor用于回归。     AdaBoostClassifier使用了两种Adaboost分类算法的实现,SAMME和SAMME.R。而AdaBoostRegressor则使用了我们原理篇里讲到的Adaboost回归算法的实现,即Adaboost.R2。     当我们对Adaboost调参时,主要要对两部分内容进行调参,第一部分是对我们的Adaboost的框架进行调参, 第二部分是对我们选择的弱分类器进行调参。两者相辅相成。下面就对Adaboost的两个类:AdaBoostClassifier和AdaBoostRegressor从这两部分做一个介绍。 2. AdaBoostClassifier和AdaBoostRegressor框架参数    

《一天一模式》— 组合模式

旧街凉风 提交于 2020-04-09 00:55:10
一、组合模式的概念 组合模式,将对象组合成树形结构以表示“部分-整体”的层次结构,组合模式使得用户对单个对象和组合对象的使用具有一致性。掌握组合模式的重点是要理解清楚 “部分/整体” 还有 ”单个对象“ 与 "组合对象" 的含义。 听懂了这句话就不用往下看了,说明你会了。 听不懂我觉得也正常,如果用一句话能学会就没人看书了。像我这种笨人,都是学会了一个模式,然后往它的定义上套。 二、什么时候使用组合模式 需要某种树形结构,可以容纳菜单、子菜单和菜单项; 需要能够在各个菜单之间随意游走,同级的菜单类型可以不同; 需要能够在遍历时,随意遍历各个菜单; 也就是说,树形结构中的菜单,子菜单是容器,菜单项是内容。 组合模式是要让容器和内容具有一致性,创造出递归结构, 并且在某一个场景下,容器和内容可以无差别使用,图中第二层既可以是Leaf,也可以是Node。 常见的场景有:部门树、功能菜单树、字典树等等,在遇到可递归的树形结构需求时,都可以考虑一下是否需要使用组合模式。 三、怎么使用组合模式 以一个需求为例进行说明,还是汽车相关的。 汽车厂商将汽车分为品牌、车系、车型、他们之前是属性关系,品牌下有多个车系,车系下有多个车型,具体例子: 品牌是奔驰。 奔驰下有多个车系,A级,C级,E级。 每个车系下有多个车型,A级下有A180,A200,A220。 需求是,打印出所有的车系和车型

ARM处理器的堆栈和函数调用,以及与Sparc的比较

那年仲夏 提交于 2020-04-07 02:12:43
主要描述一下ARM处理器的堆栈和函数调用过程,并和Sparc处理器进行对比分析。 关于ARM处理器的内容来自以下网址,该网站是个学习ARM汇编的好地方,对该篇文章注解了一下,最后和Sparc进行对比。 https://azeria-labs.com/functions-and-the-stack-part-7/ Sparc的原理, Sparc V8 汇编指令、寄存器窗口、堆栈、函数调用 STACK AND FUNCTIONS In this part we will look into a special memory region of the process called the Stack. This chapter covers Stack’s purpose and operations related to it. Additionally, we will go through the implementation, types and differences of functions in ARM. 堆栈是进程的一个特殊内存区域。堆栈的使用对于不同处理器的实现是不一样的。介绍堆栈的实现,类型以及。。。 STACK Generally speaking, the Stack is a memory region within the program/process.

Kaggle竞赛入门(一):决策树算法的Python实现

心已入冬 提交于 2020-04-06 17:27:32
本文翻译自kaggle learn,也就是kaggle官方最快入门kaggle竞赛的教程,强调python编程实践和数学思想(而没有涉及数学细节),笔者在不影响算法和程序理解的基础上删除了一些不必要的废话,毕竟英文有的时候比较啰嗦。 一.决策树算法基本原理 背景:假设你的哥哥是一个投资房地产的大佬,投资地产赚了很多钱,你的哥哥准备和你合作,因为你拥有机器学习的知识可以帮助他预测房价。你去问你的哥哥他是如何预测房价的,他告诉你说他完全是依靠直觉,但是你经过调查研究发现他预测房价是根据房价以往的表现来进行预测的,作为一个机器学习编程者,正好也可以以往的房价进行未来房价的预测。机器学习当中有一个决策树的算法,可以用于未来房价的预测,这个模型是这样的,如下所示: 第一行的第一框表示程序的流程图:"如果房子里超过了2个卧室"则执行yes,不是的话则执行“No”,执行yes之后,我们就对它进行预测后的房价是188000刀,执行“no”之后的预测房价则是178000刀,这就是一个简单的决策树。一个条件只有是和否两个分支,但是能不能让这个模型更加合理一点呢?因此我们拟合出了第二个模型,如下图所示: 可以从中看到,除了考虑房子里拥有的房间数量,第二个statement(条件)还考虑到了房子的总面积是多大,接着再根据房间的总面积大小进行预测。得到预测的房价也就是prediccted price

antd框架tree树动态插入,解决新版Antd无法使用TreeNodes问题

江枫思渺然 提交于 2020-04-05 22:37:16
本文主要解决: iview树形组件使用问题,已经有后台数据,请问如何对应treeData的字段? 如下所示 { title: ' child 1-1 ' , expand: true , children: [ { title: ' leaf 1-1-1 ' , expand: true }, { title: ' leaf 1-1-2 ' , expand: true } ] }, { title: ' child 1-2 ' , expand: true , children: [ { title: ' leaf 1-2-1 ' , expand: true }, { title: ' leaf 1-2-1 ' , expand: true } ] } ] 这是iview的demo数据,这里面children title是固定的字段和我们回台返回数据字段不对应怎么办?求指教,比如我真实数据是childrenFilenames,还有就是我不知道有多少层级,怎么和demo里tree对应呢 方案: function getTree(tree = []) { let arr = []; if (!!tree && tree.length !== 0 ) { tree.forEach(item => { let obj = {}; obj.title = item.name; obj

【集成学习】lightgbm调参案例

拜拜、爱过 提交于 2020-03-27 09:38:18
3 月,跳不动了?>>> lightgbm使用leaf_wise tree生长策略,leaf_wise_tree的优点是收敛速度快,缺点是容易过拟合。 # lightgbm关键参数 # lightgbm调参方法cv 代码github地址 1 # -*- coding: utf-8 -*- 2 """ 3 # 作者:wanglei5205 4 # 邮箱:wanglei5205@126.com 5 # 博客:http: //cnblogs.com/wanglei5205 6 # github:http: //github.com/wanglei5205 7 """ 8 ### 导入模块 9 import numpy as np 10 import pandas as pd 11 import lightgbm as lgb 12 from sklearn import metrics 13 14 ### 载入数据 15 print ('载入数据') 16 dataset1 = pd.read_csv('G:/ML/ML_match/IJCAI/ data 3.22/3.22ICJAI/ data /7_train_data1.csv') 17 dataset2 = pd.read_csv('G:/ML/ML_match/IJCAI/ data 3.22/3.22ICJAI/ data

Mac上如何使用Rss阅读器订阅网站最新的资源?

本小妞迷上赌 提交于 2020-03-19 17:35:02
3 月,跳不动了?>>> 无论是工作还是生活需要,订阅关注各大网站的新闻资讯或资源推荐,即使是通过书签访问也太麻烦。相对的,使用Rss阅读器要简便的多。那么,如何使用rss阅读器订阅?今天的分享就以如 论是工作还是生活需要,订阅关注各大网站的新闻资讯或资源推荐,即使是通过书签访问也太麻烦。相对的,使用Rss阅读器要简便的多。那么,如何使用rss阅读器订阅? 今天的分享就以如何使用Rss阅读器订阅macdown网站最新的资源为例,介绍一下这方面的内容。 首先,进行rss内容订阅,就要有一款方便好用的Rss阅读器,这里为大家推荐几款常用的Rss阅读器工具。同时介绍通过各Rss阅读器订阅macdown网站最新的资源内容的方法。 通用Rss阅读器订阅方法: 1.复制你要订阅的网站的RSS源地址:https://www.macdown.com/rss(macdown网站RSS订阅地址) 2.单击RSS阅读器源分类列表栏的右下角“+”,将源地址粘贴到弹出的窗口中,点击Search(查找) 3.待RSS阅读器搜索到该网页后选中它,点击Subscribe(订阅)即可完成添加。 大部分的Rss阅读器订阅基本大同小异,软件介绍后,为大家展示不同软件订阅的图文教程。 Reeder for Mac Reeder4是一款非常不错的rss新闻阅读器。作为一个简单的rss新闻阅读客户端

特斯拉Model 3“远程模式”续航超过560公里 马斯克发文祝贺

拜拜、爱过 提交于 2020-02-27 20:57:05
  腾讯科技讯,2 月 23 日消息,据外媒报道,在对 Model 3 进行的“远程模式”测试中,特斯拉团队发现其续航超过 560 公里,首席执行官埃隆·马斯克(Elon Musk)亲自发文表示祝贺。   按照官方说法,特斯拉 Model 3 每次充满电的续航里程为 499 公里,但近几个月来,特斯拉进行了部分优化措施,促使这款车的 EPA 额定续航里程增加到 518 公里。   现在,《消费者报告》对 Model 3 进行了自己的测试,并确认了 EPA 的评级。更有趣的是,他们还对“远程模式”进行了测试,证实其每次充满电后可以持续行驶 560 公里。   《消费者报告》的测试人员称:“我们发现 Model 3 的续航能力与 EPA 的测试相符。我们测试过的特斯拉 Model 3 与 EPA 设定的 499 公里续航里程相当,但在远程模式下,其续航达到了 560 公里。”   马斯克分享了这份报告,其中赞扬了特斯拉车辆能源效率的提升,并感谢相关团队的努力工作。他在推文中称:“实现这个目标真是太难了,我为特斯拉团队感到自豪!”   在远程电动汽车领域,特斯拉处于行业领先地位已经很长时间,但在其最新的 2020 年车辆更新后,它甚至在整体电动汽车能源效率方面也实现了领先。   去年,分析师凯文·鲁克(Kevin Rooke)发布的报告显示,特斯拉对充电效率的关注每年带来约3% 的改善

一口气说出 9种 分布式ID生成方式,面试官有点懵了

不羁的心 提交于 2020-02-27 12:24:53
前两天有个朋友给我发信息吐槽最近面试:“四哥,年前我在公司受点委屈一冲动就裸辞了,然后现在疫情严重两个多月还没找到工作,接了几个视频面试也都没下文。好多面试官问完一个问题,紧接着说还会其他解决方法吗? 能干活解决bug不就行了吗?那还得会多少种方法? ” 面试官应该是对应聘者的回答不太满意,他想听到一个他认为最优的解决方案,其实这无可厚非。同样一个bug,能用一行代码解决问题的人和用十行代码解决问题的人,你会选哪个入职?显而易见的事情!所以看待问题还是要从多个角度出发,每种方法都有各自的利弊。 一、为什么要用分布式ID? 在说分布式ID的具体实现之前,我们来简单分析一下为什么用分布式ID?分布式ID应该满足哪些特征? 1、什么是分布式ID? 拿MySQL数据库举个栗子: 在我们业务数据量不大的时候,单库单表完全可以支撑现有业务,数据再大一点搞个MySQL主从同步读写分离也能对付。 但随着数据日渐增长,主从同步也扛不住了,就需要对数据库进行分库分表,但分库分表后需要有一个唯一ID来标识一条数据,数据库的自增ID显然不能满足需求;特别一点的如订单、优惠券也都需要有 唯一ID 做标识。此时一个能够生成 全局唯一ID 的系统是非常必要的。那么这个 全局唯一ID 就叫 分布式ID 。 2、那么分布式ID需要满足那些条件? 全局唯一:必须保证ID是全局性唯一的,基本要求 高性能:高可用低延时

【远程办公】无需公网、无需服务端5分钟实现内网穿透

╄→гoц情女王★ 提交于 2020-02-26 22:44:22
上文 《 【远程办公】5分钟实现内网穿透 》有个老哥私聊了我一下 好吧,正如这个老哥的需求 不需要公网IP 不需要ECS部署服务端 ​搭建 frp 的关键资源是要啥没啥,这里再推荐一个 ZeroTier 基本概念 > ZeroTier is a smart Ethernet switch for planet Earth. 翻译:用于地球的智能以太网交换机。 通俗来讲就是 Peer to Peer (P2P) ,ZeroTier 根服务器记录请求路径来做类似于DNS的解析。 主要功能,就是可以把多个不同网络的设备连接在一起,用来就像在一个局域网下 如下图 ZeroTier 配置一个虚拟网段 172.17.2.0/24 ,在家中加入这个网络中,即可访问位于公司 172.17.2.101 专有名词 Zerotier 定义了几个专业名词: PLANET 行星服务器,Zerotier 根服务器 MOON 卫星服务器,用户自建的私有根服务器,起到代理加速的作用 LEAF 网络客户端,就是每台连接到网络节点。 开始使用 1. 注册 zerotier 服务 https://my.zerotier.com/ 2. 创建网络 3. 内网目标机器安装客户端 Linux curl -s https://install.zerotier.com | sudo bash 其他操作系统 下载地址: https