XGBoost论文阅读

十年热恋 提交于 2019-12-04 09:16:50

论文创新点:

  1. 提出了一种能处理稀疏数据的提升生树算法
  2. 描述了一种加权分位数方法的大概流程,能够用于处理近似树学习中的实例权重。
  3. 并行和分布式设计让这个算法有非常快的训练速度。
  4. XGBoost能够在外存上进行计算,使其能处理更大的数据量。

 

目标函数

 

损失函数

 

 

上面的这个损失函数在欧几里得空间中用传统的优化方法是没有办法求解,为了解决这个问题,本文中采用了贪婪算法,把上面的加和函数分成一步步迭代的来求解,即第 t 步只优化第 t 个分类器,固定前 t-1 步所有分类器:

对上式进行二阶泰勒展开可以更快速的求解:

 

 

 

 

 

 

 

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!