
图书说明:
以准确反映其实际性能的方式评估预测和分类模型的质量,然后使用最先进的算法(例如基于委员会的决策制定,重新采样数据集和提升)来提高性能。本书介绍了许多重要的技术,可用于构建功能强大的模型,并在应用程序中投入使用时量化其预期行为。
对信息理论给予了相当的关注,特别是因为它涉及发现和利用模型所使用的变量之间的关系。这种常常令人困惑的主题的呈现避免了高等数学,而是专注于数学中具有适度背景的人容易理解的概念。
所有算法都包括对操作的直观解释,基本方程,对更严格理论的引用以及评论的C ++源代码。这些技术中的许多是最近的发展,仍未广泛使用。其他是标准算法,给人一种全新的外观。在每种情况下,重点都放在实际适用性上,所有代码都以这样的方式编写,以便可以轻松地包含在任何程序中。
你将学到什么
- 计算熵以检测有问题的预测变量
- 使用约束和无约束组合,方差加权插值和核回归平滑来改进数值预测
- 使用Borda计数,MinMax和MaxMin规则,并集和交集规则,逻辑回归,局部精度选择,模糊积分最大化和成对耦合来执行分类决策
- 利用信息理论技术快速筛选大量候选预测变量,识别那些特别有前景的预测变量
- 使用蒙特卡罗排列方法来评估好运在绩效结果中的作用
- 计算预测的置信度和容差区间,以及分类决策的置信度
本书适用于谁
任何创建预测或分类模型的人都会在本书中找到大量有用的算法。尽管所有代码示例都是用C ++编写的,但算法的详细描述足以让它们可以用任何语言轻松编程。
下载地址:Assessing and Improving Prediction and Classification
更多免积分电子书,请访问:IE布克斯网
文章来源: https://blog.csdn.net/qq_30870311/article/details/84875981