禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者!

在这里插入图片描述

介绍

随机森林是常用的非线性用于构建分类器的算法,它是由数目众多的弱决策树构建成森林进而对结果进行投票判断标签的方法。

随机森林用于分类器的算法过程,

  1. 随机切分样本,然后选择2/3用于建模,剩余1/3用于验证袋外误差;
  2. 随机选择特征构建决策树,每个叶子节点分成二类;
  3. 根据GINI系数判断分类内部纯度程度,进行裁剪树枝;
  4. 1/3数据预测,根据每个决策树的结果投票确定标签;
  5. 输出标签结果,并给出OOB rate

随机的含义在于样本和特征是随机选择去构建决策树,这可以有效避免偏差,另外弱分类器组成强分类器也即是多棵决策树组成森林能提升模型效果。

教程

本文旨在通过R语言实现Random forest,总共包含:

  1. 下载数据
  2. 加载R包

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部