特牛网址导航

python实现ID3决策树及随机森林_然后从全部的m个决策属性当中随机选-CSDN博客

网友收藏
文章浏览阅读772次,点赞3次,收藏8次。前言数据集:一、对数据集进行训练集和测试集划分从数据集中无放回地随机抽选80%的样本作为训练集,剩下的20%划分为测试集。将训练集和测试集分别存放到train_data.csv和test_data.csv文件中。二、ID3算法实现1.实现ID3决策树算法的首要工作是数据的特征选择,需要在特征集合中挑选出能最大化减小数据样本集不确定程度的特征,将之作为节点。而不确定程度可以用信息增益来表示。根据熵和条件熵的概念,可以得知熵与条件熵的差就是样本集不确定程度的减少量,即信息增益。这里创建entro_然后从全部的m个决策属性当中随机选