各位好,我是乾颐堂大堂子。领取完整实战指南可以私信我,关键词:实战指南~
本实验使用的数据集为tennis.txt,主要包含14个样本,每个样本包含天气相关的特征及是否适合打球。

步骤1导入依赖

步骤2定义函数,生成决策树

步骤3定义函数,保存生成的树图

步骤4定义函数,用于生成向量化数据
函数中,通过pd.Categorical(list).codes可以得到原始数据对应的序号列表,从而将类别信息转化成数值信息,这样就可以应用到模型中去了

步骤5调用函数进行预测

此时在本地生成决策树图,名称为“tennis.pdf”。












