0
点赞
收藏
分享

微信扫一扫

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验

1.导入python库

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_华为

2.载入数据

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_乾颐堂_02

该数据集收录了⼀96赛季~2016赛季,科⼀整个职业⼀涯的⼀赛记录,共有30697条数据。每⼀条数据都是⼀次出⼀记录,其中包括动作类型,投篮类型,投射距离,投射位置,是否命中等25个特征。在该数据集中我们将以是否命中篮筐为标签值来进⼀分析,带有标签值的数据共25697条。我们将以这25697条数据作为训练数据进⼀建模,来对不带标签的5000条数据进⼀预测。

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_机器学习_03

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_AI_04

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_乾颐堂_05

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_华为_06

3.标签缺失值处理

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_AI_07

4.查看生涯出手位置(特征样本点分布观察)

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_乾颐堂_08

发现两个特征表达的投篮位置都一样,所以接下来可以任意一个。

4.1转为极坐标

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_乾颐堂_09

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_机器学习_10

5.数据预处理

5.1统计比赛时间(秒)

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_乾颐堂_11

5.2查看样本类别

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_AI_12

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_华为_13

5.3数据类型转换

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_机器学习_14

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_AI_15

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_机器学习_16

5.4特征相关性(ρ和投篮距离,可去掉一个)

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_乾颐堂_17

5.5特征相关性(投篮区域统计)

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_乾颐堂_18

5.6特征相关性(投篮区域位置)

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_华为_19

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_机器学习_20

5.7丢弃无用数据

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_AI_21

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_乾颐堂_22

5.8特征变量转化

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_机器学习_23

5.9拼接one-hot编码的新特征

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_华为_24

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_AI_25

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_机器学习_26

6.搭建模型

6.1定义训练集和测试集

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_乾颐堂_27

6.2定义模型(寻找最优的n_estimators)

6.2.1 Kfold举例

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_机器学习_28

6.2.2寻找最优的n_estimators

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_机器学习_29

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_华为_30

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_机器学习_31

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_机器学习_32

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_机器学习_33

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_乾颐堂_34

6.2.3寻找最优的max_depth

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_AI_35

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_乾颐堂_36

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_机器学习_37

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_AI_38

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_华为_39

7.可视化参数结果

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_AI_40

8.预测

华为LAB实验室-3机器学习实验:(随机森林)分析科比生涯实验_AI_41

举报

相关推荐

0 条评论