参数优化过程中所用数据应该用训练集 (占所有数据的一部分),如果用所有数据会导致模型评估的所有结果都偏高,因为这些评估都涉及测试集,如果用所有数据进行训练,导致测试集预测结果大部分都正确,所以准确率,auc等都偏高
机器学习参数优化数据改用所有数据还是训练集
阅读 56
2022-01-12
参数优化过程中所用数据应该用训练集 (占所有数据的一部分),如果用所有数据会导致模型评估的所有结果都偏高,因为这些评估都涉及测试集,如果用所有数据进行训练,导致测试集预测结果大部分都正确,所以准确率,auc等都偏高
相关推荐
精彩评论(0)