文章大纲
spark 等频 等宽 分箱 数据量较少时的现象
这里有一个很有趣的问题,当分箱数比较少 ,少于数据个数时候,等频分箱箱子编号是从0开始的。
当分箱数比较多的时候,多于数据数量,箱子编号是从1 开始编号的
分箱编号不同的原因剖析
参考文献
python 分箱
微信扫一扫
这里有一个很有趣的问题,当分箱数比较少 ,少于数据个数时候,等频分箱箱子编号是从0开始的。
当分箱数比较多的时候,多于数据数量,箱子编号是从1 开始编号的
python 分箱
相关推荐