基本概念
箱线图是描述数据分布情况一种图形,需要知道以下几个概念:
- 首先将数据串从小到大排序;
- 上界,上四分位数(Q3),中位数(Q2),下四分位数(Q1),下界分别在数字串的那个位置(上界处于最大值处可能是因为笛卡尔坐标系的方向);
- 从箱线图中能看出数据分布情况;
- 中度异常点和极度异常点;
- 上四分位数(Q3),中位数(Q2),上四分位数(Q1)用公式计算出在数据串中的位置。
离差平方和、方差、标准差和变异系数基本原理和计算方式。
扩展与参考链接
【Python】 标准差计算(std)
Python:使用pandas和numpy计算标准差的区别
如何计算四分位数值&应用
怎么计算一组数据的波动_数据分析(一):数据描述统计