使用statsmodel
中的小写ols进行线性回归的时候会经常用到pasty
语法,如下:
而Patsy
的公式是有特殊格式的字符串,像下面这样:
$$y \sim x_0 + x_1 $$
其实这段字符并不代表将 $x_1$ 和 $x_2$ 相加,而是为模型创建的设计矩阵,表示为 $x_1$ 和$x_2$ 做解释变量,y做被解释变量,进行回归。
为什么说是线性回归的利器,因为我们直接通过易于接受的语法来实现:如以某因子的标准差或者求对数等值作为解释变量传入回归模型当中进行回归。
具体用法可以参照以下两篇博客:
- 官方文档:patsy - Describing statistical models in Python
- 利用Python进行数据分析笔记-pandas建模(Patsy篇)