Python+statsmodels实现多元线性回归和泊松回归

statsmodels是python中专门用于统计学分析的包,它能够帮我们在模型未知的情况下来检验模型的线性显著性
更多回归模型见:statsmodels-formula-api
在建立回归方程前首先导入库

import statsmodels.api as sm
import statsmodels.formula.api as smf
from statsmodels.formula.api import ols
from statsmodels.formula.api import poisson

statsmodel实现回归的基本步骤:

  1. 输入回归方程
  2. fit model as result
  3. print result

如果想进行多种回归且因变量自变量不变,则可以暂时先把他们储存起来,后续在建立模型的时候就可以直接使用x, y

from patsy import dmatrices
y, X = dmatrices('like ~ stars + text_len + sentiment + polarity', data=df, return_type="dataframe")
model = sm.OLS(y, X)
res = model.fit()
print(res.summary())
  1. 多元线性回归

model_ols = smf.ols(formula='like ~ stars + text_len + sentiment + polarity',data=df)
res_ols = model_ols.fit()
print(res_ols.summary())

Python+statsmodels实现多元线性回归和泊松回归

结果解释详见:详解用 statsmodels 进行回归分析

  1. 泊松回归 (Poisson)

model_pos = poisson(formula='''like ~ stars + text_len + sentiment + polarity''',data=df)
results_pos = model_pos.fit()
print(results_pos.summary())

Python+statsmodels实现多元线性回归和泊松回归

聚集标准误


model_pos_clu = poisson(formula='''like ~ stars + text_len + sentiment + polarity''',data=df)
results_pos_clu = model_pos_clu.fit(cov_type='cluster', cov_kwds={'groups': df['business_id']})
print(results_pos_clu.summary())

Python+statsmodels实现多元线性回归和泊松回归

参考来源:Clustered standard errors in statsmodels with categorical variables (Python)
参数详解:statsmodels.regression.linear_model.OLS.fit

更多结果提取:python statsmodel 回归结果提取(回归系数、t值、pvalue、R方、、、、)

Original: https://blog.csdn.net/weixin_46599926/article/details/123458300
Author: 羊羊猪
Title: Python+statsmodels实现多元线性回归和泊松回归

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/634627/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球