python和stata哪个难_Python:与Stata(固定效果假人)相比,回归速度较慢

我正在尝试在Python中运行回归,但是这花了很长时间并且停止运行。在Stata中,它可以工作,仅需几秒钟。

这是由于分类列,包括组固定效应。如果没有该变量,Stata和Python的性能将相当相等,对于200,000个观察值,大约需要1秒:

代码库

reg income height Number_children

程式码Python

model = smf.ols(income ~ height + Number_children, data=humans).fit()

添加虚拟对象后,我将Stata代码更改为areg:

areg income height Number_children, absorb(Village)

比没有假人只需要1-2秒。

在Python中:

model = smf.ols(income ~ height + Number_children + Village, data=humans).fit()

哪里:

Name: Village, dtype: category

Categories (3678, object):

等待2分钟后,我停止了回归。有什么想法可以使代码运行,并将速度提高到几乎与Stata一样快吗?问题更多是由变量还是由回归命令引起的?

编辑:

根据Dimitriy的回答,我尝试了所有变量:

例如:

humans[“income_gr_m”]= humans[“incom

Original: https://blog.csdn.net/weixin_35743031/article/details/113509677
Author: 创业青年骁哥
Title: python和stata哪个难_Python:与Stata(固定效果假人)相比,回归速度较慢

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/634355/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球