我正在尝试在Python中运行回归,但是这花了很长时间并且停止运行。在Stata中,它可以工作,仅需几秒钟。
这是由于分类列,包括组固定效应。如果没有该变量,Stata和Python的性能将相当相等,对于200,000个观察值,大约需要1秒:
代码库
reg income height Number_children
程式码Python
model = smf.ols(income ~ height + Number_children, data=humans).fit()
添加虚拟对象后,我将Stata代码更改为areg:
areg income height Number_children, absorb(Village)
比没有假人只需要1-2秒。
在Python中:
model = smf.ols(income ~ height + Number_children + Village, data=humans).fit()
哪里:
Name: Village, dtype: category
Categories (3678, object):
等待2分钟后,我停止了回归。有什么想法可以使代码运行,并将速度提高到几乎与Stata一样快吗?问题更多是由变量还是由回归命令引起的?
编辑:
根据Dimitriy的回答,我尝试了所有变量:
例如:
humans[“income_gr_m”]= humans[“incom
Original: https://blog.csdn.net/weixin_35743031/article/details/113509677
Author: 创业青年骁哥
Title: python和stata哪个难_Python:与Stata(固定效果假人)相比,回归速度较慢
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/634355/
转载文章受原作者版权保护。转载请注明原作者出处!