python虚拟变量回归_Python中使用虚拟变量的OLS最佳解决方案?

我想用Python解决一个问题,我已经找到了多种解决方案(我想),但我正在努力找出哪一个是最好的。我希望选择将来完全支持的库,这样我就不必重新编写这个服务了。在

我想做一个普通的多元最小二乘回归,既有分类变量,也有连续因变量。代码必须用Python编写,因为它正被集成到web服务中。我一直在跟踪熊猫,但从未使用过,所以这似乎是一种方法:

显然,numpy/scipy是理想的,但是我找不到一个使用虚拟变量的例子(有人有吗。但我确实找到了这个

我可以修改它来支持虚拟变量,但是如果其他人已经这样做了,我就不想这样做了+我希望数字与R非常相似,因为我已经离线完成了大部分的分析,我可以将这些结果用于单元测试。在

在上面的例子(2)中,我发现我可以在技术上使用rpy/rpy2,尽管这不是最佳的,因为我的web服务还需要另一项技术(R)。使用这个接口的好处是这些数字将与我从R得到的结果相同

不管怎样,我对每个人在这三个解决方案中的方法感兴趣,如果我遗漏了任何一个。。。。。。如果Panda已经成熟到可以开始在生产web服务中使用。这里的关键是,如果可能的话,我不想支持/修补bug修复或者从头开始编写任何东西。我太忙了,可能不够聪明:)

谢谢。在

你可能感兴趣的:(python虚拟变量回归)