本资源由 伯乐在线 – beyondwu 整理
statsmodels是一个包含统计模型、统计测试和统计数据挖掘python模块。对每一个模型都会生成一个对应的统计结果。统计结果会和现有的统计包进行对比来保证其正确性。
安装
安装依赖
可选依赖
- 使用setuptools安装
1 easy_install -U statsmodels - 从源码安装
12 git clone git://github.com/statsmodels/statsmodels.gitpython setup.py install 示例
statsmodels 0.5.0版本以后,就可以使用R风格的公式和pandas的data frames来使用模型了。下面是一个最小二乘的示例:
Python
123456789101112 import numpy as npimport statsmodels.api as smimport statsmodels.formula.api as smf # Load datadat = sm.datasets.get_rdataset(“Guerry”, “HistData”).data # Fit regression model (using the natural log of one of the regressors)results = smf.ols(‘Lottery ~ Literacy + np.log(Pop1831)’, data=dat).fit() # Inspect the resultsprint(results.summary()) 你也可以使用numpy的数组来代替公式:
Python
12345678910111213141516 import numpy as npimport statsmodels.api as sm # Generate artificial data (2 regressors + constant)nobs = 100X = np.random.random((nobs, 2))X = sm.add_constant(X)beta = [1, .1, .5]e = np.random.random(nobs)y = np.dot(X, beta) + e # Fit regression modelresults = sm.OLS(y, X).fit() # Inspect the resultsprint(results.summary()) #p#分页标题#e#
可以通过results对象的results.__doc__方法看到文档说明。
资源
- 详细安装
- 使用示例
- sourceforge资源
- 开发者文档
- 社区
- Bug提交
- FAQ
使用协议
模块符合BSD(条款3)许可。
官方网站:http://www.statsmodels.org/
开源地址:http://github.com/statsmodels/statsmodels关键字:

- 从源码安装
