Получение statsmodels использовать гетероскедастичность исправить стандартные ошибки коэффициента t-тесты

я копался в API statsmodels.regression.linear_model.RegressionResults и нашли, как получить различные ароматы гетероскедастичности исправлены стандартные ошибки (через свойства, такие как HC0_se, etc.) Однако я не могу понять, как получить t-тесты на коэффициенты для использования этих исправленных стандартных ошибок. Есть ли способ сделать это в API, или мне придется сделать это вручную? Если последнее, можете ли вы предложить какие-либо рекомендации о том, как это сделать с помощью statsmodels результаты?

1 ответов


на fit метод линейных моделей, дискретных моделей и GLM, возьмите cov_type и a cov_kwds аргумент для задания надежных ковариационных матриц. Он будет прикреплен к экземпляру результатов и использоваться для всех выводов и статистических данных, представленных в сводной таблице.

к сожалению, документация на самом деле еще не показывает это соответствующим образом. Вспомогательный метод, который фактически выбирает бутерброды на основе опций, показывает параметры и необходимые аргументы: http://statsmodels.sourceforge.net/devel/generated/statsmodels.regression.linear_model.OLS.fit.html

например, оценка модели OLS и использование HC3 ковариационные матрицы можно сделать с

model_ols = OLS(...)
result = model_ols.fit(cov_type='HC3')
result.bse
result.t_test(....)

некоторые бутерброды требуют дополнительных аргументов, например кластерные надежные стандартные ошибки, могут быть выбраны следующим образом, предполагая mygroups - массив, содержащий метки групп:

results = OLS(...).fit(cov_type='cluster', cov_kwds={'groups': mygroups}
results.bse
...

некоторые надежные ковариационные матрицы делают дополнительные предположения о данных без проверки. Например, гетероскедастичность и автокорреляция надежные стандартные ошибки или Newey-West,HAC, стандартные ошибки предполагают последовательную структуру временных рядов. Некоторые данные панели надежные стандартные ошибки также предполагают укладку временных рядов отдельными лицами.

отдельно use_t доступно, чтобы указать, должны ли по умолчанию использоваться распределения t и F или normal и chisquare для тестов Wald и доверительных интервалов.