Получение statsmodels использовать гетероскедастичность исправить стандартные ошибки коэффициента t-тесты
я копался в API statsmodels.regression.linear_model.RegressionResults
и нашли, как получить различные ароматы гетероскедастичности исправлены стандартные ошибки (через свойства, такие как HC0_se
, etc.) Однако я не могу понять, как получить t-тесты на коэффициенты для использования этих исправленных стандартных ошибок. Есть ли способ сделать это в API, или мне придется сделать это вручную? Если последнее, можете ли вы предложить какие-либо рекомендации о том, как это сделать с помощью statsmodels результаты?
1 ответов
на fit
метод линейных моделей, дискретных моделей и GLM, возьмите cov_type
и a cov_kwds
аргумент для задания надежных ковариационных матриц. Он будет прикреплен к экземпляру результатов и использоваться для всех выводов и статистических данных, представленных в сводной таблице.
к сожалению, документация на самом деле еще не показывает это соответствующим образом. Вспомогательный метод, который фактически выбирает бутерброды на основе опций, показывает параметры и необходимые аргументы: http://statsmodels.sourceforge.net/devel/generated/statsmodels.regression.linear_model.OLS.fit.html
например, оценка модели OLS и использование HC3
ковариационные матрицы можно сделать с
model_ols = OLS(...)
result = model_ols.fit(cov_type='HC3')
result.bse
result.t_test(....)
некоторые бутерброды требуют дополнительных аргументов, например кластерные надежные стандартные ошибки, могут быть выбраны следующим образом, предполагая mygroups
- массив, содержащий метки групп:
results = OLS(...).fit(cov_type='cluster', cov_kwds={'groups': mygroups}
results.bse
...
некоторые надежные ковариационные матрицы делают дополнительные предположения о данных без проверки. Например, гетероскедастичность и автокорреляция надежные стандартные ошибки или Newey-West,HAC
, стандартные ошибки предполагают последовательную структуру временных рядов. Некоторые данные панели надежные стандартные ошибки также предполагают укладку временных рядов отдельными лицами.
отдельно use_t
доступно, чтобы указать, должны ли по умолчанию использоваться распределения t и F или normal и chisquare для тестов Wald и доверительных интервалов.