Scipy-Stats-значение параметров для вероятностных распределений

Scipy docs дайте форму распределения, используемую экспоненциальной как:

expon.pdf(x) = lambda * exp(- lambda*x)

однако функция fit принимает:

fit(data, loc=0, scale=1)

и функция rvs принимает:

rvs(loc=0, scale=1, size=1)

Вопрос 1: Почему переменная extraneous location? Я знаю, что экспоненты - это просто конкретные формы более общего распределения (гамма), но зачем включать ненужную информацию? Даже гамма не имеет параметра местоположения.

Вопрос 2: Это out put of the fit(...) в том же порядке, что и входная переменная. Что я имею в виду Если я это сделаю:

t = fit([....]) , t will have the form t[0], t[1]

должен ли я интерпретировать t[0] как форму и t1 как масштаб.

это для всех дистрибутивов?

как насчет гамма:

fit(data, a, loc=0, scale=1)

1 ответов


  1. каждое одномерное распределение вероятности, независимо от его обычной формулировки, может быть расширено, чтобы включить параметр местоположения и масштаба. Иногда это влечет за собой расширение поддержки распределения От только положительных / неотрицательных реалов до всей строки реального числа со значением PDF 0, когда ниже loc значение. scipy.stats делает это, чтобы переместить все обращения loc и scale общий метод, общий для всех дистрибутивов. Он был предлагается удалить это и сделать дистрибутивы, такие как gamma loc-меньше следовать их каноническим формулировкам. Однако оказывается, что некоторые люди действительно используют" сдвинутые гамма " распределения с ненулевым loc параметры для моделирования размеров солнечных пятен, если я правильно помню, и текущее поведение scipy.stats идеально подходит для них. Так что мы его оставим.

  2. выход fit() метод представляет собой кортеж вида (shape0, shape1, ..., shapeN, loc, scale) если есть N параметр формы. Для нормального распределения, которое не имеет параметров формы, он будет возвращать только (loc, scale). Для гамма-распределения, которое имеет один, он вернется (shape, loc, scale). Несколько параметров формы будут в том же порядке, что и для всех других методов распределения. это справедливо для всех распределений.