Scipy-Stats-значение параметров для вероятностных распределений
Scipy docs дайте форму распределения, используемую экспоненциальной как:
expon.pdf(x) = lambda * exp(- lambda*x)
однако функция fit принимает:
fit(data, loc=0, scale=1)
и функция rvs принимает:
rvs(loc=0, scale=1, size=1)
Вопрос 1: Почему переменная extraneous location? Я знаю, что экспоненты - это просто конкретные формы более общего распределения (гамма), но зачем включать ненужную информацию? Даже гамма не имеет параметра местоположения.
Вопрос 2: Это out put of the fit(...) в том же порядке, что и входная переменная. Что я имею в виду Если я это сделаю:
t = fit([....]) , t will have the form t[0], t[1]
должен ли я интерпретировать t[0] как форму и t1 как масштаб.
это для всех дистрибутивов?
как насчет гамма:
fit(data, a, loc=0, scale=1)
1 ответов
каждое одномерное распределение вероятности, независимо от его обычной формулировки, может быть расширено, чтобы включить параметр местоположения и масштаба. Иногда это влечет за собой расширение поддержки распределения От только положительных / неотрицательных реалов до всей строки реального числа со значением PDF 0, когда ниже
loc
значение.scipy.stats
делает это, чтобы переместить все обращенияloc
иscale
общий метод, общий для всех дистрибутивов. Он был предлагается удалить это и сделать дистрибутивы, такие какgamma
loc
-меньше следовать их каноническим формулировкам. Однако оказывается, что некоторые люди действительно используют" сдвинутые гамма " распределения с ненулевымloc
параметры для моделирования размеров солнечных пятен, если я правильно помню, и текущее поведениеscipy.stats
идеально подходит для них. Так что мы его оставим.выход
fit()
метод представляет собой кортеж вида(shape0, shape1, ..., shapeN, loc, scale)
если естьN
параметр формы. Для нормального распределения, которое не имеет параметров формы, он будет возвращать только(loc, scale)
. Для гамма-распределения, которое имеет один, он вернется(shape, loc, scale)
. Несколько параметров формы будут в том же порядке, что и для всех других методов распределения. это справедливо для всех распределений.