Поиск точек выброса из matplotlib: boxplot

Я строю ненормальное распределение с помощью boxplot и заинтересован в том, чтобы узнать о выбросах, используя функцию boxplot matplotlib.

помимо сюжета мне интересно узнать значение точек в моем коде, которые показаны как выбросы в boxplot. Есть ли способ извлечь эти значения для использования в моем нижнем коде из объекта boxplot?

1 ответов


Вы имеете в виду те точки выше и ниже двух черных линий?

from pylab import *
spread= rand(50) * 100
center = ones(25) * 50
flier_high = rand(10) * 100 + 100
flier_low = rand(10) * -100
data =concatenate((spread, center, flier_high, flier_low), 0)
r = boxplot(data)

enter image description here

сохраните возвращаемый дикт из boxplot, и вы можете получить всю информацию из него, например:

top_points = r["fliers"][0].get_data()[1]
bottom_points = r["fliers"][2].get_data()[1]
plot(np.ones(len(top_points)), top_points, "+")
plot(np.ones(len(bottom_points)), bottom_points, "+")

enter image description here