Как читать матрицу путаницы классификатора в WEKA
Извините, я новичок в WEKA и только учусь.
в моем выходе классификатора дерева решений (J48) есть матрица путаницы:
a b <----- classified as
130 8 a = functional
15 150 b = non-functional
- как я могу прочитать эту матрицу? В чем разница между a & b?
- кроме того, может ли кто-нибудь объяснить мне, какие значения домена?
2 ответов
Я бы сказал так:
матрица путаницы-это Weka, сообщающая о том, насколько хороша эта модель J48 с точки зрения того, что она получает правильно, и что она получает неправильно.
в ваших данных целевая переменная была либо "функциональной", либо "нефункциональной"; правая часть Матрицы говорит вам, что столбец "a" является функциональным, а " b " -нефункциональным.
столбцы говорят вам, как ваша модель классифицировала ваши образцы - это то, что модель предсказано:
- первый столбец содержит все образцы, которые ваша модель считает " a " - 145 из них, всего
- второй столбец содержит все образцы, которые ваша модель считает "б", 158 из них
строки, с другой стороны, представляют реальность:
- первая строка содержит все образцы, которые действительно являются " a " - 138 из них, всего
- вторая строка содержит все образцы, которые действительно являются " b" - 165 из них
зная столбцы и строки, вы можете копаться в деталях:
- верхний левый, 130, вещи, которые ваша модель считает "а", которые действительно "а"
- внизу слева, 15, есть вещи, которые ваша модель считает "А", но которые действительно " b "
- вверху справа, 8, есть вещи, которые ваша модель считает "b", но которые действительно, " а "
- внизу справа, 150 являются ли вещи, которые ваша модель считает "b", которые действительно "b"
таким образом, верхний левый и нижний правый матрицы показывают, что ваша модель получает право.
нижняя левая и верхняя правая части Матрицы показывают, где ваша модель путается.
вы читали страница Википедии о матрицах путаницы? Текст вокруг матрицы в их примере устроен несколько иначе (метки строк слева, а не справа), но Вы читаете его точно так же.
строка указывает истинный класс, столбец указывает выход классификатора. Каждая запись, таким образом, дает количество экземпляров <row>
, которые были квалифицированы как <column>
. В вашем примере 15 Bs были (неправильно) классифицированы как, 150 Bs были правильно классифицированы как Bs и т. д.
в результате, все правильно классификации находятся по диагонали сверху слева вниз справа. Все, что находится вне этой диагонали, является какой-то неправильной классификацией.