Как читать матрицу путаницы классификатора в WEKA

Извините, я новичок в WEKA и только учусь.

в моем выходе классификатора дерева решений (J48) есть матрица путаницы:

a    b   <----- classified as
130  8     a = functional
15   150   b = non-functional
  • как я могу прочитать эту матрицу? В чем разница между a & b?
  • кроме того, может ли кто-нибудь объяснить мне, какие значения домена?

2 ответов


Я бы сказал так:

матрица путаницы-это Weka, сообщающая о том, насколько хороша эта модель J48 с точки зрения того, что она получает правильно, и что она получает неправильно.

в ваших данных целевая переменная была либо "функциональной", либо "нефункциональной"; правая часть Матрицы говорит вам, что столбец "a" является функциональным, а " b " -нефункциональным.

столбцы говорят вам, как ваша модель классифицировала ваши образцы - это то, что модель предсказано:

  • первый столбец содержит все образцы, которые ваша модель считает " a " - 145 из них, всего
  • второй столбец содержит все образцы, которые ваша модель считает "б", 158 из них

строки, с другой стороны, представляют реальность:

  • первая строка содержит все образцы, которые действительно являются " a " - 138 из них, всего
  • вторая строка содержит все образцы, которые действительно являются " b" - 165 из них

зная столбцы и строки, вы можете копаться в деталях:

  • верхний левый, 130, вещи, которые ваша модель считает "а", которые действительно "а"
  • внизу слева, 15, есть вещи, которые ваша модель считает "А", но которые действительно " b "
  • вверху справа, 8, есть вещи, которые ваша модель считает "b", но которые действительно, " а "
  • внизу справа, 150 являются ли вещи, которые ваша модель считает "b", которые действительно "b"

таким образом, верхний левый и нижний правый матрицы показывают, что ваша модель получает право.

нижняя левая и верхняя правая части Матрицы показывают, где ваша модель путается.


вы читали страница Википедии о матрицах путаницы? Текст вокруг матрицы в их примере устроен несколько иначе (метки строк слева, а не справа), но Вы читаете его точно так же.

строка указывает истинный класс, столбец указывает выход классификатора. Каждая запись, таким образом, дает количество экземпляров <row>, которые были квалифицированы как <column>. В вашем примере 15 Bs были (неправильно) классифицированы как, 150 Bs были правильно классифицированы как Bs и т. д.

в результате, все правильно классификации находятся по диагонали сверху слева вниз справа. Все, что находится вне этой диагонали, является какой-то неправильной классификацией.