Частые Наборы Элементов И Правила Ассоциации-Алгоритм Априори

Я пытаюсь понять основы алгоритма Apriori (Basket) для использования в интеллектуальном анализе данных,

лучше всего я объясню осложнение, которое у меня есть с примером:

вот транзакционный набор данных:

t1: Milk, Chicken, Beer
t2: Chicken, Cheese
t3: Cheese, Boots
t4: Cheese, Chicken, Beer
t5: Chicken, Beer, Clothes, Cheese, Milk
t6: Clothes, Beer, Milk
t7: Beer, Milk, Clothes

на minsup для вышеуказанного 0.5 или 50%.

принимая из вышесказанного, мое количество транзакции явно 7, что означает, что для набора элементов "часто" он должен иметь счетчик из 4/7. Таким образом, это был мой частый набор 1:

F1:

Milk = 4
Chicken = 4
Beer = 5
Cheese = 4

затем я создал своих кандидатов для второго уточнения (C2) и сузил его до:

F2:

{Milk, Beer} = 4

вот где я запутался, если меня попросят отобразить все частые наборы элементов я записываю все F1 и F2 или просто F2? F1 мне не "наборы."

затем меня просят создать правила ассоциации для частых наборов элементов, которые я только что определил, и рассчитать их" доверительные " цифры, я получаю это:

Milk -> Beer = 100% confidence
Beer -> Milk = 80% confidence

кажется излишним ставить F1's itemsets здесь, поскольку все они будут иметь уверенность в 100% независимо и на самом деле не" ассоциировать " что-либо, поэтому я сейчас задаюсь вопросом,F1 действительно "часто"?

2 ответов


наборы элементов с размером 1 считаются частыми, если их поддержка подходит. но здесь вы должны рассмотреть минимальный порог. например, если ваш минимальный порог - это 2 затем F1 рассматриваться не будут. Но если минимальный порог is 1 тогда вы должны.

вы можете ознакомиться здесь и здесь для Больше идей и образцы.

надеюсь, что я помог.


Если минимальный порог поддержки (minsup) равен 4 / 7, то следует включить отдельные элементы в набор частых наборов элементов, если они появляются не менее чем в 4 транзакциях из 7. Поэтому в вашем примере вы должны включить их:

Молоко = 4 Курица = 4 Пиво = 5 Сыр = 4

для правил ассоциации они имеют вид X ==> Y, где X и Y-непересекающиеся наборы элементов, и обычно предполагается, что X и Y не являются пустыми наборами (и это то, что предполагается Априорный.) Таким образом, для создания правила ассоциации необходимо по крайней мере два элемента.