Объектно-Ориентированная Байесовская Фильтрация Спама?

Мне было интересно, есть ли хорошая и чистая реализация объектно-ориентированного программирования (ООП) Байесовской фильтрации для классификации спама и текста? Это только для обучения.

6 ответов


Я определенно рекомендую Weka что это Открыть Источник Программного Обеспечения Анализа Данных написано на Java:

Weka представляет собой набор алгоритмов машинного обучения для задач интеллектуального анализа данных. Алгоритмы могут быть применены непосредственно к набору данных или вызваны из вашего собственного кода Java. Weka содержит инструменты для предварительной обработки данных, классификации, регрессии, кластеризации, правил ассоциации и визуализации. Он также хорошо подходит для разработки новых схемы машинного обучения.

Как упоминалось выше, он поставляется с кучей различных классификаторов, таких как SVM, веять, С4.5, наивный Байес (конечно) и многое другое (см. API doc). Обратите внимание, что многие классификаторы, как известно, имеют гораздо лучшее исполнение, чем наивный Байес в области обнаружения спама или текстовой классификации.

Furthermore Weka приносит вам очень мощный GUI...



может быть https://ci-bayes.dev.java.net/ или http://www.cs.cmu.edu / ~javabayes/Home/node2.html?

Я тоже никогда не играл с ним.


вот реализация Байесовской фильтрации в C#:наивный байесовский спам-фильтр для C# (размещено на CodeProject).


nBayes - другая реализация C#, размещенная на CodePlex


на французском языке, но вы должны быть в состоянии найти ссылку для скачивания :) PHP наивный байесовский фильтр