Объектно-Ориентированная Байесовская Фильтрация Спама?
Мне было интересно, есть ли хорошая и чистая реализация объектно-ориентированного программирования (ООП) Байесовской фильтрации для классификации спама и текста? Это только для обучения.
6 ответов
Я определенно рекомендую Weka что это Открыть Источник Программного Обеспечения Анализа Данных написано на Java:
Weka представляет собой набор алгоритмов машинного обучения для задач интеллектуального анализа данных. Алгоритмы могут быть применены непосредственно к набору данных или вызваны из вашего собственного кода Java. Weka содержит инструменты для предварительной обработки данных, классификации, регрессии, кластеризации, правил ассоциации и визуализации. Он также хорошо подходит для разработки новых схемы машинного обучения.
Как упоминалось выше, он поставляется с кучей различных классификаторов, таких как SVM, веять, С4.5, наивный Байес (конечно) и многое другое (см. API doc). Обратите внимание, что многие классификаторы, как известно, имеют гораздо лучшее исполнение, чем наивный Байес в области обнаружения спама или текстовой классификации.
Furthermore Weka приносит вам очень мощный GUI...
может быть https://ci-bayes.dev.java.net/ или http://www.cs.cmu.edu / ~javabayes/Home/node2.html?
Я тоже никогда не играл с ним.
вот реализация Байесовской фильтрации в C#:наивный байесовский спам-фильтр для C# (размещено на CodeProject).
на французском языке, но вы должны быть в состоянии найти ссылку для скачивания :) PHP наивный байесовский фильтр