Интерфейс Python для файлов ARPA
Я ищу pythonic интерфейс для загрузки файлов ARPA (модели языка back-off) и использовать их для оценки некоторого текста, например, получить его лог-вероятность, недоумение и т. д.
Мне не нужно генерировать файл ARPA в Python, только использовать его для запроса.
У кого-нибудь есть пакет? Я уже видел kenlm и swig-srilm, но первый очень трудно настроить в Windows, а второй кажется не поддерживается больше.
2 ответов
Я нашел хороший пакет под названием pynlpl что делает именно то, что мне нужно, с очень небольшим количеством зависимостей (libxml2 примерно достаточно), и это дает чистую питоническую реализацию ARPA files
Как насчет пакета ARPA?
Он довольно легкий. Его API также довольно интуитивно понятны и просты в освоении. Хотя это не так быстро, как кенлм, вы все равно можете попробовать.