Интерфейс Python для файлов ARPA

Я ищу pythonic интерфейс для загрузки файлов ARPA (модели языка back-off) и использовать их для оценки некоторого текста, например, получить его лог-вероятность, недоумение и т. д.

Мне не нужно генерировать файл ARPA в Python, только использовать его для запроса.

У кого-нибудь есть пакет? Я уже видел kenlm и swig-srilm, но первый очень трудно настроить в Windows, а второй кажется не поддерживается больше.

2 ответов


Я нашел хороший пакет под названием pynlpl что делает именно то, что мне нужно, с очень небольшим количеством зависимостей (libxml2 примерно достаточно), и это дает чистую питоническую реализацию ARPA files


Как насчет пакета ARPA?

Он довольно легкий. Его API также довольно интуитивно понятны и просты в освоении. Хотя это не так быстро, как кенлм, вы все равно можете попробовать.

https://pypi.org/project/arpa/