Библиотека парсера RSS-каналов в Python
Я ищу хорошую библиотеку на python, которая поможет мне анализировать RSS-каналы. Кто-нибудь использовал feedparser? Есть отзывы?
7 ответов
использование feedparser-гораздо лучший вариант, чем прокатка с minidom или BeautifulSoup.
- он нормализует различия между всеми версиями RSS и Atom, поэтому вам не нужно иметь другой код для каждого типа.
- это хорошо об обнаружении различных форматов даты и других вариаций в лентах.
- он автоматически следует за перенаправлениями HTTP.
- он дезинфицирует содержимое HTML.
- поддержка ETag и Последние измененные заголовки, чтобы вы могли видеть, изменился ли канал, просто загрузив заголовок HTTP, а не весь канал.
- Он поддерживает проверку подлинности для.
- он имеет поддержку HTTP прокси.
Как упоминали другие, просто попробуйте. Это как 2 строки кода для анализа кормов. Моя единственная жалоба заключается в том, что он просто использует словари в качестве модели данных, и некоторые атрибуты могут отсутствовать в словаре, если они не были в ленте, поэтому вы нужно проверить это в коде. Но документация очень ясна, какие атрибуты всегда будут в словаре, а какие могут отсутствовать.
наконец, я могу поручиться за это, так как я написал приложение, которое его использует. Смотрите здесь: http://www.feednotifier.com/
Feedparser очень мощный, настраиваемый и простой в использовании. Очень дружелюбная кривая обучения, если вообще есть.
пример
программно определить, сколько ответов на ваш вопрос:
easy_install feedparser
python -c 'import feedparser; print len(feedparser.parse("http://bit.ly/c785aj")["entries"])'
Я знаю, что это очень старая тема, но для чего она стоит, я использовал feedparser (Universal feed parser) версии 5.1.3, и я недавно переключился на speedparser (0.1.8) по соображениям производительности. Он имеет почти те же интерфейсы, но работает быстрее.
Я использую его для любителя Python-для-Android приложение и speedparser работает примерно в 5 раз быстрее на моих каналах.
в ответ на ваш отклик. Вы можете использовать BeautifulSoup-но feedparser намного лучше ориентирован на передачу RSS.
не огрызаться-но вы читали feedparsers документация? Я не знаю, как это может быть проще в использовании.