Библиотека парсера RSS-каналов в Python

Я ищу хорошую библиотеку на python, которая поможет мне анализировать RSS-каналы. Кто-нибудь использовал feedparser? Есть отзывы?

7 ответов


использование feedparser-гораздо лучший вариант, чем прокатка с minidom или BeautifulSoup.

  • он нормализует различия между всеми версиями RSS и Atom, поэтому вам не нужно иметь другой код для каждого типа.
  • это хорошо об обнаружении различных форматов даты и других вариаций в лентах.
  • он автоматически следует за перенаправлениями HTTP.
  • он дезинфицирует содержимое HTML.
  • поддержка ETag и Последние измененные заголовки, чтобы вы могли видеть, изменился ли канал, просто загрузив заголовок HTTP, а не весь канал.
  • Он поддерживает проверку подлинности для.
  • он имеет поддержку HTTP прокси.

Как упоминали другие, просто попробуйте. Это как 2 строки кода для анализа кормов. Моя единственная жалоба заключается в том, что он просто использует словари в качестве модели данных, и некоторые атрибуты могут отсутствовать в словаре, если они не были в ленте, поэтому вы нужно проверить это в коде. Но документация очень ясна, какие атрибуты всегда будут в словаре, а какие могут отсутствовать.

наконец, я могу поручиться за это, так как я написал приложение, которое его использует. Смотрите здесь: http://www.feednotifier.com/


Feedparser очень мощный, настраиваемый и простой в использовании. Очень дружелюбная кривая обучения, если вообще есть.

пример

программно определить, сколько ответов на ваш вопрос:

easy_install feedparser
python -c 'import feedparser; print len(feedparser.parse("http://bit.ly/c785aj")["entries"])'

Я знаю, что это очень старая тема, но для чего она стоит, я использовал feedparser (Universal feed parser) версии 5.1.3, и я недавно переключился на speedparser (0.1.8) по соображениям производительности. Он имеет почти те же интерфейсы, но работает быстрее.

Я использую его для любителя Python-для-Android приложение и speedparser работает примерно в 5 раз быстрее на моих каналах.


http://www.feedparser.org/

в первую очередь ударит по г.


в ответ на ваш отклик. Вы можете использовать BeautifulSoup-но feedparser намного лучше ориентирован на передачу RSS.

не огрызаться-но вы читали feedparsers документация? Я не знаю, как это может быть проще в использовании.


Если вы хотите альтернативу, попробуйте xml.дом.минидом. Как "Django-это Python", "RSS-это XML".


Я настоятельно рекомендую feedparser.