Как извлечь данные из статьи Википедии?
у меня есть вопрос относительно разбора данных из Википедии для моего приложения для Android. У меня есть скрипт, который может загрузить XML, прочитав источник из http://en.wikipedia.org/w/api.php?action=parse&prop=text&format=xml&page=ARTICLE_NAME
(а также JSON, заменив format=xml
С format=json
.
но я не могу понять, как получить доступ только к определенным разделам из оглавления. Я хочу, чтобы при загрузке страницы пользователь мог нажать кнопку, которая делает всплывающее окно, отображающее заголовки из оглавления, и разрешить пользователь должен прочитать эту часть и только эту часть для удобства. Я немного дрожу с JSON, но возможно ли это сделать? Или есть API из Википедии, который позволяет разработчику просматривать только определенные части страницы?
спасибо!
2 ответов
к сожалению, кажется mediawiki.org документация для parse
не сказать вам, как это сделать. Но!--6-->документация в самом API можно использовать
action=parse не работает хорошо с разбором на секции, рассмотрим этот пример shoert:
Foo is a bar<ref>really!</ref>
== References ==
<references/>
разбор только нулевой раздел приведет к красному сообщению об ошибке без при разборе первого приведет к пустому списку ссылок.
однако, есть лучшее решение: действие=mobileview не только свободен от этой проблемы, но и специально предназначен для мобильных приложений и дает вам мобильный оптимизированный HTML.