Wikipedia API-получить случайные страницы)

Я пытаюсь получить результат JSON с набором случайных страниц из Википедии, включая их названия, контент и изображения.

Я играл с их песочницей API, и до сих пор лучшее, что у меня есть, это:

https://en.wikipedia.org/w/api.php?action=query&list=random&format=json&rnnamespace=0&rnlimit=10

но это включает только пространство имен, идентификатор и заголовок десяти случайных страниц. Я хотел бы получить содержание, а также изображений, а также.

а кто-нибудь знает как?

в качестве альтернативы я мог бы сделать с заголовком, контентом и url-адресом изображения одной случайной страницы. Лучшее, что у меня есть, это:

https://en.wikipedia.org/w/api.php?action=query&generator=random&format=json

1 ответов


ты близко. generator=random - Это правильный путь. Затем вы можете использовать различные prop значения для получения нужной информации:

  • заголовок страницы всегда включен.
  • чтобы получить текст, использовать prop=revisons вместе с rvprop=content.
  • чтобы получить все изображения, используемые на странице, используйте prop=images.

    обратите внимание, что это часто будет включать изображения, которые вас, вероятно, не интересуют, такие как значки и флаги. Чтобы исправить это, вы можете попробовать вместо prop=pageimages, хотя это не всегда получается. Или вы можете попробовать использовать оба.

Итак, окончательный запрос может выглядеть так:

https://en.wikipedia.org/w/api.php?format=json&action=query&generator=random&grnnamespace=0&prop=revisions/images&rvprop=content&grnlimit=10