Ограничение сайта Google Search API

согласно документам API пользовательского поиска Google:http://code.google.com/apis/customsearch/docs/start.html#sites существует ограничение до 5000 сайтов, которые вы можете искать. Это довольно неубедительно. Есть ли способ обойти это, чтобы я мог искать по всему интернету, используя результаты Google?

кроме того, если вы включаете кучу шаблонов url, которые соответствуют более 5000 веб-сайтов, как бы API выбрать, какие сайты включать и какие исключить?

3 ответов


Это для пользовательского поиска, а не обычный поиск Google. Например, если вы владели abc.com и acme.com, вы можете настроить пользовательский поиск в этих двух доменах для своих клиентов. Таким образом, они могут искать информацию на ваших сайтах. Лимит на 5000 сайтов на самом деле огромен. Я не уверен, что могу придумать приложение, которое будет использовать столько указанных сайтов.

Я думаю, что вы ищете Google Web Search API, который искал все Google. К сожалению, это сейчас обесценивается. (ссылка:http://code.google.com/apis/websearch/) Вы все еще можете использовать старый API, но это риск, потому что Google оставляет за собой право отключить его в любое время. Они также ограничат количество поисков, которые вы выполняете в день (хотя я не могу найти определенное число для этого предела). Вот ссылка на их условия: http://code.google.com/apis/websearch/terms.html

Я бы рекомендовал посмотреть на API из другого поисковая система, если вы действительно хотите интегрировать ее непосредственно в свой код. Другим предложением было бы поместить вашу поисковую информацию за интерфейс и закодировать ее в Google на данный момент. Затем, если они выключат его или выйдет что-то лучшее, вы можете изменить только код поиска, чтобы указать на новейший и лучший API.


Google Custom Search на самом деле способен искать по всей сети, хотя настройка не очевидна. См."поиск по всей сети".

другие проблемы, с которыми вы, вероятно, столкнетесь:

  1. вы получаете только 100 результатов за поиск, и
  2. вы ограничены 100 запросов в день.

к сожалению, "обновление" до поиска сайта Google устраняет проблему #2 за счет возможности поиска по вся сеть.


вы можете сломать 5000 ограничение, если вы размещаете связанный файл спецификации CSE на своем собственном веб-сайте https://www.google.com/cse/docs/cref.html