Способы предотвращения индексации нерелевантного контента на странице поисковыми системами

Я ищу способы предотвратить индексацию частей страницы. В частности, комментарии на странице, поскольку они много взвешивают записи на основе того, что написали пользователи. Это делает поиск Google на странице возвращать много ненужных страниц.

вот варианты, которые я рассматриваю до сих пор:

1) загрузить комментарии с помощью JavaScript, чтобы предотвратить поисковые системы от их просмотра.

2) использование агента пользователя нюхает просто не выходные комментарии для искателей.

3) используйте разметку для поиска, чтобы скрыть части страницы. Однако это решение кажется в лучшем случае странным. Предположительно, это можно сделать, чтобы предотвратить Yahoo! индексирование конкретного контента:

<div class="robots-nocontent">
This content will not be indexed!
</div>

что очень уродливый способ сделать это. Я читал о решении Google, которое выглядит лучше, но я считаю, что он работает только с Google Search Appliance (может кто-то подтвердить это?):

<!--googleoff: all-->
This content will not be indexed!
<!--googleon: all-->

есть ли у кого-нибудь другие методы посоветуете? Какой из трех вышеперечисленных путей будет лучшим? Лично я склоняюсь к #2, так как, хотя это может не работать для всех поисковых систем, легко нацелиться на самые большие. И это не имеет никакого побочного эффекта на пользователей, если они не намеренно пытаются выдать себя за веб-искателя.

4 ответов


Я бы пошел с вашей опцией JavaScript. Он имеет два преимущества:

1) боты этого не видят 2) это ускорит время загрузки страницы (загружайте комментарии асинхронно и ненавязчиво, например, через jQuery)... время загрузки страницы имеют гораздо недооцененный положительный эффект на ваш рейтинг поиска


Javascript-это вариант, но движки становятся лучше при чтении javascript, честно говоря, я думаю, что вы слишком много думаете об этом, движки любят уникальный контент, чем больше контента у вас на каждой странице, тем лучше, и если пользователи предоставляют его... это Святой Грааль.

только потому, что ваш комментатор сделал ссылку на star wars в вашем обзоре тостера не означает, что вы не собираетесь ранжировать модель тостера, это просто означает, что вы можете ранжировать для star wars тостер.

другая идея заключалась бы в том, что вы могли бы показывать комментарии только людям, которые вошли в систему, collegehumor делают то же самое, я считаю, они показывают количество комментариев, но вы должны войти, чтобы увидеть их.


googleoff и googleon предназначены для Поисковое Устройство Google, который является поисковой системой, которую они продают компаниям, которым нужно искать через свои собственные внутренние документы. Это не эффективно для живого сайта Google.

Я думаю, что номер 1-это лучшее решение, на самом деле. Поисковые системы не любят, когда вы даете им другой материал, чем вы даете своим пользователям, чтобы номер 2 мог выгнать вас из списков поиска вообще.


Это первый я слышал, что поисковые системы предоставляют метод для информирования их о том, что часть страницы не имеет значения.

Google имеет функцию для веб-мастеров, чтобы объявить части своего сайта для веб-поисковой системы, чтобы использовать для поиска страниц при обходе.

  1. http://www.google.com/webmasters/
  2. http://www.sitemaps.org/protocol.php

возможно, вы сможете относительно де-подчеркнуть некоторые вещи на странице, указав наиболее релевантные ключевые слова, используя метатеги в разделе HEAD ваших HTML-страниц. Я думаю, что это больше соответствует инженерной философии, используемой для создания поисковых систем в первую очередь.

посмотреть советы по оптимизации поисковой системы Google. Они четко указывают, что они будут и не позволят вам сделать, чтобы повлиять на то, как они индексируют ваш сайт.