SEO-noindex, nofollow и канонический тег

мне нужно некоторое объяснение моего вопроса.

пример в моем заголовке уже добавлен

<meta name="robots" content="noindex, nofollow" />

должен ли я снова добавить канонический тег в свой заголовок?

<link rel=”canonical” href=”http://www.example.com/product.php?item=big-fish” />

Дайте мне знать :)

канонический тег

обновление

мы знаем, что канонический тег в настоящее время также поддерживается google, yahoo и live search. Как насчет noindex и nofollow? yahoo и live (bing) тоже поддерживаются?

9 ответов


Google, Yahoo! и Bing (Live) поддержка noindex и nofollow в директивах meta.

noindex говорит поисковым системам не беспокоиться о кэшировании вашей страницы для включения в их результаты.

nofollow говорит им, что вы не хотите, чтобы какие-либо ссылки на странице следовали.

добавлять canonical тег на той же странице не повредит, но эффекты неизвестны, если вы не поговорите с одним из поисковые инженеры.


не так много смысла есть? Поисковая система все равно не будет индексировать вашу страницу!

хотя я полагаю, что если вы когда-нибудь захотите, чтобы он был проиндексирован в будущем, это будет хорошей практикой, хотя только если один и тот же контент страницы доступен через разные URL.


просто чтобы прояснить некоторые вещи раз и навсегда

реализация этого

<meta name="robots" content="noindex, nofollow" />

не только говорит ботам не индексировать страницы, но и блокирует их передачу PageRank по ссылкам, найденным на странице. Но это не проблема сама по себе. Проблема в том, что такие страницы становятся тупиковыми страницами, иначе называемыми "висячими страницами" или "узлами", которые вызывают разбавление PageRank, потому что сок будет удален из PR-графика.

об этом сказал оптимальным meta будет реализация:

<meta name="robots" content="noindex,noarchive,nosnippet,follow" />

Если эта страница дублируется, рекомендуется также реализовать канонический тег, связывая его с версией страницы, которую вы хотите индексировать. Если нет, то хотя бы на самую соответствующую страницу.

использование только канонического тега не препятствует индексированию. По крайней мере, не во всех случаях. Например, если на странице PR5 есть каноническая ссылка, указывающая на идентичную страницу с PR 1, Google может игнорировать канонический тег и индексировать страницы с PR 5.

поэтому, чтобы избежать каких-либо заблуждений, канонический тег не является перенаправлением 301. Тем не менее, страницы с каноническим тегом все еще могут накапливать PageRank. Это зависит от того, кто много сока достигает этой странице.

Итак, еще одна причина, которая имеет смысл добавить директиву" follow " meta robots в качестве последней.

согласно Мэтту Каттсу, лидеру команды веб-спама Google, просто используя "noindex" или "noindex, noarchive, nosnippet" без добавления директивы "follow" на конце концов, может быть, что Googlebot может испортить и не следовать по ссылкам на этой странице.

Я надеюсь, что все вышеперечисленное не помогает!


поскольку вы говорите искателю не индексировать и не следовать, я не понимаю, почему вы должны использовать канонический.

вы должны использовать каноническую только если у вас есть тот же контент под разными url.


страницы, которые включены в Роботы.txt-файл говорит поисковым системам не сканировать эти страницы. Однако страницы в роботах.txt-файл по-прежнему может накапливаться в PageRank и индексироваться в результатах поиска, говорит Мэтт Каттс.

тег NoIndex означает, что поисковые системы могут сканировать страницу и давать ей PageRank, однако поисковые системы не индексируют страницу, и она не будет отображаться в результатах поиска. Опять же, страница с тегом NoIndex может накапливать PageRank, поскольку ссылки по-прежнему следуют наружу со страницы NoIndex.

страница с тегом NoFollow сообщает поисковым системам, что да, эта страница может быть просмотрена, но не показывать эту страницу вообще в индексе Google и не следовать никаким исходящим ссылкам, и никакой PageRank не течет с этой страницы.


вам нужен только "канонический" тег, если существует несколько способов обращения к странице. Например, если'http://www.example.com/products/big-fish 'и'http://www.example.com/product.php?item=big-fish ' оба указывают на одну и ту же страницу (т. е. один-псевдоним для другого), используйте 'canonical'.


тем временем на это ответил сотрудник Google, проверьте здесь: http://www.google.com/support/forum/p/Webmasters/thread?tid=79b4544fb7e1cb3c&hl=en

в основном используйте noindex или canonical.


суммируя искусство SEO Эрика Энге & Co book, плюс статьи и форумы в гугле, я предлагаю следующее. Также в основном мы предполагаем, что ваш сайт использует канонические ссылки, чтобы избежать проблемы дубликатов страниц, а все остальные URL-адреса страниц с параметрами cgi считаются нежелательными страницами с точки зрения поисковой системы (хотя полностью функциональны и доступны для посетителей).

  1. канонические URL-страницы-продукт, информация, статьи позволяют все, кроме неканонические ссылки (нежелательные страницы). При этом мы не даем им ни сока, ни рейтинговых бонусов. Другие страницы также не выигрывают от этого. Но мы держим рейтинг нежелательных страниц ниже, а полезные страницы выше в результатах поиска.

  2. дублированные страницы-продукт, поисковая система печати читает код страницы, определяет каноническую ссылку в самом начале, рассматривает ее как эквивалент полезная страница и исключает ее из индекса как нежелательную. SE robot прочитал страницу, поэтому он все еще может просматривать ссылки. Поэтому мы запрещаем следовать ссылкам на других нежелательных страницах с неканоническими URL-адресами. Чтобы сделать эту страницу более эквивалентной канонической цели, мы опускаем другие запрещающие параметры (достаточно канонического тега).

  3. Технические страницы-Регистрация, корзина, заказ запрещают роботам читать все эти страницы, чтобы даже не добраться до каких-либо тегов в коде страницы. Но все же посетители могут добраться до этих страниц, и роботы найдут ссылку на вашей нежелательной странице на своем сайте. Поэтому нам дополнительно нужны все запрещающие теги, чтобы игнорировать эту страницу поисковыми системами и не следовать ссылкам на нежелательных страницах.

    запретить: продукция/каталог/.* # В роботах.txt-файл.


" на индексированных страницах используйте ключевое слово Canonical. На неиндексированных страницах используйте NoIndex."

https://helloacm.com/the-golden-rules-of-removing-duplicate-pages-by-using-noindex-or-canonical/