Canonical атрибут – полное руководство по атрибуту канонических адресов. Rel canonical — атрибут тега link для настройки канонических страниц и ликвидации дублей в WordPress | Дропшиппинг

Содержание

Атрибут rel=canonical: что это такое

Атрибут rel=«canonical» — специальный тег, который сообщает поисковым системам, какую из страниц с дублированным контентом считать дополнительной, а какую – основной.

Почему появляются страницы с дублированным контентом

Дубли страниц – это страницы с полностью идентичным содержанием, но с разными URL.

Почему вообще на сайте появляются дублированные страницы? Самые распространенные причины:

Из-за особенностей CMS на сайте могут появиться страницы с .php или .html, со слэшем и без слэша на конце. Например: http://site.ru/page/ и http://site.ru/page
На сайте есть страницы с динамическими параметрами URL,
Меняется структура сайта, но вебмастер, создавая новые страницы, забывает удалить старые.
Страницы фильтров, сортировок, поиска и страницы пагинации, где текст и мета-теги всех страниц могут быть одинаковыми.

Сайт переводят на защищенный протокол HTTPS, но он доступен и по HTTP

Если у сайта много дублированных страниц, вебмастеру стоит заняться этим вопросом, т.к.:

Дубли страниц затрудняют индексацию сайта,
Яндекс и Google не любят дублированный контент, и сайт может потерять позиции в поиске.
Поисковая система может отображать в поиске страницу, которая является второстепенной.

Поиск и устранение дублированных страниц является частью поисковой оптимизации сайта. Чаще всего проблему дублей решают с помощью 301 редиректа и атрибута rel=«canonical».

Когда нужно использовать атрибут rel=«canonical»

Основная задача атрибута rel=«canonical» показать поисковой системе, какую из страниц с одинаковым контентом считать канонической, т.е. главной, а какую – второстепенной. Благодаря каноническим ссылкам, поисковые роботы поймут, какие страницы нужно индексировать чаще и выбирать для показа в результатах поиска.

Атрибут rel=canonical является одним из сигналов для поискового робота при выборе канонической страницы. Поисковики также ориентируются на протокол (http или https), предпочтительный для пользователя домен, качество страницы, присутствие URL в файле Sitemap и т.д. Несмотря на то что атрибут является лишь рекомендацией для поискового робота, а не строгим предписанием, его использование очень желательно.

Чаще всего вебмастера используют канонические ссылки в следующих случаях:

Несколько страниц для одной серии продуктов,
Страницы сортировок товаров в каталоге,
Использование партнерской программы на сайте,
Использование одинакового контента на разных доменах или разных языковых версиях сайта,
Если вебмастер точно знает, что CMS может создавать дубли,

Страницы с дублями из-за UTM-меток и т.д.

Как использовать атрибут rel=«canonical» на сайте

Существует несколько способов использования атрибута rel=«canonical»:

В коде страницы, которая не является основной, между тегами head указать атрибут и абсолютную ссылку на страницу, которую следует считать приоритетной. Например, [link rel=»canonical» href=“https://site.ru/” /].
Канонические ссылки можно прописывать в файле Sitemap, но так как XML-карта является только рекомендацией для поисковых роботов, они могут ее игнорировать.
Если страница реализована не в HTML, то можно прописывать канонические ссылки в заголовке HTTP.
Есть специальные плагины, которые позволяют настраивать канонические ссылки на разных платформах.

Основные ошибки при создании канонических ссылок:

Каноническая ссылка не индексируется,
Каноническая ссылка отдает 404 ошибку или 200 код сервера,
На одной странице прописано несколько ссылок с атрибутом rel=«canonical» (в этом случае будет учитываться только первая ссылка),
При указании канонических ссылок для одной страницы несколькими способами (например, код сайта и XML-карта), ссылки оказались разными,
Указанный канонический URL находится на другом домене или поддомене,
Указана цепочка канонических адресов. Например, для страницы site.ru/1 указана каноническая ссылка на страницу site.ru/2, в то время как для адреса site.ru/2 указан канонический адрес site.ru/3.
На страницах пагинации в качестве канонической ссылки указывается первая страница, что делает невозможным индексацию всех остальных страниц. В данном случае корректнее делать каноническую ссылку на страницу «Показать все», если она есть на сайте.
Содержимое канонической страницы значительно отличается от наполнения второстепенной страницы. В таких случаях поисковые роботы могут игнорировать рекомендации и канонические ссылки.

Проверить корректность размещения ссылок с атрибутом rel=«canonical» можно с помощью программы Screaming Frog SEO Spider.

Поисковый робот узнает об изменениях на сайте при его обходе. Если вебмастер корректно указал канонические страницы и робот последовал рекомендациям, второстепенная страница пропадет из результатов поиска. В Яндексе, например, это можно отследить с помощью сервиса Вебмастер (страница Индексирование — Страницы в поиске (блок Исключённые страницы):

Атрибут rel=»canonical» — полное руководство

Иногда контент может быть доступен на нескольких веб-страницах, или даже сайтах.

Канонический URL (тег link в HTML с атрибутом rel=canonical) помогает поисковым системам связать дополнительные страницы, благодаря чему наличие нескольких страниц не вредит рейтингу сайта в поисковой выдаче.

Что такое элемент link с атрибутом rel=»canonical»?

История rel=canonical

В феврале 2009 года Google, Bing и Yahoo! представили элемент link с атрибутом rel=»canonical». Идея незамысловатая, однако есть специфические нюансы.

rel=canonical, называемый также канонической ссылкой, это элемент HTML, который помогает веб-мастерам избежать сложностей, связанных с дублированием контента. Делается это за счет точного определения предпочтительной версии веб-страницы.

Все предельно просто: если у вас есть несколько похожих версий контента, вы выбираете одну «каноническую» версию и сообщаете об этом поисковой системе. Это устраняет проблему дублирующегося контента, когда поисковые системы не знают, какую версию контента показывать. В этой статье описаны случаи применения rel=canonical, а также ситуации, когда применение этого тега не представляется целесообразным.

Польза rel=canonical для SEO

Выбор подходящего канонического URL для каждого комплекта ссылок улучшает рейтинг интернет-ресурса в том, что касается поискового продвижения. Когда Google знает, какая версия каноническая, он может учесть все ссылки, ведущие к разным версиям, как и ссылки к одной версии. Назначение канонической страницы сродни переадресации 301, но без фактической переадресации.

Процесс т.н. «канонизации»

Во многих случаях все очевидно: одна из ссылок окажется лучше других. Но возможна и обратная ситуация, как бы то ни было, достаточно лишь выбрать один URL. Лучше когда есть каноническая ссылка, чем когда она отсутствует.

Определение канонических URL

Допустим, существует две версии одной страницы. 100% один и тот же контент. Отличаются они лишь тем, что находятся в разных разделах сайта, и потому цвет фона активного меню отличается. Другие сайты ссылаются на обе эти версии, т.к. контент интересен аудитории. Какую же версию выбрать поисковой системе?

Вот эти URL:

Для этого, собственно, и был изобретен атрибут rel=canonical. Это (к сожалению) распространенное явление среди платформ для электронной коммерции.

У определенной продукции имеется несколько URL, позволяющих добираться к ней разными маршрутами.

rel=canonical применяется следующим образом:

1) Вы выбираете одну из своих страниц как каноническую. Это должна быть версия, которая представляется более важной. Если для вас это не принципиально, выберите URL с большим количеством ссылок или более высокой посещаемостью. Если показатели посещаемости аналогичны — сыграйте в орлянку; выбор необходимо сделать в любом случае.

2) Добавьте тег link с атрибутом rel=canonical, ведущий с неканонической страницы на каноническую. Таким образом, выбрав более короткий URL как канонический, оставшийся URL будет ссылаться на более короткий URL, как в разделе <head> страницы: <link rel=»canonical» href=»http://example.com/wordpress/seo-plugin/»>

И все.

Этот способ позволяет «объединить» две страницы в одну — по крайней мере так это видит поисковая система. Ссылки на оба URL теперь рассматриваются как ссылки на одну каноническую версию URL.

Когда необходимо использовать канонические URL

Перенаправление 301 или каноническая ссылка?

Что делать, если приходится выбирать между перенаправлением 301 или каноническим URL? Ответ прост: если нет технических ограничений, не позволяющих делать перенаправление, тогда следует всегда выбирать перенаправление. Если нельзя сделать перенаправление, поскольку это может повредить опыту взаимодействия, или привести к сложностям другого рода: устанавливайте канонический URL.

rel=»canonical», ведущий на тот же URL

В описанном выше примере была сделана ссылка с неканонической страницы на каноническую. Но должен ли у целевой страницы присутствовать атрибут rel=»canonical», ведущий на этот же URL? Есть мнение, что присутствие канонического элемента на каждой странице — лучший вариант. Так считают представители Google и Яндекс. Причина в том, что большинство CMS предоставляют параметры URL без изменения контента, поэтому все эти URL будут демонстрировать один и тот же контент:

Примечание. Если на странице, указывающей на самую чистую версию URL, отсутствует атрибут rel=»canonical», ведущий на этот же URL, — это риск. Если вы не сделаете этого, кто-то другой может сделать это за вас, в результате получится дублирующий контент. Таким образом, добавление атрибута rel=»canonical» — позволяет перестраховаться в смысле SEO.

Кросс-доменные канонические URL

У вас может быть один и тот же контент на нескольких доменах. К примеру, какой-то сайт может регулярно публиковать статьи стороннего ресурса (разумеется, с разрешения). У каждой из таких перепечатанных статей должен быть rel=canonical, указывающий на оригинальную статью. В таком случае, все ссылки, ведущие на перепечатанные статьи, будут добавляться к рейтингу оригинальной версии статьи.

Сложности, связанные с каноническими URL

https://productforums.google.com/d/topic/webmaster-ru/cXRa4AkbpAU

Во многих случаях неправильная реализация rel=canonical приводила к большим проблемам. Были ситуации, когда rel=canonical на главной указывал на какую-то статью в другом разделе, таким образом главная страница исключалась из поисковых результатов.

Добавление rel=canonical на первую страницу из нескольких пронумерованных. Если статья разбита на несколько страниц, нельзя задавать каноническую страницу #1. rel=canonical на второй странице должен вести именно на страницу #2. Если канонической установлена страница #1, поисковые системы не будут индексировать другие страницы.
Важна стопроцентная точность. В силу разных причин многие сайты используют протоколы, связанные со ссылками, и убирают приставку http / https из URL, но для канонических страниц этого делать не стоит.

rel=canonical и социальные сети

Facebook и Twitter также учитывают атрибут rel=canonical, что, в свою очередь, может привести к ряду сложностей. Если вы опубликовали на Facebook URL, у которого имеется канонический атрибут, указывающий на другое место, тогда Facebook распространит данные канонического URL. Другими словами, если вы добавляете кнопку like на страницу, rel=canonical которой ведет на другой ресурс, счетчик «лайков» будет высвечивать цифры для канонического, а не для текущего URL. То же и в Twitter.

Расширенные настройки rel=canonical

Каноническая ссылка в заголовке HTTP

Google поддерживает канонические ссылки в заголовке HTTP. Заголовок выглядит следующим образом:

Link: <http://www.example.com/white-paper.pdf>;
rel=»canonical»

При работе с PDF-файлами полезно знать, что такая опция существует.

Использование атрибута rel=canonical для не очень похожих страниц

И хотя это не рекомендуется, все-таки можно прибегнуть к более агрессивному продвижению, используя rel=canonical: добавить атрибут rel=canonical для двух совершенно разных материалов. С Google это проходит, до определенной степени. Но если поисковая система вас в этом уличит, то перестанет доверять каноническим элементам сайта, и от такого трюка будет больше вреда…

rel=canonical + hreflang

Очень важно, чтобы при использовании hreflang канонический элемент каждого отдельного языка указывал на себя. Убедитесь в том, что вы понимаете, как работать с каноническим элементом, прежде чем использовать hreflang, в противном случае это может испортить всю реализацию hreflang.

Итог: rel=canonical — эффективный инструмент

Rel=canonical — достаточно мощный инструмент в арсенале специалиста по SEO, но как и с любым подобным инструментом, его следует использовать очень осторожно, чтобы не навредить. Для крупных сайтов процесс выбора канонического элемента чрезвычайно важен, т.к. это существенно улучшает поисковую оптимизацию.

Rel Canonical [как прописать атрибут]

Часто бывает, что на сайте присутствуют дубли страниц, которые нельзя удалить или сделать 301 редирект в силу разных причин.

Во время проведения технического аудита на одном из клиентских сайтов я обнаружил дубли карточек товаров. То есть одна карточка могла находиться в 3 и более подразделах.

Система SaaS, на которой находится сайт не позволяет менять url страниц, чтобы привести все карточки к одному url. Поэтому я решил использовать rel canonical.

Канонический url адрес страницы link rel canonical — это специальный тег, который используется для борьбы с дублями и неинформативными страницами.

Атрибут поддерживается Яндексом, Google и другими поисковыми системами. Выглядит он в коде вот таким образом:

<link rel=»canonical» href=»https://mydaoseo.ru/texnicheskie-momenty/atribut-rel-canonikal/» />

То есть атрибут рел каноникал сообщает поисковым роботам, какая страница является канонической (главной), которую нужно индексировать и ранжировать, а остальные (дубли) не учитывать.

Как работает каноникал на примере

Допустим, у вас есть 3 страницы с разными адресами, но одинаковым контентом — вы решили поместить статью в 3 рубрики.

https://mydaoseo.ru/texnicheskie-momenty/atribut-rel-canonical/
https://mydaoseo.ru/optimizaciya/atribut-rel-canonical/
https://mydaoseo.ru/prodvizhenie/atribut-rel-canonical/

Получается, у вас 3 дубля. Что делать?

Можно сделать 301 редирект, закрыть страницы в или закрыть в файле robots.txt, как вариант. Но можно прописать ссылку canonical и тогда дубли исчезнут. То есть поисковик будет учитывать только ту страницу, которую вы укажете в качестве канонической.

Как и где прописать rel canonical

Для представленного выше примера за каноническую страницу возьмем вот эту https://mydaoseo.ru/texnicheskie-momenty/atribut-rel-canonical/

То есть у вас есть два дубля

https://mydaoseo.ru/optimizaciya/atribut-rel-canonical/

https://mydaoseo.ru/prodvizhenie/atribut-rel-canonical/

И теперь в коде каждой страницы дубля между тегами <head></head> нужно прописать вот такой элемент:

<link rel=»canonical» href=»https://mydaoseo.ru/texnicheskie-momenty/atribut-rel-canonikal/» />

Вот в принципе и вся настройка rel canonical. Теперь поисковые системы при обходе этих дублей не будут их индексировать. В поиске будет ранжироваться только каноническая страница https://mydaoseo.ru/texnicheskie-momenty/atribut-rel-canonical/

Важно отметить, что при использовании тега link rel canonical нужно прописывать абсолютные пути, начиная с http или https, а не относительные. В противном случае, если вы будете использовать, например, такой адрес /texnicheskie-momenty/atribut-rel-canonical/ (относительный путь), то может возникнуть ошибка. Особенно, это важно при переезде на протокол https.

Использование атрибута rel canonical в SEO

Я начал этот пост с ситуации дублей карточек товаров на одном из моих клиентских сайтов. Это далеко не единичный случай использования реал каноникал в SEO. Очень часто атрибут rel canonical применяется для страниц пагинации.

Часто также возникают разные споры и заблуждения в SEO кругах относительно использования canonical на саму себя. Вот, что ответил в одном из своих интервью Мэтт Каттс:

Абсолютно нормально, если страница ссылается сама на себя с rel=canonical, и абсолютно нормально, во всяком случае, для Google, чтобы rel=canonical стоял на каждой странице сайта. Люди думают, что его можно использовать спорадически, но это не тот случай. Мы специально рассматривали ситуацию, когда каждая страница сайта содержит rel=canonical. Пока вы заботитесь о том, чтобы они указывали на правильные страницы, проблем не будет вообще.

То есть ничего ужасного в этом нет, на многих сайтах wordpress (в том числе и на моем) стоит rel canonical на саму себя и страницы нормально ранжируются.

301 редирект или атрибут rel canonical

301 редирект — это директива, которая ОБЯЗАТЕЛЬНО учитывается поисковиками, без исключений. А каноникал — это некая “подсказка”, как вести себя роботу.

Поэтому предпочтительней использовать 301 редирект!

Но как в моем случае в начале поста, SaaS платформа не позволяет менять URL адреса и соответственно настроить 301 редирект, поэтому пришлось прибегнуть к помощи каноникла.

То есть canonical нужно использовать в том случае, когда нет технической возможности сделать 301 редирект. Об этом, кстати, говорит и Мэтт Каттс в том же интервью.

Напоследок еще хочу сказать, что в файле sitemap.xml будут отображаться все страницы, в том числе и все дубли, но не канонические страницы будут исключаться из поиска.

Если вам понравилась статья или была полезной, то поделитесь ею в социальных сетях, а также пишите ваши комментарии или вопросы.

P.S. А тем, кто не знает, кто такой Мэтт Каттс советую посмотреть вот этот короткий ролик.

Загрузка…

полное руководство по атрибуту канонических адресов. Rel canonical — атрибут тега link для настройки канонических страниц и ликвидации дублей в WordPress

Rel=»canonical» — полное руководство по атрибуту канонических адресов. Rel canonical — атрибут тега link для настройки канонических страниц и ликвидации дублей в WordPress

Привет, друзья! Я уже писал про и то какой вред они могут нанести сайту. Сегодняшняя тема напрямую связана с этим явлением. Я расскажу про атрибут rel=canonical.

Атрибут rel=canonical был введен Google 12 февраля 2009 года. Он учитывается до сих пор, поисковой системой Яндекс в том числе. Атрибут rel=canonical указывает поисковым роботам какая страница является предпочтительной при индексации, если на сайте имеется несколько страниц с одинаковым содержимым, но с разными URL-адресами.

Допустим существует 2 страницы:

http://сайт/chto-takoe-alexa-rank.html
http://сайт/chto-takoe-alexa-rank.html?id=4535

В данном случае первая страница является основной, именно для нее и должен быть прописан атрибут rel=canonical. А вторая страница является лишь ее копией, но с другим URL-адресом. Следовательно, если не будет прописан rel=canonical, то поисковая система будет индексировать как основной адрес, так и дубль страницы.

Конечно, поисковые системы не глупы и со временем выкинут дубль из индекса, но на это требуется время. А если сайт ежедневно пополняется несколькими сотнями новых страниц, то отсутствие указания канонического URL-адреса может негативно сказаться на продвижении.

Возьмем интернет магазин с 10 000 товарами. У каждого товара на сайте своя страница и несколько дублей. Представляете как подпортит продвижение сайта могут 20 000 дублированных страниц?

Откуда берутся неканонические страницы на сайте

Неканонические страницы или дубли генерируют движки управления, такие как WordPress, phpBB и прочие. Если у вас сайт написан на чистом HTML, то дублированных страниц в принципе быть не должно, если только вы их специально не добавляли конечно.

Если мы обратимся к справочнику вебмастера в Google и Яндекс, то увидим следующее:

Сообщение Google

Рекомендации Яндекс

Указание атрибута rel=canonical не является строгой директивой. При отсутствии данного атрибута, поисковые системы попытаются определить каноническую страницу самостоятельно.

Как прописать атрибут rel=canonical

С тех пор, как Google ввел данный атрибут, прошло много времени и практически на всех CMS и конструкторах сайтов есть возможность его прописать. В конструкторах сайтов он обычно прописывается автоматически, а для движков существуют дополнения в виде модулей и плагинов.

Если взять CMS WordPress, то практически все SEO плагины предоставляют возможность прописать канонический URL автоматически. Я пользуюсь плагином All In One Seo Pack, поэтому покажу на его примере.

В настройках плагина нужно отметить галочкой, чтобы автоматически прописывались канонические URL-адреса.

Если взглянем на исходный код страницы, то увидим что rel=canonical прописан. И если поисковый робот зайдет на этот дубль страницы, то увидит, что страница не является основной.

Вот такой вот интересный атрибут. Конечно, ничего нового я вам не открыл. Но почему-то многие не обращают внимания на вот такие мелочи, особенно владельцы небольших интернет-магазинов.

Довольно таки часто, можно увидеть на разных сайтах, что на один и тот же контент посетители попадают с разных адресов (URL). Причиной этого явления, есть дублирование содержимого на сайте. Как правильно — это случается при использовании различных систем управления контентом (cms) на сайте. Для того, что бы избежать проблемы, компанией Google еще в 2009 году было предложено использование тега rel=”canonical” , для страницы с определенным url, которая будет участвовать в выдаче поисковых систем. Немного позже все поисковики поддержали идею.

Атрибут rel=»canonical»

Как использовать атрибут rel=”canonical”.

Допустим, вы нашли страницу на которую с разных url приходят посетители и хотите решить проблему с помощью атрибута. Для этого выбираем основной url, например: https://сайт/kak-samomu-raskrutit/page-one-1/ и теперь что бы сообщить об этом поисковой системе необходимо:

прописать атрибут rel=”canonical” для основной страницы и добавить на страницу тег в теле , вот пример:

Поисковая система, выделит этот адрес, как основной и он будет использоваться в результатах поиска. Для того, что бы избежать проблем, указывайте абсолютные ссылки, а не относительные.

Нужно использовать:

https://сайт/kak-samomu-raskrutit/page-one-1/

Не использовать:

/kak-samomu-raskrutit/page-one-1/

Теперь перед нами может появится главный вопрос, а передаются ли характеристики такие как ссылочный вес, pr канонической странице? Могу сказать точно, все характеристики страницы, такие как ссылочный вес и т.д, передаются, проверено на практике.

Что бы упростить жизнь вебмастерам и сеошника, рекомендую использовать плагины и модули для CMS, которые будут отслеживать ссылки с дублирование контента и автоматически прописывать канонические атрибуты. Для WordPress могу рекомендовать плагин , отлично справляется с задачей. Достаточно поставить галочку в пункте “Канонические URL’ы” и будут генерироваться канонические страницы автоматически.

Вам остается только проверять правильно и корректировать роботу плагина.

Примеры, где необходимо использовать rel=»canonical».

1. Сервер показывает одинаковое содержимое для протокола https и субдомена www , пример:

http://lonbo.com/page-one
https://loknbol.com/page-one
http://www.lonbo.com/page-one

Так, же для этого случая можно использовать .

2. Для сайтов, которые используют движки , при сохранении контента в разные разделы (категории).

https://сайт/category-1/page-one1/
https://сайт/category-2/page-one1/

3. Динамические URL . Как правило характерно для товаров интернет — магазинов, которые созданы в разные сессии или для разных поисковых запросов. Пример:

https://сайт/products?category=shapka&color=grey
https://сайт/head/grey?gclid=ABCD
https://сайт/shapka/grey/shapkaGrey.html

4. Распространение содержимого сайта(ресурса), на других сайтах , полностью или частично.

Общие правила при использовании атрибута rel=»canonical».

Не используйте атрибута более одного раза, для одной страницы. Поисковик может просто проигнорировать его указание.
Не забывайте включать rel=”canonical” в раздел кода HTML. Особенно проверяйте при использовании плагинов или модулей.
Убедитесь, что каноническая страница открыты для индексации, в противном случае использование бесполезно.
Страницы

На сайте по разным причинам может появиться дублированный контент. Без дополнительной информации поисковая система при этом сама решает какой контент ранжировать выше, а какой ниже. В ряде случае поисковая система может ранжировать выше старый и моральной устаревший контент, потому что выбирает неправильный документ в качестве канонического.

Каноническую страницу легко указать поисковым системам в заголовке страницы, а именно в разделе head документа. Для этого нужно поместить следующий HTML код в head раздел каждого документа, являющегося неканоническим:

Если у Вас есть доступ к HTTP заголовкам, например, через htaccess или PHP, то Вы можете установить канонический URL для файлов, которые не имеют HTML кода, в частности, для PDF, DOC. Для этого используйте код:

Link: ; rel=»canonical»

Случаи, когда rel=»canonical» не работает

Атрибут rel=»canonical» используется поисковыми системами, как подсказка со стороны вебмастеров, какая страница является основной. В тоже время данный атрибут может отработать некорректно. Например, в следующих случаях:

Если указать URL канонической страницы страницу отдающую 404 код, то поисковая система будет искать другой актуальный адрес.
При взломе сайта Google и Яндекс могут посчитать, что злоумышленники поставили фальшивые канонические адреса и в таком случае также их не учитывать.
Если Вы разместили конструкцию внутри тега BODY или в заголовке head при отсутствии закрывающего тега .

Случаи, когда rel=»canonical» можно применять

Как я писал выше, Вы должны использовать rel=»canonical» на страницах, которые являются дубликатами или очень похожими на основную (каноническую). Если у вас есть две похожие страницы, но не идентичные, порой имеет смысл изменить одну из них, чем делать канонической.

Важное, правило: канонической страницей нужно делать только ту страницу, которая находится сейчас в индексе. То есть нельзя использовать для этих целей страницу, которая была исключена из индекса, например, с помощью Robots или мета-тега Noindex или по другим причинам.

Правильное применен

Что такое атрибут rel=»canonical» | Статьи SEOnews

01 Августа 2016 года, 09:13

SEOnews запустил проект для специалистов и клиентов «Энциклопедия интернет-маркетинга», в рамках которого редакция публикует обучающие материалы от ведущих агентств на рынке. В итоге мы планируем выпустить полное, практически полезное и актуальное электронное руководство.

***

Энциклопедия интернет-маркетинга: что такое атрибут rel=»canonical»

Выпускающий редактор SEOnews

Так бывает, что на разных страницах сайта располагается очень похожий или вовсе одинаковый контент. В такой ситуации поисковые системы выбирают только одну страницу, которая, на их взгляд, лучше всего отвечает на запрос пользователя. Прямо скажем, взгляды поисковиков и вебмастера не всегда совпадают. Сегодня в «Энциклопедии интернет-маркетинга» разберем, как указать поисковику на «правильный» URL.

Но для начала посмотрим, в каких случаях один и тот контент может размещаться на страницах с разными URL. Google приводит следующие примеры:

У ecommerce-сайтов динамические URL страниц с одним и тем же товаром могут отличаться, если они отображаются в поиске или если пользователь открывал раздел сайта несколько раз.	https://www.example.com/products?category=dresses&color=green https://example.com/dresses/cocktail?gclid=ABCD https://www.example.com/dresses/green/greendress.html
Если одно сообщение размещается в нескольких разделах, то сервис работы с блогом может автоматически создавать несколько URL.	https://blog.example.com/dresses/green-dresses-are-awesome/ https://blog.example.com/green-things/green-dresses-are-awesome/
Cервер отображает один и тот же контент в субдомене www и по обычным адресам с префиксом http.	http://example.com/green-dresses https://example.com/green-dresses http://www.example.com/green-dresses
Контент, предназначенный для распространения на нескольких сайтах, полностью или частично повторяется в других доменах.	https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (исходное сообщение) https://news.example.com/green-dresses-for-every-day-155672.html (копия сообщения)

Решить эти проблемы можно, указав канонический URL. Для этого нужно использовать атрибут rel=”canonical”.

Что делает атрибут rel=”canonical”

В случае если на сайте есть схожие (или дублирующиеся) по контенту страницы, атрибут rel=”canonical” указывает на предпочтительный для поиска URL, иначе говоря на канонический/основной URL.

Как добавить атрибут rel=”canonical”

Сообщить поисковой системе, что некий URL является основным, довольно просто. Пометьте каноническую страницу и ее варианты атрибутом rel=»canonical». Для этого в блог HEAD HTML-кода добавьте фрагмент .

link rel=»canonical» href=»https://blog.example.com/dresses/green-dresses-are-awesome»

Указанный URL поисковик будет использовать для перехода к контенту, и с большой вероятностью именно он будет отображаться в поиске. Но ни Google, ни Яндекс не обещают, что этот адрес будет отображаться в поиске в любой ситуации.

Из «хелпов» Яндекса:

Робот считает ссылку с атрибутом rel=»canonical» не строгой директивой, а предлагаемым вариантом, который учитывается, но может быть проигнорирован.

Робот может проигнорировать канонический URL, если:

по указанной вами ссылке отдается 404 ошибка;
вы выбрали канонический URL, который находится на другом домене или поддомене;
вы указали несколько канонических адресов.

Чтобы помочь поисковому роботу, Google рекомендует после атрибута rel=”canonical” использовать не относительные, а абсолютные пути:

https://www.example.com/dresses/green/greendress.html – да
/dresses/green/greendress.html – нет

Атрибут rel=”canonical” можно использовать и в заголовках HTTP, если у вас есть доступ к настройкам сервера. Таким образом вы укажете основной URL для HTML и других типов файлов, например, PDF. Для этого в заголовок HTTP нужно добавить фрагмент кода следующего вида:

Link: http://www.example.com/downloads/white-paper.pdf; rel=»canonical»

Чего не умеет атрибут rel=”canonical”

Многие люди считают, что если добавить rel=”canonical” на страницу, то она будет перенаправлять пользователей на каноническую версию, например, с помощью 301 редиректа. Это не так. Тег canonnical содержит ценную информацию для поисковых систем, но он не влияет на отображение страницы и тем более не делает редиректы. Так что используйте его по прямому назначению и не надейтесь на чудо. 🙂

11 правил использования атрибута rel=canonical

Атрибут rel=«canonical». Руководство по использованию

Как мы ранее уже упоминали, дубликаты страниц на сайте являются крайне нежелательным явлением. Их наличие может вводить в заблуждение посетителей и, главное, поисковых ботов, что очень негативно сказывается на продвижении веб-сайта в целом.

В большинстве случаев дублирование контента устраняется банальным удалением повторяющихся страничек или же использованием редиректа 301.

Но существуют случаи, когда более удобным вариантом является атрибут rel=«canonical». Например, если удалить дублирующийся контент и предотвратить его появление в будущем технически сложно осуществить. Или же Вы просто хотите оставить все странички в открытом для пользователей доступе, несмотря на неуникальность размещенного на них контента.

Кстати, в сети очень часто неверно упоминается тег rel=«canonical». Правильный вариант – атрибут rel=«canonical» тега <link>.

Как с помощью атрибута rel=«canonical» убрать дублированный контент

Этот атрибут существует для указания роботам поисковых систем информации о том, какая из дублирующихся страниц является канонической. В частности, речь идет об указании канонической ссылки.

Если вы вдруг не знаете, что такое каноническая ссылка, представьте себе ситуацию, когда одинаковый контент доступен сразу по нескольких адресам:

Канонические ссылки – это предпочитаемые адреса схожих страниц, которые должны учитываться поисковиками (по Вашему мнению). Далее по тексту мы также будем использовать термин «канонический URL».

Обычно каноническая ссылка является адресом страницы-первоисточника, на которой дублируемый контент был размещен изначально.

Допустим, что в рассматриваемом примере, третий адрес – канонический УРЛ. Тогда в код первых двух страниц в сеции <head> нужно ввести атрибут rel=«canonical» для назначения канонического URL:

После этого посетители и роботы все еще смогут просматривать все три варианта, но при индексации будет учитываться только та страница, у которой будет канонический УРЛ.

Особенности применения атрибута rel=«canonical»

Для роботов поисковых систем канонический URL, заявленный при использовании тега <link>, является не беспрекословным указанием, а лишь рекомендуемым вариантом, который в некоторых случаях может быть проигнорирован.
Может и должен быть использовать также и в коде предпочитаемой страницы с указанием ссылки на нее же. Это позволит поисковым роботам определять ее как основную даже в случае захода на нее с автоматически сгенерированных адресов.
Канонический УРЛ должен вести на существующую страницу.
В пределах одной странички нельзя указывать более одной канонической ссылки.
Канонический URL не может находиться на другом домене (или поддомене в случае с Яндексом).
Не рекомендуется выстраивать канонические ссылки в цепочку:
Нецелесообразно использовать этот атрибут совместно с мета-тегом robots, поскольку указания последнего всегда будут считаться более
приоритетными. А следовательно, если в нем будет использовано указание noindex, nofollow, страница не будет индексироваться даже при условии Вашего указания в теге <link>, что ее URL канонический.
Перед тем как указывать канонический УРЛ, нужно убедиться, что страница, которая размещена по нему, не закрыта от индексации в robots.txt.
Убрать дублированный контент не удастся, если в коде всех одинаковых страниц указать разные канонические УРЛ. В этом случае рекомендации, скорее всего, будут проигнорированы.
Рекомендуется прописывать абсолютные адреса ссылок, а не относительные.
Считается, что если указать канонический URL, предпочитаемой странице будет практически без потерь передаваться суммарный вес ее дублей.

Подводя итог…

… хотелось бы сказать, что атрибут rel=«canonical» является очень удобным инструментом, который хоть и не может удалить дублирующийся контент в буквальном смысле, но при этом дает возможность поисковым машинам закрыть глаза на его наличие.

Важно лишь правильно определять канонический URL, соответствующий странице, которая действительно должна попасть в ранжирование.

А Вы пользуетесь этой достаточно удобной возможностью? Или предпочитаете другие способы избавления от дублей страниц?

Атрибут rel=canonical как средство борьбы с дублями

Всем-всем привет!

Дублирование контента в пределах сайта способно принести реальные убытки: можно потерять насиженные позиции и, как следствие, деньги. Избежать подобных историй поможет атрибут rel=canonical.

С помощью данного атрибута можно бороться с дублирующим контентом на страницах ресурса, указывая адрес приоритетной. Приоритетная страница в таком случае будет находиться в индексе, а дублирующие ее содержимое, оттуда пропадут. Следовательно, для поисковых систем никаких дублей существовать не будет.

Прописывается атрибут на страницах с дублями в пределах тегов <head></head>, в нем нужно указать адрес приоритетной страницы:

<link rel="canonical" href="site.ru/prioritetnaya-stranica"/>

Проблем с его восприятием нет практически у всех поисковых систем. Так что беспокоится не нужно.

Пример

Давайте представим, что один и тот же контент доступен по нескольким URL-адресам:

site.ru/category/yandex-direct/post-1;
site.ru/blog/yandex/nastrojka-yandex-direct;
site.ru/kak-nastroit-yandex-direct/

В качестве приоритетной выбрана третья страница. В таком случае, на первых двух нам нужно в теге link указать канонический URL, то есть адрес третьей страницы:

<link rel="canonical" href="site.ru/kak-nastroit-yandex-direct"/>

Вот и все! Теперь при индексации Вашего сайта, поисковые системы будут знать, что в индекс нужно засунуть именно третий вариант. Таким образом, в выдаче по определенному запросу мы увидим то, что нам нужно.

Я сам недавно столкнулся с похожей проблемой: урок 7 и урок 115 по какой-то причине (я сглупил) продвигались по одинаковым ключевым запросам, да и содержание было во многом схожим. Из-за чего ни та, ни другая страницы не могли получать нормальное количество трафика. Затем урок 7 из ТОП-3 выкатился за ТОП-10, а урок 115 так и не раскрыл весь свой потенциал. Вот так вот все и бывает.

Поэтому старайтесь избавить свой веб-ресурс от дублирующих запросов и никогда не продвигайте две страницы по одинаковым запросам. Это очень плохо скажется на развитии сайта.

Как появляются дубли?

Дублирующий контент может появится по нескольким причинам, одна из которых глупость вебмастера, как в моем случае. Второй же может быть плохо настроенная система управления контентом (CMS), так как зачастую она может генерировать разные URL с одним и тем же содержимым.

Так, например, в WordPress раньше была такая штука, как replytocom, которая отвечала за древовидные комментарии. Из-за генерации таких страниц появлялись тысячи дублей в индексе Яндекса и Google, что несомненно приносило только отрицательный результат.

Другие причины:

Статья относится к нескольким категориям. Может быть такое, что материал, написанный на странице, относится к двум-трем различным рубрикам и они выводятся в URL. В таком случае, статья будет доступна по нескольким разным адресам;
Товар относится к нескольким категориям. То же самое, что и со статьями;
Генерация страницы для печати. К изначальному URL добавляется приставка print=true и получается дублирование контента;
И другие причины, присущие Вашей CMS.

Для устранения всех этих причин прописываем атрибут rel=canonical на приоритетные страницы с дублирующих и все.

Внимание: избежать первых двух причин появления дублей можно изменив структуру URL. Подробнее об почитайте в уроке об ЧПУ URL-адресах.

Как выбрать канонический URL?

Атрибут rel=canonical не является строгой директивой, поэтому поисковики могут проигнорировать его. Чтобы такого не случалось достаточно следовать простым указаниям:

Документ по каноническому адресу должен быть доступен для индексирования;
Документ должен находится на одном и том же домене;
Нельзя указывать несколько канонических URL.

Опираясь на эти указания уже выбираем приоритетную страницу из дублирующих. Делать это тоже нужно с умом:

Если все дублирующие страницы попали в индекс, канонической делаем ту, которая будет продвигаться в выдаче;
Если страницы создавались приблизительно в одно время, выбираем ту, которая находится в индексе.

Для закрепления материала рекомендую прочитать выдержки из справок Яндекса и Google по этой теме.

Также, для борьбы с дублями страниц можно использовать редирект 301 с дублирующих на каноническую. В таком случае, по прошествии некоторого времени поисковики выкинут дубли из индекса и оставят только нужное.

Ну а на этом у меня все, дорогие друзья!

Надеюсь материал стал для Вас полезным и теперь проблема дублей страниц не стоит для Вас так остро, как раньше.

До скорого!