Rel canonical как правильно использовать: Rel Canonical — как прописать правильно? – Что такое rel canonical и для чего он нужен? Когда и как нужно использовать канонические ссылки. Основные ошибки

Содержание

Как правильно использовать rel=»canonical» для успешной индексации в поиске Google

Аллан Скотт (Allan Scott), инженер программного обеспечения команды индексирования Google, перечислил в блоге Webmaster Central пять наиболее распространенных ошибок, которые допускают вебмастера при использовании атрибута rel=»canonical», а также дал несколько важных советов по применению данного тега.

Прежде всего, представитель поиска напомнил специалистам отрасли о том, что атрибут канонической страницы чётко указывает поисковым роботам, на какой именно экземпляр из набора страниц с похожим содержанием ссылаются дубликаты. При этом, дополнительные свойства адреса (к примеру PageRank) и связанные сигналы (качество входящей ссылочной массы) также переносятся с дублированных страниц на каноническую. В настоящее время атрибут rel=»canonical» поддерживают все ведущие западные поисковые системы: Yahoo!, Bing, и Google.

Однако зачастую применение атрибута rel=»canonical» вызывает у вебмастеров определенные трудности. В свою очередь, ошибки, связанные с указанием канонической страницы могут повлиять и на отображение страниц ресурса в поисковой выдаче.

Чтобы избежать подобных ошибок, специалисты Google рекомендуют придерживаться следующих общих правил при проставлении атрибута rel=»canonical»:

  • Большинство дублированных страниц должно содержать ссылки на канонический адрес.
  • Важно убедиться в том, что страница, на которую ссылаются при помощи атрибута rel=»canonical» существует, а ее URL — правильный (проверьте не возвращает ли сервер ошибку 404 ).
  • Необходимо убедиться в том, что каноническая страница не закрыта для индексации поисковыми роботами.
  • Важно четко понимать, какую страницу вебмастер хочет видеть в результатах поиска, именно ее и следует указывать как каноническую (к примеру, если сайт содержит набор страниц с одной и той же моделью товара, различающегося по цвету — целесообразно в качестве канонической указать страницу с наиболее популярным цветом).
  • Не стоит забывать о включении атрибута rel=»canonical» в раздел документа кода HTML.
  • Важно избегать использования атрибута rel=»canonical» более одного раза для одной страницы. В противном случае поисковик просто-напросто проигнорирует указание атрибута.

Далее Аллан Скотт перечислил 5 основных ошибок, допускаемых вебмасетрами и оптимизаторами при применении атрибута rel=»canonical»:

Ошибка 1. Атрибут rel=»canonical» использован для первой страницы серии пагинации:

Представьте, что статья на вашем сайте имеет несколько страниц:

  • example.com/article?story=cupcake-news&page=1
  • example.com/article?story=cupcake-news&page=2
  • и т.д.

В данном случае страницы 2 и 3 не являются дубликатами, а значит и применение атрибута rel=»canonical» для указания в качестве канонической первой страницы документа будет ошибкой. Данная ошибка может повлечь за собой выпадение страниц 2 и 3 из индекса.

В подобных случаях представители Google рекомендуют использовать атрибут rel=»canonical» для страниц компонента, указывая в качестве канонического, адрес страницы, на которой расположена статья целиком.

Кроме того, при разбиении документа на страницы важно грамотно применять HTML-атрибуты rel=»next» и rel=»prev», позволяющие указать на взаимосвязь между отдельными URL.

Ошибка 2. Абсолютные ссылки записываются как относительные:

Безусловно, rel=»canonical» можно использовать как для абсолютных, так для относительных ссылок, однако Google рекомендует использовать абсолютные ссылки для минимизации возможных ошибок. Если в документе указана базовая ссылка, то все относительные ссылки будут вычисляться на ее основе.

Однако в случаях, когда абсолютные ссылки на каноническую страницу по ошибке записываются как относительные (<link rel=canonical href=“example.com/cupcake.html”/> вместо http://example.com/example.com/cupcake.html), алгоритмы могут проигнорировать то, что данная страница была указана в качестве канонической.

Ошибка 3. Если каноническими назначено несколько страниц из набора с похожим содержанием, или атрибут rel=»canonical» использован по ошибке:

Часто специалисты Google наблюдают следующую ситуацию: вебмастер копирует шаблон страницы, забывая при этом изменить значение атрибута rel=»canonical»

Если вы используете шаблоны – не забывайте проверять, не был ли случайно скопирован атрибут rel=»canonical».

Еще одна ошибка вебмастеров, когда каноническими назначается несколько страниц из набора с похожим содержанием. Часто это происходит из-за использования различных плагинов на странице. Код плагина по ошибке встраивается в атрибут rel=»canonical».

Важно понимать, что в обоих случаях алгоритмы Google распознают применение атрибута rel=»canonical» как ошибочное, и не учтут его использование при индексации.

Ошибка 4. Одна из категорий целевой страницы ссылается при помощи атрибута rel=»canonical» на избранную статью:

При таком подходе в индекс попадет только страница со статьёй, сама же страница категории не будет проиндексирована.

Ошибка 5. Атрибут rel=»canonical» используется в разделе документа <body> :

Как уже говорилось выше, атрибут rel=»canonical» должен быть включен в раздел документа кода HTML, при этом он не должен попадать в раздел документа <body>. В противном случае алгоритмы Google не будут учитывать использование данного тега, особенно если он будет показываться обычного текста, или тегов, которые мы обычно присутствуют в разделе <body>.

Дополнительная информация, касающаяся применения атрибута rel=»canonical» доступна на формуе Webmaster Help.

Как правильно использовать rel=”canonical“ в SEO продвижении

В идеале должна быть одна версия для каждой страницы. Но на деле часто бывает, что одинаковый контент присутствует в нескольких местах одного сайта, а также на других ресурсах. Чтобы решить проблему дублирующего контента было разработано решение под названием «элемент канонической ссылки», больше известное как атрибут rel=»canonical» .

Как rel=»canonical» может помочь продвижению?  

Этот атрибут устраняет проблемы, связанные с дублирующимся контентом. Устанавливает предпочтительную версию страницы и передает сигналы, такие как ссылки, на эту версию страницы. Объединяет дубликаты контента, которые могут появляться по следующим причинам:

  • HTTP и HTTPS
  • одни и те же материалы в субдомене www и по обычным адресам http
  • параметры и многоаспектная навигация
  • идентификаторы сессий
  • завершающий слэш
  • индекс/страницы по умолчанию
  • версии альтернативной страницы, такие как m. или AMP-страницы или версии для печати

Где прописать атрибут rel=canonical

Большинству веб-мастеров известно, что атрибут добавляется в тег head:

<link rel=»canonical» href=»https://example.com/» />

Но не все знают, что canonical может также отправляться в заголовок HTTP:

HTTP/1.1 200 OK
Link: <https://example.com/>; rel=»canonical»

Атрибут canonical в заголовке может использоваться применительно к любой странице, но самый распространенный случай — для выбора предпочтительной версии PDF.

Мой атрибут canonical не работает

rel=»canonical» — это не директива. Его можно проигнорировать. Каноническая версия — это версия страницы, которая должна присутствовать в файле sitemap, к примеру. На присутствие несовместимых URL в sitemap или внешних ссылках могут указывать разные сигналы. Атрибут canonical может также игнорироваться, если между страницами нет близкого соответствия.

Случаются и другие ошибки, например, когда страницы копируются, а атрибут canonical не изменяется, или остается указатель места заполнения. Также следует использовать абсолютные — не относительные — пути URL, чтобы было меньше ошибок. Поскольку из-за этого, а также из-за автореферентных атрибутов canonical, несколько страниц будут сообщать поисковым системам о том, что данные страницы являются каноническими; в этом нет смысла. Если на странице есть несколько отличающихся атрибутов canonical, Google их проигнорирует. Что делает Google, когда получает противоречивые сигналы? Поисковая система будет пытаться определить лучший URL по разным сигналам: предложенные canonical, внешние ссылки и ссылки в sitemap, но существуют и другие факторы. К примеру, Google может предпочесть короткий URL длинному, выбрать HTTPS, а не HTTP.

Известно, что Google отдает предпочтение HTTPS-страницам в качестве канонических, а не их аналогам HTTP; исключение — случаи, когда присутствуют противоречивые сигналы, согласно справке Search Console:

  • Страница HTTPS имеет недействительный сертификат SSL.
  • Страница HTTPS содержит небезопасные зависимости.
  • Доступ к странице HTTPS запрещен в файле robots.txt, а к странице HTTP – нет.
  • Страница HTTPS выполняет переадресацию на страницу HTTP.
  • Страница HTTPS указывает на страницу HTTP с помощью атрибута rel=»canonical».
  • Страница HTTPS содержит метатег noindex для роботов.

Редкий случай, но все же возможный, когда из-за ошибок в коде раздел заголовка заканчивается прежде, чем это должно быть. При этом canonical может быть в теле контента, где поисковая система его никак не ожидает найти. Еще хуже, когда большинство инструментов (таких как Screaming Frog или Deep Crawl) эту ошибку не фиксируют. Проблему можно установить только с помощью программного интерфейса DOM (объектная модель документа) — например, когда используется Inspect для Chrome Dev Tools

Рассмотрим канонический атрибут в Home Depot на скриншоте ниже. Можно видеть, что раздел заголовка закончился, и часть контента, которая при рассмотрении источника находится в заголовке, попадает в тело, когда рассматривается DOM.

Взаимодействие атрибута canonical с другими

С атрибутом canonical можно легко ошибиться. Допустить, например, грамматическую ошибку, поставить завершающий слэш, в особенности когда есть еще нумерация страниц и hreflang. Если индексируется страница отличная от той, что значится в теге, страницы не будут объединены должным образом. Например, канонический элемент устанавливается на второй странице нумерованного списка для URL первой страницы. Атрибут canonical не следует использовать вместе с noindex.

Другие способы применения canonical

Атрибут canonical можно использовать для альтернативных версий сайта (мобильная и AMP-версия). Для индексации mobile-first не нужно специально менять эти атрибуты.

что это такое, как использовать. Примеры от вебмастера

admin

admin

Атрибут rel=”canonical” и ситуации в которых его следует использовать

Если на сайте много дублей, то чаще всего для решения их используют 301 редирект. Ведь мы знаем, что дублирование страниц — главная проблема в оптимизации сайта. Но есть случае, когда использовать 301 редирект не выгодно или не хочется, тогда и приходит на помощь атрибут rel=”canonical”.

Мы постараемся рассказать все об этом атрибуте, когда лучше всего использовать, чтобы решить проблемы с дублем контента.

Как установить rel=”canonical”?

На странице сайта (основной способ)

Чтобы сделать каноническую ссылку, достаточно просто поставить код ниже в head вашего сайта. Именно, чтобы ссылка была на всех страницах, иначе поисковые системы могут игнорировать это изменение.

<link rel=”canonical” href=”http://site.com/canonical-link.html”/>

Через xml-карту сайта

Также есть возможность установки канонической ссылке прямо в карту сайта. Однако для xml-карт внесли изменения, теперь эти рекомендации игнорируются поисковыми системами.

Через ответ сервера (лучше для не html-документов)

Если у вас появилась необходимость установить канонические ссылки для нестандартного типа документов (не html), к примеру pdf-файлы, то вам нужно поставить каноническую ссылку в заголовке ответа сервера. Чтобы когда поисковая система обращалась к похожему материалу, ей выдавал ответ файл на источник

Link: <http://site.com/main-file.pdf>; rel=”canonical”

Данный вариант работает только для веб поиска, остальное игнорируется Google.

Когда использовать канонические ссылки?

Если вы точно знаете, когда на вашем сайте есть дубликаты

Если вы уверены, что на вашем сайте есть похожие страницы или дубли контента. Об этом вы можете узнать как сами, так и со слов аудитора, который делает анализ вашего сайта. Если у вас есть две одинаковых страниц, вы должны помочь поисковой системе определить какая из них является главной и важной. Чтобы остальные страницы просто имели канонические ссылки на основную.

Когда трудно или невозможно выполнить 301-редирект

Чаще всего делают простой 301 редирект, однако есть случаи, когда реализовать это трудно и долго. Тогда на помощь приходит использование атрибут rel=”canonical”. Если верить рекомендациям Google, то можно узнать, что передача веса идет также как и по обычному 301 редиректу.

Несколько страниц для одного типа продуктов

Если вы владелец интернет магазина, и есть товары, которые расположены в нескольких категориях. Допустим они отличаются только по цвету, поэтому нужно указывать каноникал для всех, кроме основной.

Для разных видов товаров в каталоге

На некоторых сайтах делают сортировку через параметр сортировки в URL сайта: site.com/dresses.html?sort=price тогда и здесь важно будет поставить ссылки на каталог или страницу, где будет сортировка по умолчанию. То есть прямая ссылка без параметров:

<link rel=”canonical” href=”http://site.com/dresses.html” />

При создании страницы каталога со всеми продуктами

Рекомендации Google говорят о том, что вы предоставляете каноническую ссылку на всех страницах сайта каталога со всеми товарами или статьями, тем самым это делает оптимальный индекс страниц каталога. Чтобы подобное не считалось дублем, часто делают кнопку «

посмотреть все» и там на каждой странице ставят каноническую ссылку, в том числе и для пагинации.

Страница печати

Если на сайте есть страница для печати, которая к примеру вызывается дополнительным параметром site.com/news-1.html?print=yes тогда мы ставим каноникал на основную страницу сайта

<link rel=”canonical” href=”http://site.com/news-1.html” />

При использовании партнерской программы на вашем сайте

Если вы используете партнерскую программу или реферальную систему на сайте, тогда канонические ссылки будут очень важны вам. Если это проигнорировать, тогда в индексе появится сотни тысяч ваших дублей страниц, так как поисковые системы будут обходить все страницы без исключения. Например у вас ссылка site.com/dresses.html?partner=dkfEi3dj1 тогда вам нужно прописать на всех страницах сайта

<link rel=”canonical” href=”http://site.com/dresses.html” />

Также вы можете сообщить Google о всех параметрах, которые не стоит индексировать с помощью параметров URL (в разделе «Сканирование», сервиса Google Webmasters). В этом случае вы должны отметить партнерский параметр, чтобы он не менял содержимое страницы.

Для склейки файла индекса каталога

Часто, чтобы не дублировался каталог index.html, ведь на многих сайтах категория site.com/katagory/ доступна по адресу site.com/katagory/index.html . Тогда подобное решается тем, что на дополнительных страницах index.html, поставляется каноническая ссылка

<link rel=”canonical” href=”http://site.com/katagory/” />

При использовании одинакового контента на разных доменах или различных языковых версиях

Если ваш сайт поддерживает несколько языковых версий одного и того же контента, тогда тоже нужно использовать rel=”canonical” в главной версии контента.

Главные ошибки при использовании rel=”canonical”

Использовать на странице пагинации

Частая ошибка в том, что для некоторых страниц пагинации прописывают только одну серию, то есть первая каноническая страница. Это вызывает ошибку и мешает индексировать остальные страницы.

Каноническая ссылка не индексируется

Когда вы проставляете ссылку на другую страницу своего сайта, нужно учитывать, что она должна быть открыта для индекса. То есть ответ сервера должен быть 200, а также на странице не должны быть тегов для запрета индексации (через мета-тег robots и noindex)

Несколько ссылок rel=”canonical” со страницы

Для одной страницы, должна быть только одна каноническая ссылка, если будет больше — то это нарушение структуры. Проверяйтесь наличие кода, учитываться поисковыми системами будет только первая.

Разные канонические URL-адреса

У вас должна быть одна и также каноническая ссылка для двух разных вариантов, если например вы используете xml-карту сайта или через rel=”canonical” на самой странице.

Неправильное использование относительных ссылок

Всегда для подобного атрибута нужно указывать абсолютные ссылки

<link rel=”canonical” href=”http://site.com/dresses.html” />

если вы будете использовать относительные ссылки, тогда поисковики могут получить ошибку страницы

<link rel=”canonical” href=”site.com/dresses.html” />

Тогда поисковые системы просто проигнорируют эти инструкции.

все об атрибуте rel=canonical — CMS Magazine

Прошло более четырех лет (с февраля 2009) с тех пор, как Google и Yahoo объявили о поддержке атрибута rel=canonical, но эта строка HTML-кода по-прежнему приводит в замешательство многих оптимизаторов и веб-мастеров. Недавно компания Google опубликовала обзор 5 типичных ошибок при работе с атрибутом rel=canonical. Это содержательная и простая для понимания статья, но, к сожалению, в ней нет ответов на многие вопросы, которые каждый день появляются в нашем разделе Q&A. Поэтому я подумал, что пора разобраться с некоторыми часто задаваемыми вопросами (и, пожалуйста, простите за глупую шутку)….   

Что такое rel=canonical?

Попросту говоря, тег rel=canonical — это способ сообщить Google об эквивалентности двух URL, в целях оптимизации поиска. Как правило, URL (B) является копией URL (A), и канонический тег указывает на (A) как на каноническую страницу. На странице с URL (B) в блоке <head></head> будет отображаться следующий код:

Справка Google о rel=canonical довольно подробно всё это описывает. Дублированный контент — весьма непростая тема, и ранее я подробно разбирал её. Сегодня я хочу продолжить обсуждение, предполагая, что мои читатели владеют практическими знаниями технического SEO и уже пробовали использовать атрибут rel=canonical на своем сайте.

Обратите внимание: тег rel=canonical часто называют «rel-canonical» или «каноническим тегом». В этой статье я постараюсь придерживаться написания «rel=canonical».

Надо ли использовать rel=сanonical для ряда пронумерованных страниц?

Я не собираюсь повторять справку Google, но этот вопрос задают так часто, что он заслуживает более развёрнутого ответа. Допустим, у вас есть ряд пронумерованных страниц с результатами поиска (1,2,3…n). С точки зрения информативности они могут показаться бедными, так должна ли страница n ссылаться на страницу 1 как на каноническую?

Официальный ответ — нет, Google не рекомендует этого делать. В компании рекомендуют указывать в качестве канонической страницу с полным перечнем (если на сайте есть такая страница, где отображены сразу все результаты) либо прописывать тег rel=prev/next. Rel=canonical можно использовать вместе с rel=prev/next для организации выборочного поиска, фильтров и т.д., но в последнем случае процедура заметно усложнится.

С точки зрения SEO разбивка на страницы — очень сложный вопрос. Рекомендую вам изучить следующие статьи:

Могу ли я делать связку rel=canonical между доменами?

Да, в конце 2009 Google объявил о поддержке кросс-доменной канонизации. Эта ситуация типична для партнёрских сайтов, когда разработчики стремятся избежать дублирования контента и хотят, чтобы только одна версия материала участвовала в ранжировании.

Стоит ли связывать тегом rel=canonical страницы на разных доменах?

Этот вопрос будет посложнее. Во-первых, Google может проигнорировать кросс-доменную канонизацию, если материал на страницах не будет совпадать, или в самом факте использования тега система усмотрит манипуляцию результатами поиска. Идеальные условия для связывания каноническим тегом разных доменов — это ситуация, при которой разные сайты одного владельца публикуют один и тот же контент, причём он оказывается полезен для посетителей всех ресурсов. В этом случае, вы, скорее всего, не захотите использовать 301-редирект (это может запутать пользователей и навредить отдельным брендам), но, вероятно, захотите избежать проблем с дублированием контента и самостоятельно решать, какой именно сайт попадёт в поисковую выдачу. Я бы не стал связывать тегом rel=canonical страницы на разных доменах только для того, чтобы консолидировать PageRank.

Необходим сайт, мобильное приложение, услуги по SEO или контекстной рекламе? Тендерная площадка WORKSPACE поможет выбрать оптимального исполнителя. База проекта насчитывает более 10 500 агентств. Сервис БЕСПЛАТЕН для заказчиков.

Следует ли использовать rel=canonical для близких по содержанию страниц?

Как показал мой «катастрофический» эксперимент по канонизации и последующие опыты, в некоторых случаях Google одобряет использование атрибута rel=canonical для страниц с разным контентом. Но это не значит, что это хорошая идея. В целом, я считаю, что лучше приберечь rel=canonical для идентичных страниц или страниц с очень близким содержанием. Например, если продукт имеет несколько страниц, которые различаются лишь цветом, парой предложений и изображениями, я считаю, что использование rel=canonical для указания на родительскую страницу будет вполне уместно.

Не используйте rel=canonical там, где должны быть 301-редирект и/или 404 ошибка. Разумеется, ничего страшного не произойдёт, но я подозреваю, что Google проигнорирует канонические теги, и вы полностью потеряете контроль над тем, как индексируется ваш дублированный контент.

Могу ли я использовать rel=canonical на канонической странице?

Другими словами, можно ли добавлять на каноническую страницу тег rel=canonical, указывающий сам на себя? С практической точки зрения — да, но делать это вовсе необязательно. Ранее считалось, что и Google, и Bing не одобряют злоупотребление атрибутом. Однако, кажется, со временем их позиция стала менее жёсткой, и за последнее время я не помню ни одного случая, когда бы корректное использованние тега на самой канонической странице принесло сайту какой-либо вред.

Зачастую все проблемы сводятся к реализации решения — многие страницы имеют один и тот же шаблон, и необходимость вставлять код только на дочерние страницы, минуя родительскую, может стать причиной путаницы и ошибок. Я думаю, что поисковые системы осознали реалии, с которыми сталкивается большинство веб-мастеров, и откорректировали свою первоначальную «консервативную» позицию в соответствии с ними.

Можно ли использовать rel=canonical для всего сайта?

Следует ли добавлять тег rel=canonical на все страницы сайта — даже если многие из них не содержат дублированного контента? Думаю, это спорный вопрос. Специалисты Moz рекомендовали такой подход в прошлом, и я считаю его вполне безопасным. Но меня беспокоит, что злоупотребление тегом rel=canonical может вызвать недоверие или привести к игнорированию тега поисковыми системами, но я не могу привести никаких доказательств в защиту этой точки зрения. Кроме того, меня беспокоит тот факт, что зачастую атрибут rel=canonical используется неумело, и в масштабе целого сайта это приводит к тому, что канонический тег указывает не на те страницы.

Я убеждён, что присвоение атрибута rel=canonical по умолчанию домашней странице вполне оправдано, поскольку для домашних страниц характерно разнообразие URL-адресов. В идеале я бы рекомендовал прописать rel=canonical на домашних страницах, известных дубликатах и всех страницах, где вероятно появление дублированного контента, а все остальные оставить в покое. Однако реализовать это зачастую очень сложно. В некоторых случаях использование rel=canonical на всем сайте более оправдано; это лучше, чем полностью потерять контроль над индексацией ресурса.

Что мне использовать: rel=canonical или 301-редирект?

Вам надо понять, что, хотя эти подходы могут иметь сходное действие, с точки зрения SEO они не являются взаимозаменяемыми. Принципиальное отличие состоит в следующем: 301-редирект перенаправляет посетителя на канонический URL, а rel=canonical никого никуда не перенаправляет. Как правило, только одно решение может считаться правильным с точки зрения удобства для посетителей. Если вы хотите навсегда объединить две страницы и избавиться от дублированного контента — используйте 301-редирект. Если вы хотите, чтобы обе страницы были доступны для посетителей, но только одна из них была представлена в результатах поиска — используйте rel=canonical.

Передаётли rel=canonical PageRank ивессайта?

Это сложно измерить, но если вы правильно используете rel=canonical, и Google засчитывает его, то он работает так же, как 301-редирект. Мы предполагаем, что он передаёт PageRank и вес, полученные за ссылки на неканонические страницы с небольшими потерями (как и в случае c 301-редиректом).

Могу ли я связать несколько канонических страниц (вместе с 301, 302 и т.д.)?

Что происходит, если одна каноническая страница указывает на другую как на каноническую, или дочерняя страница указывает как на каноническую на страницу, с которой осуществляется 301-редирект? Ситуация непростая. В некоторых случаях такое решение может работать, и, возможно, будет даже передаваться Page Rank. Хотя, в целом, это плохая идея. В лучшем случае, это посчитают небрежностью. В худшем — решение не будет работать, или значительная часть Page Rank потеряется где-то внутри цепи. По возможности избегайте таких цепочек и применяйте rel=canonical в пределах одного шага.

Индексируются ли неканонические страницы?

Нет, и на то есть все причины. Если Google засчитывает тег rel=canonical, то неканоническая страница не ранжируется. У неё не будет уникальной кэшированной копии, и она не появится в результатах поиска. Сохраняет ли Google записи о неканонических URL-адресах? Допускаю, что да. Однако продвижение неканонических страниц в поисковых системах не имеет никакого смысла.

Может ли кто-то другой назначать мои страницы каноническими?

Мне приходилось сталкиваться с беспокойством по поводу того, что кто-то может использовать канонизацию, особенно кросс-доменную, чтобы навредить сайту или присвоить его вес. Помните, что вы можете принимать канонизацию только от тех страниц, которые контролируете. Вы, конечно, можете назначить для всех своих страниц страницу-родителя, принадлежащую другому человеку, но кому это нужно? Чтобы добиться каких-то реальных целей, злоумышленникам придётся взломать ваш сайт. Если это произойдёт, то теги rel=canonical — это последнее, о чём надо думать. Основной вред от использования rel=canonical связан с действиями самих веб-мастеров.

Могу ли я приготовить омлет, не разбив яиц?

Нет. Знаю, вы надеялись услышать другой ответ. Как минимум треть вопросов о rel=canonical сводится к следующему: «Я хочу, чтобы все мои страницы ранжировались, и да — они одинаковые, но я не хочу никаких проблем с дублированным контентом!» Я не знаю никаких секретных способов как этого добиться.

Вы не обязаны использовать rel=canonical, но, как показывает опыт, лучше самостоятельно решить все вопросы с дублированным контентом на своём сайте, иначе это сделает Google, а они это сделают, поверьте мне. Раньше это привело бы к тому, что забракованная страница просто выпала из результатов поиска. Теперь, после 25 обновлений Panda, в результате ошибки может пострадать весь сайт. Выберите что-то одно: либо избавьтесь от дублированного контента, либо оформите его правильно, либо переработайте его.

Статья переведена и опубликована с разрешения компании Moz. Компания Moz не является партнером данного сайта. Мнение автора данного материала может не совпадать с мнением компании Moz.

Оригинал: http://moz.com/blog/rel-confused-answers-to-your-rel-canonical-questions

Иллюстрация: http://bit.ly/1zeX3Ql

Rel=»canonical» — Правильная пагинация WordPress

Атрибут rel=»canonical» в WordPress.

Содержание статьи

Приветствую дорогие друзья! Сегодняшняя статья, будет немного не обычная. Я не часто на этом блоге пишу статьи со своими рассуждениями и убеждениями. Этой статьей я восполню недостающую часть нашего с вами взаимодействия

smilesmile . Подтолкнул меня на эту статью, один, достаточно продуктивный диалог, на одном из форумов для вебмастеров. Если в пару словах, мы с одним из «старожил» форума, начали беседу на счет «правильного» атрибута rel=»canonical». Суть была в том, что у нас с ним разные убеждения о том, как правильно этот атрибут использовать.

В этой статье, я постараюсь максимально четко, с пояснениями, объяснить, почему я выбрал свой метод. А после, вы уже сами определитесь, какой именно метод вам по душе. Напомню, цель статьи не выяснить кто прав, а кто нет. Цель – предоставить вам 2 абсолютно разных подхода в применении одного и того же атрибута, на выбор. А дальше, решать уже вам, по какому пути идти.

Итак, начну с самого начала. Если вы попали на эту статью, значит скорее всего, вы уже знаете что такое canonical. Для тех, кто ещё не в курсе объясню своими словами.

Canonical – Каноническая ссылка страницы, которая указывает на главную страницу каталога, при частичном и полном дублировании контента. А вот такое определение от Яндекса:

На вашем сайте могут присутствовать страницы с разными URL, но с очень похожим (или одинаковым) содержанием. Например, одна и та же страница сайта может быть доступна по двум адресам.

С помощью атрибута rel=»canonical» вы можете указать, какая страница является «канонической» – предпочтительной для индексации и появления в результатах поиска. Если Яндекс будет знать о том, что содержание страниц одинаково, он проиндексирует и добавит в результаты поиска только одну из них, выбранную владельцем сайта.

Источник: Яндекс блог.

Ну что? Теперь немного понятнее? Надеюсь да. Но это не суть вопроса, это просто для того, чтобы вы смогли понять дальше мою мысль. Пока просто запомните.

Обратите внимание! Яндекс обновил свой поисковый алгоритм и теперь, данный способ для этого поисковика не работает. Работает только для Google. Как решить данную проблему читайте в статье про уникализацию страниц пагинации на сайте.

 

Пагинация в Yoast SEO – Баг или Нет?

Началось всё с того, что в том обсуждении, мы разбирали какой seo плагин для WordPress лучше. Так вот, походу этого разговора, я упомянул, что в плагине Yoast есть некий «баг» в пагинации. Который решается с помощью специального скрипта. «Баг» в том, что на всех страницах пагинации блога …/blog/page/2/ и …/page/3/ и т.д. выводится атрибут rel=»canonical» на ту же самую страницу. Что в свою очередь генерирует частичные дубли имеющихся на блоге статей, а так же, полные дубли метатегов title и description. А вы наверняка уже знаете, что это очень не хорошо в плане сео оптимизации сайта.

Что я имею ввиду? Установите на свой сайт WordPress плагин Yoast SEO, а затем, перейдите на любую страницу пагинации и посмотрите код страницы (какой там атрибут каноникал). Наверняка адрес той же страницы, не так ли? С точки зрения «правильного» использования этого атрибута, всё как надо. Но! Если это правильный способ, то почему тогда появляются дубли метатегов? Оплошность разработчиков? Если так, то где гарантия, что атрибут на эту же страницу не является оплошностью? Короче пока не понятно где правда.

Как советует использовать canonical, Платон (поддержка Яндекса). Речь идет о страницах пагинации на сайте:

Если на такие страницы нет трафика из поисковых систем и их контент во многом идентичен, то советую настраивать атрибут rel=»canonical» тега <link> на подобных страницах и делать страницы второй, третьей и дальнейшей нумерации неканоническими, а в качестве канонического (главного) адреса указывать первую страницу каталога, только она будет участвовать в результатах поиска.

Например, страница сайт.рф/ромашки/1 – каноническая, с неё начинается каталог, а страницы вида сайт.рф/ромашки/2 и сайт.рф/ромашки/3 – неканонические, в поиск их можно не включать. Это не только предотвратит возможное дублирование контента, но и позволит указать роботу, какая именно страница должна находиться в выдаче по запросам.

Источник: блог Платона.

Давайте теперь разберем как это относиться к WordPress блогу.

 

Где появляются дубли в WP?

Хоть в первоисточнике берется в пример магазин, суть от этого не меняется. Чтобы лучше это понять, просто замените понятие каталог на архив, а товары на статьи. Всё то же самое! Итак, что такое лента на блоге? Это по сути (в большинстве случаев) отрывки из статей. То есть, ничего нового. И лента – это просто список этих отрывков с ссылками на полные статьи. А чем являются отрывки? Правильно, частичными дублями статей.

Плюс к этому, WordPress генерирует на основе главной страницы блога другие страницы для пагинации. Это в том случае, когда у вас настроена обычная пагинация, а не бесконечная подгрузка статей в ленте. Так вот, раз он генерирует страницы на основе главной, то и все метатеги он просто копирует, как и остальную стилистику страницы, меняется только контент. И если эту проблему не решить, то вебмастера Яндекса и Гугла начинают ругаться на большое количество ошибок (дубли title и description). А если от них не избавиться, то велика вероятность, что ваш сайт «упадет» в выдачи.

 

Как я избавился от дублей в пагинации.

Исходя из выше сказанного, я предлагаю избавляться от дублей страниц установкой атрибута rel=»canonical» на главную страницу блога (как советует Платон). В этом случае, поисковик видит подсказку, что главная страница является приоритетной и показывает её в результатах поиска, даже тогда, когда по запросу пользователя выдается информация, скажем с 4 страницы.

Вы можете сказать – Так пользователь в таком случае, не попадет на нужную страницу пагинации, а значит не получит ответ который искал! А теперь подумайте, что если после последнего индексирования роботом, у вас на блоге появились ещё статьи? Правильно! В ленте блога они добавятся, а нужная статья (которую искал пользователь) передвинется на следующую страницу пагинации. В таком случае опять пользователь не попадет на нужную страницу, ведь он перешел на страницу с поиска. Но она то уже поменялась, а поисковик ещё не успел её обновить.

Теперь подумайте, где будет проще посетителю найти нужную информацию? На главной странице блога или где-нибудь с середины пагинации (скажем, с 3 – 4 страницы)? Лично я думаю, что проще будет начать поиск именно с главной, так я буду уверен, что не пропущу то, что я ищу. Что, собственно, я и делаю, перенаправляя пользователя на главную блога с помощью rel=»canonical».

Диалог с коллегой на форуме.

Если вернемся к моему диалогу с коллегой, то он считает такой подход не правильным. Аргументами этому являются как минимум две вещи:

  1. Это не соответствует общему понятию значения данного атрибута. То есть, в каком-то смысле это не правильное использование. Но опять же, раз Платон рекомендует, значит этот способ имеет право на существование, как минимум. С другой стороны, Гугл немного по другому рекомендует пользоваться этим атрибутом. А точнее, практически никак. Здесь остается только додумывать самому как правильно.
  2. И второй аргумент – это возможная «потеря» трафика. Если опять вернуться к посту Платона, то там написано чётко про то, что если показать атрибутом роботу на нужную страницу, то весь трафик, который будет принадлежать страницам пагинации будет перенаправлен на главную страницу. То есть, потери трафика не будет!

В добавок ко второму пункту дополню. Я не раз замечал, что поисковики сами подставляют title и description по своему усмотрению. Так вот, даже если страница пагинации покажется в поиске по своему запросу, но с помощью атрибута будет перенаправляться на страницу блога, поисковик сам подставит нужные метатеги и направит пользователя на главную блога по этим тегам. Даже если по умолчанию на этой главной будут другие метатеги прописаны. Думаю мысль ясна.

 

А как тогда будет индексироваться сайт?

Возможно у вас возник уже такой вопрос. А я вам отвечу – Вполне нормально! Атрибут rel=»canonical» не запрещает для индексинования роботами страницы. Он лишь указывает поисковикам, какая страница является предпочтительнее. Этот атрибут не является правилом, он является просто сигналом (указателем) на нужную вам страницу, не более.

К тому же, сайт индексируется через архивы, а лента сделана скорее для удобства пользователей, нежели для поисковиков. Поэтому в любом случае, все ваши статьи будут благополучно проиндексированы. А вот как раз кусочки статей, что находятся в ленте – нет (если вы воспользуетесь моим методом). Этим самым, вы избавитесь от частичного дублирования контента внутри сайта и от дублирования метатегов.

Мой коллега же, рекомендует оставить всё как есть, но для избавления дублей метатегов, через специальное условие добавлять в тайтлы и дескрипшены номера страниц пагинации. Выглядеть это будет например, следующим образом: «Блог о WordPress | страница 2», «Блог о WordPress | страница 3» и так далее. То есть, уникальностью тут совсем не пахнет. А что делать в таком случае с дублирующим дескрипшеном, вообще не понятно. Но, вариант был предложен, значит я должен был его огласить. Более подробнее о нашей беседе, вы можете почитать на форуме в соответствующей теме. Прочитайте, будет полезно.

 

Так, какой же вариант правильный?

На самом деле, я не считаю какой-то из вариантов правильнее другого. В сео всегда было и будет две стороны медали. Даже если предположить, что мой вариант не правильный, всё равно я придерживаюсь мнения, что он логичнее. Я постарался подробно объяснить, почему я так считаю. А выбирать способ именно вам. Я лишь дал идею для раздумий.

И всё же, если вы увидели хотя бы долю мысли правильной то советую поставить тег rel=»canonical» на главную страницу блога со всех страниц пагинации и развивайте свой проект без ошибок в вебмастерах Гугла и Яндекса. Скрипт вы можете взять в статье Правильная настройка Yoast SEO. Там в конце статьи, я оставил этот магический скрипт.

На этом у меня пожалуй всё. Мне нужно было высказаться. Если и у вас есть что сказать, не держите это в себе, напишите в комментариях. Там даже регистрироваться не нужно. С радостью пообщаюсь на эту тему, так как вопрос остается острым и любое мнение может в какой-то мере прояснить ситуацию. В общем, не стесняйтесь, пишите. А я не прощаюсь с вами, увидимся на страницах блога. Не забудьте оценить статью в звездочном рейтинге.

Очень полезное видео с базовыми рекомендациями. Время просмотра: ~23 минуты. Можно развернуть видео на весь экран.

Атрибут rel= «canonical» — полное руководство по использованию канонических ссылок ~ Страницы Интернета

На данный момент, устранение проблемы дублированных страниц является одной из самых важных при оптимизации сайта. В большинстве случаев для решения этой проблемы лучше всего использовать 301 редирект.

Но, когда мы или не можем использовать 301 редирект, или нам необходимы страницы для просмотра пользователями, то нам на помощь приходит атрибут rel= «canonical».

С помощью этого атрибута можно довольно быстро устранить проблемы дублирующего контента.

Как прописать rel= «canonical»?

На странице сайта (основной способ)

Чтобы для текущей страницы указать ее каноническую ссылку, то в секции <head> нужно прописать следующее:

<link rel="canonical" href="http://site.com/canonical-link.html"/>

Очень важно прописать именно в секции HEAD, так как если вы случайно пропишите данный атрибут не в этой секции, то данная инструкция будет проигнорированная поисковыми системами.

Через xml-карту сайта

Для каждой страницы в xml-карте сайта вы можете прописать её каноническую ссылку. Но, в данном случае, поисковые системы могут проигнорировать данные рекомендации.

Через ответ сервера (лучше всего для не html документов)

Если вам нужно указать канонические ссылки для не html документов, а, например, для pdf-файлов, то можно указать каноническую ссылку в http-заголовке. Для этого, сервер при запросе дублирующего файла должен отдавать следующее

Link: <http://site.com/main-file.pdf>; rel="canonical".

Но, следуют учесть, что на данный момент Google поддерживает данный элемент заголовка <link> только для Веб-поиска.

Когда нужно использовать канонические ссылки

Если вы точно знаете в каком случае у вас на сайте появляются дубли

Если вы четко понимаете причину возникновения похожих или очень схожих страниц у вас на сайте и, при этом, каждая такая страница должна существовать на сайте, то желательно определиться какая из этих страниц серии является основной и со всех других страниц проставить канонические ссылки на эту одну главную.

Когда сложно или невозможно реализовать 301 редирект

В общем лучше всего использовать 301 редирект, но если это довольно сложно или долго реализовывать, то можно воспользоваться и атрибутом rel=”canonical”. По заявлениям Google, передаваем вес через канонические ссылки абсолютно идентичный весу, который передает 301 редирект.

Несколько страниц для одной серии продуктов

Если у вас в интернет магазине есть серия товаров, которая отличается, например, только цветом, то лучше выбрать один товар в качестве главного (типичного) и на него проставить канонические ссылки с других продуктов.

При разных сортировках товаров в каталоге

Если на вашем сайте товары можно сортировать разными способами и параметр сортировки указывается в урле:

http://site.com/dresses.html?sort=price

то, необходимо, со всех различных комбинаций сортировок, проставлять канонические ссылки на каталог с сортировкой по умолчанию. Обычно, это URL категории без параметров, которые отвечают за сортировку товаров:

<link rel="canonical" href="http://site.com/dresses.html" />

При создании страницы каталога со всеми продуктами

По рекомендациям Google (https://support.google.com/webmasters/answer/1663744?hl=ru), способ при котором вы со всех страниц каталога вы делаете каноническую ссылку на страницу со всеми товарами/статьями, является оптимальным для индексации как страниц каталога сайта, так и всех товаров/статей сайта. При этом способе, для каждого раздела сайта необходимо создать страницу «Смотреть всё» и с каждой страницы пагинации проставить каноническую ссылку на страницу «Смотреть всё».

Но, это способ довольно сложный в реализации. Поэтому, другие реализации пагинации вы сможете найти по этой ссылке:
https://seoprofy.ua/blog/optimizaciya-sajtov/pagination-for-seo

Страница печати

Если печать страниц на сайте реализована через дополнительный параметр, например,

http://site.com/news-1.html?print=yes

то, необходимо, проставить каноническую ссылку на основную версию страницы

<link rel="canonical" href="http://site.com/news-1.html" />

При использовании партнерской программы у вас на сайте

Если на вашем сайте есть партнерская система или любая другая реферальная система, то тут очень важно не забывать прописывать канонические ссылки для всех страниц на которые могут стоять партнерские ссылки. Если забыть проставить, то очень быстро могут появится в индексе поисковых страниц десятки, а то и сотни дублей страниц сайта, так как по внешним ссылкам поисковые роботы довольно быстро проиндексируют не нужные страницы.

Поэтому, для всех страниц на которые стоят партнерские ссылки

http://site.com/dresses.html?partner=dkfEi3dj1

мы прописываем следующую инструкцию:

<link rel="canonical" href="http://site.com/dresses.html" />

Кроме этого, вы можете указать Google все не нужные параметры для индексации через Параметры URL (в  Google Webmasters раздел Сканирование). В данном случаем необходимо указать параметр partner, как такой, что не изменяет содержимое страницы.

Для склейки индексного файла каталога

Важно проверять, чтобы файлы в каталоге типа index.html не приводили к дублям: это может произойти, когда открыты для индексации 2 таких адреса http://site.com/dresses/ и http://site.com/dresses/index.html. В таких случаях, для решения данной проблемы, легче всего в файле http://site.com/dresses/index.html прописать такую каноническую ссылку

<link rel="canonical" href="http://site.com/dresses/" />

При использовании одинакового контента на разных доменах или разных языковых версиях

Когда вы создаете похожие сайты или делаете разные языковые версии вашего контента, но при этом на разных сайтах/языковых версиях используете один и тот же контент, то в таком случае необходимо применение rel=”canonical” на основную версию контента.

Основные ошибки при использовании rel=”canonical”

Использование на страницах пагинации

Очень часто при пагинации или при какой-то серии страниц на сайте для всех страниц такой серии прописывают канонической первую страницу. Это неправильно, так как делает не возможным индексацию все страниц серии.

Каноническая ссылка не является индексируемой

Если мы проставляем каноническую ссылку на другую страницу, то должны убедиться, что данная страница является индексируемой:

  • страница отдает 200 код сервера
  • на странице нет запрета индексации (через мета тег robots и noindex)

Несколько ссылок rel=canonical с одной страницы

Для одной страницы должна быть одна каноническая страница. Если указанно несколько страниц, то в таком случае будет учтена только первая инструкция.

Разные канонические URL

Следите за тем, чтобы всегда указывать одни и те же канонические страницы при разной реализации (например, через xml-карту сайта и через rel=”canonical” на самой странице).

Неправильное использование относительных ссылок

В общем случае, при указании канонических ссылок всегда желательно прописывать абсолютные ссылки

<link rel="canonical" href="http://site.com/dresses.html" />

так как при указании с помощью относительных ссылок появляется очень большая вероятность сделать ошибку:

<link rel="canonical" href="site.com/dresses.html" />

Тогда поисковые системы будут просто игнорировать данные инструкции.

Проверка использование rel=»canonical» на своем сайте

После того, как вы настроили все канонические ссылки у себя на сайте, то желательно сделать проверку всего сайта на то, как будут видеть эти все инструкции поисковые роботы. Для этого лучше всего воспользоваться программой Screaming Frog SEO Spider.

После индексации вашего сайта эта программа в удобном для вас виде предоставит вам полную информацию по всем страницам

  • на которых стоит атрибут rel=”canonical” и на какие именно страницы он указывает
  • на какие страницы сайта проставлены канонические ссылки
  • какие страницы без атрибута rel=”canonical”

Вся эта информация будет на вкладке Directives

Следует не забыть провести некоторые дополнительные настройки:

1. Убедиться, что на вкладке Basic выставлена галочка напротив Crawl Canonical

В этом случае, при работе программы, все указанные канонические ссылки на страницах сайта, будут просканированные роботом. Это позволит нам выявить ошибки (например, ссылки на страницы с 404 ответом сервера).

2. На вкладке Advanced установлена галочка напротив Respect Canonical

В этом случае, из общего отчета страниц будут исключены все канонизированные страницы. Данную опцию лучше всего выбирать на финальном этапе проверки, чтобы исключить все канонизированные страницы и получить финальный список индексируемых страниц.

В заключение

Использование атрибута rel= «canonical» может сэкономить очень много времени на этапе разработки. Но такие решения в итоговом варианте могут привести к проблемам, если не учесть все нюансы использования.

Поэтому, очень важно после финального релиза сайта, внимательно проверить все случаи использования канонических ссылок и чтобы все важные страницы сайты были доступны для индексации.

Хорошие статьи в продолжение:

Атрибут rel=»canonical» и его применение в SEO

На сайте по разным причинам может появиться дублированный контент. Без дополнительной информации поисковая система при этом сама решает какой контент ранжировать выше, а какой ниже. В ряде случае поисковая система может ранжировать выше старый и моральной устаревший контент, потому что выбирает неправильный документ в качестве канонического.

Как указать каноническую страницу

Каноническую страницу легко указать поисковым системам в заголовке страницы, а именно в разделе head документа. Для этого нужно поместить следующий HTML код в head раздел каждого документа, являющегося неканоническим:

<link rel=»canonical» href=»URL канонической страницы»>

Если у Вас есть доступ к HTTP заголовкам, например, через htaccess или PHP, то Вы можете установить канонический URL для файлов, которые не имеют HTML кода, в частности, для PDF, DOC. Для этого используйте код:

Link: <URL канонической страницы>; rel=»canonical»

Случаи, когда rel=»canonical» не работает

Атрибут rel=»canonical» используется поисковыми системами, как подсказка со стороны вебмастеров, какая страница является основной. В тоже время данный атрибут может отработать некорректно. Например, в следующих случаях:

  • Если указать URL канонической страницы страницу отдающую 404 код, то поисковая система будет искать другой актуальный адрес.
  • При взломе сайта Google и Яндекс могут посчитать, что злоумышленники поставили фальшивые канонические адреса и в таком случае также их не учитывать.
  • Если Вы разместили конструкцию <link rel=»canonical» href=»URL канонической страницы»> внутри тега BODY или в заголовке head при отсутствии закрывающего тега </head>.

Случаи, когда rel=»canonical» можно применять

Как я писал выше, Вы должны использовать rel=»canonical» на страницах, которые являются дубликатами или очень похожими на основную (каноническую). Если у вас есть две похожие страницы, но не идентичные, порой имеет смысл изменить одну из них, чем делать канонической.

Важное, правило: канонической страницей нужно делать только ту страницу, которая находится сейчас в индексе. То есть нельзя использовать для этих целей страницу, которая была исключена из индекса, например, с помощью Robots или мета-тега Noindex или по другим причинам.

Правильное применение rel=»canonical» будет в следующих случаях:

  • Сайты с динамическими URL. Можно использовать данный атрибут для определения предпочтительного URL.
  • В коммерческих сайтах, в первую очередь интернет-магазинах, когда клиенты меняют порядок сортировки, важно чтобы получившийся при этом url не был проиндексирован.
  • При публикации синдицированного контента или дублированного внутри сайта на разных страницах. Важно с помощью rel=»canonical» правильно указать первоисточник.

Когда применять rel=»canonical» не стоит

  • Самая главная ошибка, когда используют данный атрибут при смене URL структуры сайта. На старых документах ставят rel=»canonical» на новые. А это неправильный подход. В таких случаях единственно правильным решением будет использование 301 редиректа.
  • Второй по важности ошибкой является неправильное использование данного атрибута на страницах пагинации. Например, многие указывают rel=»canonical» на страницах пагинации на главную страницу сайта, что является ошибкой. В таком случае оптимальным вариантом использование rel=prev/next.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *