Canonical тег: Канонические теги: простое руководство для начинающих

Содержание

Канонические теги: простое руководство для начинающих

Хотите узнать, что собой представляют теги каноничности, и как можно их использовать, чтобы избежать кошмарных проблем с дублированием контента? 

Теги каноничности не являются чем-то абсолютно новым. Они существуют с 2009 г. — большую половину десятилетия.

Объединенные усилия к их созданию приложили компании Google, Microsoft и Yahoo. Зачем это было сделано? Чтобы предоставить владельцам сайтов способ быстрого и простого устранения проблем, связанных с дублированием контента.

И эти теги работают? Да, идеально… но только если вы знаете, как ими пользоваться!

Из этого руководства вы узнаете:

Что собой представляет тег каноничности?

Тег каноничности (rel=“canonical”) — это фрагмент кода HTML, который определяет основную версию для страниц с одинаковым, практически идентичным и очень похожим содержимым. Другими словами, если у вас есть одинаковый или похожий контент под разными адресами, вы можете использовать теги каноничности, чтобы указать, какая версия является основной, и которую, следовательно, нужно индексировать.

Как выглядит тег каноничности?

Теги каноничности имеют простой и понятный синтаксис, они размещаются в секции <head> веб-страницы:

<link rel=“canonical” href=“https://example.com/sample-page/” />

Вот что каждая часть этого кода значит на понятном нам языке:

  1. link rel=“canonical”: ссылка в этом теге — это основная (каноническая) версия данной страницы.
  2. href=“https://example.com/sample-page/”: каноническую версию можно найти по этому URL-адресу.

Google не любит дублирующийся контент. Из-за него поисковику сложнее решить:

  1. Какую версию страницы следует индексировать (индексироваться будет только одна из них!).
  2. Какую версию страницы нужно использовать при ранжировании по релевантным запросам.
  3. Нужно ли сосредоточить «ссылочный вес» на одной странице или необходимо разделить его между несколькими версиями.

Слишком большой объем дублирующегося контента может плохо сказаться на вашем «краулинговом бюджете». Это значит, что Google может потратить определенное время на сканирование («краулинг») множества версий одной страницы вместо того, чтобы находить важный контент на вашем сайте.

Вся правда о краулинговом бюджете

Нежелательное расходование времени поисковиком Google на сканирование дублирующегося контента — это, безусловно, то, чего следует всячески избегать. Хотя Google и заявляет, что для большинства сайтов это не является проблемой.

 Если новые страницы обычно сканируются в день своей публикации, тогда краулинговый бюджет — это не то, на чем стоит сосредотачиваться администраторам. Аналогично, если сайт содержит меньше нескольких тысяч адресов, то, как правило, сканироваться он будет достаточно эффективно. 

 

Теги каноничности устраняют все эти проблемы. Они дают возможность сообщить Google, какую именно версию страницы поисковику следует индексировать и ранжировать, и где следует сосредоточить «ссылочный вес».

Если не указать канонический адрес, Google возьмет это дело в свои руки.

 Если вы не укажете канонический адрес, мы сами определим, какая из версий или адрес является, по нашему мнению, лучшим вариантом. 

Полагаться в этом на Google — не самая лучшая идея. Поисковик может выбрать ту версию страницу, которую вы не хотели бы делать канонической.

ВАЖНОЕ ЗАМЕЧАНИЕ

Google заявляет, что поисковая система обычно, но не всегда, признает указанный канонический адрес. Это потому, что теги каноничности считаются подсказками, а не указаниями. До тех пор, пока они признаются, любые сигналы — такие как ссылки — должны сосредотачиваться на канонической странице.

Оптимальные методы использования тегов каноничности также помогают снизить риск того, что Google сочтет канонической нежелательную версию страницы.

Но у меня ведь нет дублирующегося контента, так ведь?

Допуская, что вы не публикуете одни и те же записи и страницы несколько раз, легко предположить, что на вашем сайте нет дублирующегося контента.

Но поисковые машины сканируют URL-адреса, а не страницы.

Это значит, что для них example.com/product и example.com/product?color=red — это уникальные страницы, несмотря на то, что для нас это одна и та же страница с идентичным или похожим содержимым.

Такие адреса называются параметризованными, и они являются частой причиной дублирования контента, особенно для интернет-магазинов, которые используют фильтры для навигации.

Например, интернет-магазин Brown Bag Clothing продает мужские рубашки. Это адрес их основной страницы для категории рубашек:

https://www.bbclothing.co.uk/en-gb/clothing/shirts.html

Если вы настраиваете фильтр на поиск только рубашек размера XL, к адресу будет добавлен параметр:

https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL

Если затем вы зададите в фильтре критерий поиска товаров синего цвета, добавится еще один параметр:

https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL&color=Blue

С точки зрения Google, это все разные страницы (даже несмотря на то, что их содержимое отличается незначительно).

Но не одни лишь интернет-магазины сталкиваются с проблемой дублирования контента.

Вот еще несколько распространенных причин возникновения такого нежелательного эффекта, которые относятся ко всем типам сайтов:

●          Наличие параметризованных адресов для параметров поиска (например, example.com?q=search-term).

●          Наличие параметризованных адресов для идентификатора рабочего сеанса (например, https://example.com?sessionid=3).

●          Наличие отдельных версий страниц для печати (например, example.com/page и example.com/print/page).

●          Наличие уникальных адресов для одних и тех же записей в разных категориях (например, example.com/services/SEO/ и example.com/specials/SEO/).

●          Наличие страниц для разных типов устройств (например, example.com и m.example.com).

●          Наличие AMPверсий страницы и версий, не относящихся к данной категории (например, example.com/page и amp.example/page).

●          Выдача одинакового содержимого в варианте с www и варианте без www (например, http://example.com и http://www.example.com).

●          Выдача одинакового содержимого в варианте https и варианте без https (например, http://www.example.com и https://www.example.com).

●          Выдача одинакового содержимого по адресам с закрывающим слэшем и без него (например, https://example.com/page/ и http://www.example.com/page).

●          Выдача одинакового содержимого на разных версиях адреса страницы, таких как страницы индексов (например, https://www.example.com/, https://www.example.com/index.htm, https://www.example.com/index.html, https://www.example.com/index.php, https://www.example.com/default.htm и т. д.).

●          Выдача одинакового содержимого по адресам с заглавными буквами или без них (например, https://example.com/page/ и http://www.example.com/Page).

Во всех этих случаях очень важно правильно использовать теги каноничности.

Кроме того, существуют еще проблемы кроссдоменного дублирования контента. Если вы синдицируете контент, лучше всего добавлять к оригинальной статье отсылающий на нее же тег каноничности, и делать так, чтобы копии указывали статью как каноническую через кроссдоменный тег каноничности.

Это не всегда предотвращает попадание копий синдицированного контента в результаты поиска, но помогает снизить риск того, что копии окажутся в списке выше оригинала.

Когда контент распространяется средствами синдикации, становится достаточно сложно определить оригинальный источник данных. Поэтому мы рекомендуем использовать указатели каноничности или блокирование. Это может понадобиться тем, кто синдицирует свой контент. https://t.co/hblGLsD0ir pic.twitter.com/yjtx43II8j

— Danny Sullivan (@dannysullivan) September 18, 2019

Примечание.

 Некоторые сайты откажутся добавлять ссылку на оригинал. В таких случаях вам предстоит решить, насколько вас устраивает подобный риск. 

Основные принципы использования тега каноничности на практике

Внедрить теги каноничности достаточно легко. Ниже мы рассмотрим четыре разных способа выполнения данной операции. Но какой бы способ вы не выбрали, есть пять золотых правил, о которых нельзя забывать.

Правило №1. Используйте абсолютные URL-адреса

Джон Мюллер из Google утверждает, что лучше всего не использовать относительные пути в элементе link с атрибутом rel=“canonical”.

Вы можете применять оба варианта, но я бы рекомендовал использовать абсолютные адреса, чтобы быть уверенным в том, что они будут правильно интерпретированы.

—  John  (@JohnMu) October 24, 2018

Поэтому следует остановить свой выбор на такой структуре:

<link rel=“canonical” href=“https://example.com/sample-page/” />

А не такую:

<link rel=“canonical” href=”/sample-page/” />

Правило №2. Используйте адреса, введенные символами в нижнем регистре

Поскольку Google может считать разными два адреса, записанные одними и теми же символами, но в разном регистре, вы должны убедиться в том, что при указании адресов на вашем сервере применяются символы в нижнем регистре, а затем использовать записанные таким образом адреса в тегах каноничности.

Правило №3. Используйте правильную версию домена (HTTPS или HTTP)

Если вы переключились на SSL, удостоверьтесь в том, что вы не указываете адреса, не относящиеся к категории SSL (т. е. HTTP), в своих тегах каноничности, поскольку это теоретически может привести к путанице и получению неожиданных результатов. Если вы работаете в пределах защищенного домена, убедитесь в том, что вы указываете такую версию адресов:

<link rel=“canonical” href=“https://example.com/sample-page/” />

А не такую:

<link rel=“canonical” href=“http://example.com/sample-page/” />

Примечание.

 Если вы не пользуетесь HTTPS, все будет выглядеть с точностью до наоборот. 

Правило №4. Используйте автореферентные теги каноничности

Джон Мюллер из Google подчеркивает, что хотя автореферентные теги каноничности и не являются обязательными элементами, однако их использование настоятельно рекомендуется.

Я рекомендую [использовать] автореферентные теги каноничности, поскольку это лучше всего помогает нам понять, какую именно страницу вы хотите проиндексировать, или какой адрес должен быть у проиндексированной страницы.

Даже если у вас только одна страница, иногда ее можно вызвать через разные варианты адреса — например, с определенными символами в конце, в верхнем или нижнем регистре, с www или без. Все это можно конкретизировать с помощью тега rel canonical.

Вот как работает автореферентное указание каноничности: по сути, это тег каноничности с ссылкой на ту страницу, где он находится. Например, для страницы с адресом https://example.com/sample-page автореферентный тег каноничности будет таким:

<link rel=“canonical” href=“https://example.com/sample-page” />

Большинство популярных современных CMS (систем управления контентом) добавляют автореферентные ссылки автоматически, но если вы используете собственную CMS, ваш разработчик должен запрограммировать функцию их добавления.

Правило №5. Используйте один тег каноничности на страницу

Если на странице размещены несколько тегов каноничности, Google проигнорирует их все.

При наличии множественных объявлений rel=canonical, Google, скорее всего, проигнорирует все подсказки rel=canonical.

Как использовать теги каноничности на практике

Существуют пять известных способов указания канонических адресов. Это то, что называют сигналами каноникализации:

  1. Тег HTML (rel=canonical)
  2. Заголовок HTTP
  3. Файлы sitemap
  4. Редирект 301*
  5. Внутренние ссылки

Плюсы и минусы каждого метода рассмотрены в официальной документации Google.

1. Указание каноничности с помощью HTML-тегов rel=“canonical”

Использование тега rel=canonical — это самый простой и наиболее очевидный способ указания канонического адреса.

Для этого просто добавьте приведенный ниже код в секцию <head> любой страницы-копии:

<link rel=“canonical” href=“https://example.com/canonical-page/” />

Пример

Допустим, у вас есть интернет-магазин, продающий футболки. Вы хотите, чтобы адрес https://yourstore.com/tshirts/black-tshirts/ был каноническим, хотя доступ к содержимому этой страницы можно получить и через другие адреса (например, https://yourstore.com/offers/black-tshirts/)

Просто добавьте указанный тег каноничности на все страницы-копии:

<link rel=“canonical” href=“https://yourstore.com/tshirts/black-tshirts/” />

При этом, если вы используете CMS, вам и не нужно дополнительно возиться с кодом вашей страницы. Это самый простой способ.

Настройка тегов каноничности в WordPress:

Установите плагин Yoast SEO и автореферентные теги каноничности будут добавляться автоматически. Чтобы выполнить индивидуальную настройку тегов, перейдите в раздел Advanced («Дополнительно»), предусмотренный для конкретной записи или страницы.

Настройка тегов каноничности в Shopify:

Shopify по умолчанию добавляет автореферентные канонические адреса для продуктов и записей в блогах. Для выполнения индивидуальной настройки адресов вам нужно отредактировать непосредственно файлы шаблонов (.liquid).

В этой теме приведена некоторая информация о том, как это можно сделать.

Настройка тегов каноничности в Squarespace:

Squarespace также добавляет автореферентные адреса по умолчанию. Но, как и в случае с Shopify, если вы хотите добавить собственный канонический адрес, вам нужно отредактировать код напрямую.

2. Указание каноничности через HTTP-заголовки

Вам не удастся разместить теги каноничности в заголовках страницы, содержащей документы типа PDF, поскольку в них нет секции <head>. Чтобы указать каноничность в такой ситуации, нужно будет использовать HTTP-заголовки. Их можно применять и для обычных веб-страниц.

Пример

Представьте, что мы создали версию этой статьи в формате PDF и разместили ее в нашем подкаталоге blog (ahrefs.com/blog/*).

Вот как может выглядеть наш HTTP-заголовок для этого PDF-файла:

HTTP/1.1 200 OK
Content-Type: application/pdf
Link: <http://ahrefs.com/blog/canonical-tags/>; rel="canonical"

Рекомендуемые справочные материалы: Как добавить тег каноничности в HTTP-заголовки

3. Указание каноничности через файлы sitemap

Google требует, чтобы неканонические страницы не включались в карты сайта (файлы sitemap). В них должны быть перечислены только канонические адреса. Все потому, что Google рассматривает перечисленные в файле sitemap страницы как такие, которые рекомендуется считать каноническими.

Но поисковик не всегда выбирает адрес из файлов sitemap в качестве канонического.

Мы не гарантируем, что указанные в sitemap адреса будут считаться каноническими, однако с их помощью легче определить канонические адреса для крупного сайта. Файлы sitemap — это полезный способ сообщить Google, какие страницы вы считаете наиболее важными на своем сайте.

4. Указание каноничности через редирект 301

Используйте перенаправление по коду 301, если хотите отвести трафик от адреса копии к канонической версии.

Пример

Допустим, ваша страница доступна по таким адресам:

  • example.com
  • example.com/index.php
  • example.com/home/

Выберите один адрес в качестве канонического и перенаправьте остальные на него.

То же самое следует сделать для версий сайта HTTPS/HTTP и с/без www. Сделайте одну из версий канонической и перенаправьте на нее остальные.

Например, каноническая версия ahrefs.com — адрес HTTPS без www (https://ahrefs.com). Все приведенные ниже адреса перенаправляются на него:

  • http://ahrefs.com/
  • http://www.ahrefs.com/
  • https://www.ahrefs.com/

Прочтите нашу полную инструкцию по добавлению редиректа 301.

5. Внутренние ссылки

То, как вы ссылаетесь с одной страницы сайта на другую, также является сигналом каноникализации.

Аналитик Google Джон Мюллер перечисляет все сигналы, использующиеся для определения канонических адресов, в этом видео #AskGoogleWebmasters:

Чем большую последовательность вы проявляете при использовании всех этих сигналов, тем проще поисковой системе определить, какой вариант канонического адреса является для вас предпочтительным. Как упоминает в этом видео Джон Мюллер, поисковик Google, кроме всего прочего, предпочитает адреса HTTPS адресам HTTP, а также чаще выбирает более привлекательные с его точки зрения адреса.

Как избежать распространенных ошибок каноникализации

Каноникализация — это довольно сложный процесс, поэтому существует множество заблуждений о том, как правильно к ней подходить.

Вот некоторые из распространенных ошибок, которые при этом совершают.

Ошибка №1. Блокирование неканонических адресов с помощью файла robots.txt

Блокирование адреса в файле robots.txt препятствует его сканированию поисковой системой, из-за чего она не сможет распознать и теги каноничности на соответствующей странице. Это, в свою очередь, не позволяет передавать «ссылочный вес» от неканонических страниц к каноническим.

Ошибка №2. Установка для неканонических адресов тега noindex

Никогда не смешивайте noindex и rel=canonical. Эти предписания противоречат друг другу.

Google, как правило, отдает приоритет тегу каноничности, о чем Джон Мюллер сообщает здесь. Но все равно, лучше так не делать. Если вы хотите, чтобы адрес не индексировался и при этом указывал на каноничный, используйте редирект 301. Либо применяйте rel=canonical.

Ошибка №3. Установка кода состояния HTTP 4XX для неканонических адресов

Установка кода состояния HTTP 4XX для неканонического адреса даст тот же эффект, что и использование тега noindex — Google не сможет распознать тег каноничности и передать «ссылочный вес» канонической версии.

Ошибка №4. Указание корневой страницы в качестве канонической для всех нумерованных

Нумерованные страницы не должны указывать первую страницу как каноническую. Вместо этого они должны определять в качестве канонических сами себя.

Почему? Как Джон Мюллер из Google сообщил на Reddit, это неправильный способ применения rel=canonical.

Главное, чего следует избегать при каноникализации, это использование тега rel=canonical на странице 2, указывающего на страницу 1. Страница 2 не эквивалентна странице 1, поэтому использование rel=canonical в таком случае будет некорректным.

Для разбивки на страницы используйте теги rel=prev/next. Google их больше не применяет, однако Bing все еще пользуется ими.

Ошибка №5. Отказ от использования тегов каноничности с атрибутом hreflang

Атрибут hreflang применяется для указания языка и региона веб-страницы.

Google заявляет, что при использовании hreflang нужно «указать каноническую страницу на том же языке или языке, наиболее подходящем для его замены, если канонической версии на том же языке нет».

Ошибка №6. Установка нескольких тегов rel=canonical

Использование нескольких тегов rel=canonical приведет к тому, что Google, скорее всего, их проигнорирует. Это может произойти, если теги добавляются к странице несколькими агентами — например, системой CMS, темой и плагинами. Поэтому во многих плагинах предусмотрена опция перезаписи, призванная гарантировать, что плагин будет единственным источником установки тегов каноничности.

Эта проблема может возникнуть и при добавлении тегов через JavaScript. Если вы не указываете канонический адрес в HTML-ответе, а затем добавляете тег rel=canonical через JavaScript, то Google должен будет принять его во внимание при отрисовке страницы. Но если вы указываете канонический адрес в HTML, а затем заменяете его через JavaScript, Google получит противоречивые сигналы.

Ошибка №7. Использование rel=canonical в секции <body>

Тег rel=canonical должен появляться только в секции документа <head>. Тег каноничности, добавленный в секции <body>, будет проигнорирован.

Эта проблема может возникнуть при парсинге документа. Даже если исходный код страницы содержит тег rel=canonical в правильном месте, при конструировании страницы в браузере или ее отрисовке поисковой системой, множество причин вроде незакрытых парных тегов, вставок JavaScript или контейнеров <iframe> в секции <head> могут привести к тому, что секция <head> закроется преждевременно. В таких случаях тег каноничности может быть случайно перемещен в секцию <body> отрисованной страницы, где он не будет учитываться.

Как найти и устранить проблемы каноникализации на своем сайте

Выполняя каноникализацию, можно легко допустить ошибку, поэтому рекомендуется регулярно проверять свой сайт на наличие проблем с тегами каноничности и при выявлении устранять их как можно скорее.

В этом вам может помочь инструмент Site Audit от Ahrefs.

Site Audit проверяет ваш сайт на наличие 100 проблем в сфере поисковой оптимизации, в том числе тех, которые относятся к использованию тегов каноничности.

Ниже приведены двенадцать проблем, связанные с тегами каноничности, которые могут быть выявлены с помощью Site Audit, а также способы их устранения:

1. Каноническая ссылка ведет на 4XX

Это предупреждение выдается, когда одна или несколько страниц указывают в качестве канонического адрес с кодом состояния 4XX.

Чем это плохо

Поисковые системы не индексируют страницы 4XX, поскольку те не работают. В итоге они игнорируют теги каноничности, указывающие на такие страницы, и зачастую индексируют другие (неканонические) версии страницы.

Как это исправить

Просмотрите проблемные страницы и замените мертвые (4XX) ссылки на канонические версии ссылками на работающие (200) страницы, которые следует индексировать.

2. Каноническая ссылка ведет на 5XX

Это предупреждение выдается, когда одна или несколько страниц указывают в качестве канонического адрес с кодом состояния 5XX.

Чем это плохо

Коды состояния HTTP 5XX указывают на наличие проблем с сервером, которые приводят к утрате доступа к канонической странице. Google вряд ли проиндексирует недоступные страницы, а значит и проигнорирует ссылку.

Как это исправить

Замените все канонические адреса, вызывающие ошибки, рабочими. Если указанные канонические ссылки выглядят корректными, поищите ошибки в настройках сервера. Имейте в виду, что эта проблема может носить временный характер (например, если проверка сайта выполнялась, когда сервер был перегружен, или сайт был закрыт для проведения обслуживания).

3. Каноническая ссылка перенаправляется

Это предупреждение выдается, когда одна или несколько страниц указывают в качестве канонического адрес, который, в свою очередь, перенаправляет на другой адрес.

Чем это плохо

Канонические ссылки обязательно должны указывать на наиболее авторитетную версию страницы. Перенаправляющий адрес — это не тот случай. В результате, поисковые системы могут неверно интерпретировать или проигнорировать тег каноничности.

Как это исправить

Замените канонические ссылки прямыми ссылками на наиболее авторитетную версию соответствующей страницы (то есть ту, которая возвращает код состояния HTTP 200 и не перенаправляет на другой адрес).

4. Наличие дублирующихся страниц без указателей каноничности

Это предупреждение появляется, когда существует одна или несколько идентичных либо очень похожих страниц, которые не указывают каноническую версию.

Чем это плохо

Поскольку каноническая страница не указана, Google попробует самостоятельно определить версию, наиболее подходящую для отображения в результатах поиска. Это может быть совсем не та версия, которую вы хотели бы видеть проиндексированной.

Как это исправить

Просмотрите группы дубликатов. Выберите одну каноническую версию, которая должна индексироваться в результатах поиска. Укажите ее как каноническую во всех страницах-дубликатах (а также добавьте к ней самой автореферентный тег каноничности).

5. Hreflang с указанием неканонической страницы

Это предупреждение появляется, когда одна или несколько страниц указывают неканонический адрес в своих hreflang-аннотациях.

Чем это плохо

Ссылки в тегах hreflang обязательно должны указывать на канонические страницы. Ссылки на неканонические версии страниц в аннотациях hreflang могут запутать поисковые системы.

Как это исправить

Замените ссылки в hreflang-аннотациях указанных страниц их каноническими версиями.

6. Отсутствие внутренних ссылок, указывающих на канонический адрес

Это предупреждение появляется в том случае, когда на один или несколько адресов, указанных в качестве канонических, не ведет ни одна внутренняя ссылка.

Чем это плохо

Посетители сайта не могу получить доступ к каноническим адресам, для которых не предусмотрены внутренние ссылки. Вместо этого посетители перенаправляются на неканоническую версию страницы.

Как это исправить

Замените все ссылки на неканонические страницы прямыми ссылками на канонические.

7. Указание неканонической страницы в файле sitemap

Это предупреждение появляется, когда в файле sitemap указана одна или несколько неканонических страниц.

Чем это плохо

Google указывает, что в файл sitemap не следует включать неканонические адреса. Причина заключается в том, что поисковая система рассматривает страницы в файлах sitemap как такие, которые предлагается считать каноническими. В файлы sitemap нужно вносить только те страницы, которые вы хотели бы видеть проиндексированными.

Как это исправить

Удалите неканонические адреса из файла sitemap.

8. Неканоническая страница указана как каноническая

Это предупреждение появляется в ситуациях, когда одна или несколько страниц указывают канонической страницу, которая сама указывает на другую каноническую. Это создает «цепочку каноничности», когда страница А определяет своей канонической версией страницу Б, а страница Б в свою очередь — страницу В.

Чем это плохо

Цепочки каноничности могут запутать и дезориентировать поисковые системы. В итоге они могут неверно интерпретировать или проигнорировать используемые теги каноничности.

Как это исправить

Замените неканонические ссылки в тегах каноничности на указанных страницах прямыми ссылками на канонические. Например, если страница А указывает канонической страницу Б, которая указывает канонической страницу В, замените каноническую ссылку на странице А ссылкой на страницу В.

9. URL-адрес Open Graph не совпадает с каноническим

Это предупреждение появляется, когда на одной или нескольких страницах канонический адрес не совпадает с адресом Open Graph.

Чем это плохо

Если адрес Open Graph не совпадает с каноническим, в социальных сетях будет представлена неканоническая версия страницы.

Как это исправить

Замените адрес Open Graph на указанных страницах каноническим адресом. Убедитесь в том, что оба адреса являются идентичными.

Примечание.

Адреса в тегах Open Graph должны быть абсолютными и использовать протоколы http:// или https:// (как и канонические адреса). 

10. Каноническая ссылка с HTTPS на HTTP

Это предупреждение появляется, когда одна или несколько защищенных (HTTPS) страниц указывают незащищенную (HTTP) версию в качестве канонической.

Чем это плохо

HTTPS — это фактор ранжирования, поэтому имеет смысл указывать каноническими защищенные версии страниц везде, где возможно.

Как это исправить

Перенаправьте страницу HTTP на эквивалентную HTTPS. Если это невозможно, добавьте ссылку rel=“canonical” для перехода с HTTP-версии страницы на HTTPS-версию.

Примечание.

Google также считает подходящим альтернативным решением использование HSTS.

11. Каноническая ссылка с HTTP на HTTPS

Это предупреждение появляется, когда одна или несколько незащищенных (HTTP) страниц указывают защищенную (HTTPS) версию канонической.

Чем это плохо

HTTPS и так предпочтительнее HTTP. Поэтому наличие HTTP-версии страницы, указывающей HTTPS-версию канонической, можно считать нелогичным решением.

Примечание.

 Это вряд ли вызовет большие проблемы, но все равно, по возможности, данную ситуацию лучше исправить. 
Как это исправить

Используйте редирект 301 с HTTP на HTTPS. Также следует заменить все внутренние ссылки на HTTP-версию страницы прямыми ссылками на ее HTTPS-версию.

12. Неканоническая страница принимает естественный трафик

Это предупреждение появляется, когда одна или несколько неканонических страниц отображаются в результатах поиска и принимают органический поисковый трафик (чего не должно быть).

Чем это плохо

Либо ваши теги каноничности проставлены некорректно, либо поисковая система предпочла проигнорировать указанные канонические ссылки.

Как это исправить

Проверьте, правильно ли прописаны теги rel=canonical на всех указанных страницах. Если дело не в этом, воспользуйтесь Инструментом проверки URL в Google Search Console, чтобы узнать, был ли определен в качестве канонического адрес, указанный в теге. Если адреса не совпадают, разберитесь, почему это произошло.

Напоследок

Теги каноничности не так уж сложны. С ними разве что поначалу не сразу все понятно.

Просто помните о том, что теги каноничности — это не прямые указания, а скорее подсказки, сигналы для поисковых систем. Проще говоря, поисковики могут выбрать канонической не ту версию, которую вы указали.

Вы можете воспользоваться Инструментом проверки URL в Google Search Console, чтобы узнать, какой канонический адрес указал пользователь, а какой выбрал Google.

Вот категории, которые Google использует в отчете об индексировании в Google Search Console, относящиеся к каноническим адресам:

●          Альтернативная страница с правильным тегом каноничности. Тут отображаются страницы, для которых вы с помощью тега каноничности указали альтернативные версии, и данные указания были приняты. По сути, они, как и было задумано, консолидируются с выбранными вами страницами.

●          Дубликат без выбранного пользователем канонического адреса. Это страницы-дубликаты, для которых не были указаны канонические версии. В этом случае Google выбирает каноническую версию за вас; так что если вам этот выбор не понравится, добавьте тег rel=canonical.

●          Дубликат: Google выбрал канонический адрес, отличный от указанного пользователем. Тут приводятся случаи, когда Google решил игнорировать предложенный вами канонический адрес и выбрал другую версию для индексации.

●          Дубликат: указанный адрес не выбран в качестве канонического. Это тоже тот случай, когда сигнал каноникализации (подача адреса в файле sitemap) был проигнорирован. В данном наборе дублирующихся страниц нет явно помеченных канонических адресов, и в таком случае Google считает,что в индексе должен быть представлен другой адрес (отличный от того, который вы указали).

Есть вопросы? Пишите мне в комментариях или в Twitter.

Перевела Кирик Наталья, владелец контент агентства WordFactory.ua

Атрибут rel= «canonical» — полное руководство по использованию канонических ссылок

На данный момент, устранение проблемы дублированных страниц является одной из самых важных при оптимизации сайта. В большинстве случаев для решения этой проблемы лучше всего использовать 301 редирект.

Но, когда мы или не можем использовать 301 редирект, или нам необходимы страницы для просмотра пользователями, то нам на помощь приходит атрибут rel= «canonical».

С помощью этого атрибута можно довольно быстро устранить проблемы дублирующего контента.

Как прописать rel= «canonical»?

На странице сайта (основной способ)

Чтобы для текущей страницы указать ее каноническую ссылку, то в секции <head> нужно прописать следующее:

<link rel="canonical" href="http://site.com/canonical-link.html"/>

Очень важно прописать именно в секции HEAD, так как если вы случайно пропишите данный атрибут не в этой секции, то данная инструкция будет проигнорированная поисковыми системами.

Через xml-карту сайта

Для каждой страницы в xml-карте сайта вы можете прописать её каноническую ссылку. Но, в данном случае, поисковые системы могут проигнорировать данные рекомендации.

Через ответ сервера (лучше всего для не html документов)

Если вам нужно указать канонические ссылки для не html документов, а, например, для pdf-файлов, то можно указать каноническую ссылку в http-заголовке. Для этого, сервер при запросе дублирующего файла должен отдавать следующее

Link: <http://site.com/main-file.pdf>; rel="canonical".

Но, следуют учесть, что на данный момент Google поддерживает данный элемент заголовка <link> только для Веб-поиска.

Когда нужно использовать канонические ссылки

Если вы точно знаете в каком случае у вас на сайте появляются дубли

Если вы четко понимаете причину возникновения похожих или очень схожих страниц у вас на сайте и, при этом, каждая такая страница должна существовать на сайте, то желательно определиться какая из этих страниц серии является основной и со всех других страниц проставить канонические ссылки на эту одну главную.

Когда сложно или невозможно реализовать 301 редирект

В общем лучше всего использовать 301 редирект, но если это довольно сложно или долго реализовывать, то можно воспользоваться и атрибутом rel=”canonical”. По заявлениям Google, передаваем вес через канонические ссылки абсолютно идентичный весу, который передает 301 редирект.

Несколько страниц для одной серии продуктов

Если у вас в интернет магазине есть серия товаров, которая отличается, например, только цветом, то лучше выбрать один товар в качестве главного (типичного) и на него проставить канонические ссылки с других продуктов.

При разных сортировках товаров в каталоге

Если на вашем сайте товары можно сортировать разными способами и параметр сортировки указывается в урле:

http://site.com/dresses.html?sort=price

то, необходимо, со всех различных комбинаций сортировок, проставлять канонические ссылки на каталог с сортировкой по умолчанию. Обычно, это URL категории без параметров, которые отвечают за сортировку товаров:

<link rel="canonical" href="http://site.com/dresses.html" />

При создании страницы каталога со всеми продуктами

По рекомендациям Google (https://support.google.com/webmasters/answer/1663744?hl=ru), способ при котором вы со всех страниц каталога вы делаете каноническую ссылку на страницу со всеми товарами/статьями, является оптимальным для индексации как страниц каталога сайта, так и всех товаров/статей сайта. При этом способе, для каждого раздела сайта необходимо создать страницу «Смотреть всё» и с каждой страницы пагинации проставить каноническую ссылку на страницу «Смотреть всё».


Но, это способ довольно сложный в реализации. Поэтому, другие реализации пагинации вы сможете найти по этой ссылке:
https://seoprofy.ua/blog/optimizaciya-sajtov/pagination-for-seo

Страница печати

Если печать страниц на сайте реализована через дополнительный параметр, например,

http://site.com/news-1.html?print=yes

то, необходимо, проставить каноническую ссылку на основную версию страницы

<link rel="canonical" href="http://site.com/news-1.html" />

При использовании партнерской программы у вас на сайте

Если на вашем сайте есть партнерская система или любая другая реферальная система, то тут очень важно не забывать прописывать канонические ссылки для всех страниц на которые могут стоять партнерские ссылки. Если забыть проставить, то очень быстро могут появится в индексе поисковых страниц десятки, а то и сотни дублей страниц сайта, так как по внешним ссылкам поисковые роботы довольно быстро проиндексируют не нужные страницы.

Поэтому, для всех страниц на которые стоят партнерские ссылки

http://site.com/dresses.html?partner=dkfEi3dj1

мы прописываем следующую инструкцию:

<link rel="canonical" href="http://site.com/dresses.html" />

Кроме этого, вы можете указать Google все не нужные параметры для индексации через Параметры URL (в  Google Webmasters раздел Сканирование). В данном случаем необходимо указать параметр partner, как такой, что не изменяет содержимое страницы.

Для склейки индексного файла каталога

Важно проверять, чтобы файлы в каталоге типа index.html не приводили к дублям: это может произойти, когда открыты для индексации 2 таких адреса http://site.com/dresses/ и http://site.com/dresses/index.html. В таких случаях, для решения данной проблемы, легче всего в файле http://site.com/dresses/index.html прописать такую каноническую ссылку

<link rel="canonical" href="http://site.com/dresses/" />

При использовании одинакового контента на разных доменах или разных языковых версиях

Когда вы создаете похожие сайты или делаете разные языковые версии вашего контента, но при этом на разных сайтах/языковых версиях используете один и тот же контент, то в таком случае необходимо применение rel=”canonical” на основную версию контента.

Основные ошибки при использовании rel=”canonical”

Использование на страницах пагинации

Очень часто при пагинации или при какой-то серии страниц на сайте для всех страниц такой серии прописывают канонической первую страницу. Это неправильно, так как делает не возможным индексацию все страниц серии.

Как правильно делать пагинацию для seo смотрите здесь: https://seoprofy.ua/blog/optimizaciya-sajtov/pagination-for-seo.

Каноническая ссылка не является индексируемой

Если мы проставляем каноническую ссылку на другую страницу, то должны убедиться, что данная страница является индексируемой:

  • страница отдает 200 код сервера
  • на странице нет запрета индексации (через мета тег robots и noindex)

Несколько ссылок rel=canonical с одной страницы

Для одной страницы должна быть одна каноническая страница. Если указанно несколько страниц, то в таком случае будет учтена только первая инструкция.

Разные канонические URL

Следите за тем, чтобы всегда указывать одни и те же канонические страницы при разной реализации (например, через xml-карту сайта и через rel=”canonical” на самой странице).

Неправильное использование относительных ссылок

В общем случае, при указании канонических ссылок всегда желательно прописывать абсолютные ссылки

<link rel="canonical" href="http://site.com/dresses.html" />

так как при указании с помощью относительных ссылок появляется очень большая вероятность сделать ошибку:

<link rel="canonical" href="site.com/dresses.html" />

Тогда поисковые системы будут просто игнорировать данные инструкции.

Проверка использование rel=»canonical» на своем сайте

После того, как вы настроили все канонические ссылки у себя на сайте, то желательно сделать проверку всего сайта на то, как будут видеть эти все инструкции поисковые роботы. Для этого лучше всего воспользоваться программой Screaming Frog SEO Spider.

После индексации вашего сайта эта программа в удобном для вас виде предоставит вам полную информацию по всем страницам

  • на которых стоит атрибут rel=”canonical” и на какие именно страницы он указывает
  • на какие страницы сайта проставлены канонические ссылки
  • какие страницы без атрибута rel=”canonical”

Вся эта информация будет на вкладке Directives

Следует не забыть провести некоторые дополнительные настройки:

1. Убедиться, что на вкладке Basic выставлена галочка напротив Crawl Canonical

В этом случае, при работе программы, все указанные канонические ссылки на страницах сайта, будут просканированные роботом. Это позволит нам выявить ошибки (например, ссылки на страницы с 404 ответом сервера).

2. На вкладке

Advanced установлена галочка напротив Respect Canonical

В этом случае, из общего отчета страниц будут исключены все канонизированные страницы. Данную опцию лучше всего выбирать на финальном этапе проверки, чтобы исключить все канонизированные страницы и получить финальный список индексируемых страниц.

В заключение

Использование атрибута rel= «canonical» может сэкономить очень много времени на этапе разработки. Но такие решения в итоговом варианте могут привести к проблемам, если не учесть все нюансы использования.

Поэтому, очень важно после финального релиза сайта, внимательно проверить все случаи использования канонических ссылок и чтобы все важные страницы сайты были доступны для индексации.

Хорошие статьи в продолжение:

— Чек лист по SEO для разработчиков

— Ответы сервера — практическая методичка

— Robots.txt — инструкция для SEO

— Оптимизация кода сайта — базовое руководство

Оцените статью

Загрузка…

Как прописать атрибут rel=”canonical”?

Директ Лайн

Кто мы

Крупнейшее агентство
интернет-маркетинга за МКАДом:

1200+ проектов

70 специалистов

15 лет на рынке

Что такое rel=”canonical” и случаи его использования?

Работа некоторых движков или специфика самих ресурсов приводят к тому, что появляются страницы по разным URL-адресам, но со схожим (или одинаковым) контентом. По факту, это разные страницы, но поисковиком воспринимаются как дубли, и ему нет смысла их все добавлять в органическую выдачу. Поэтому алгоритмы ранжирования пробуют самостоятельно определить каноническую (основную/приоритетную) страницу и делают это не всегда верно.

Чтобы указать каноническую страницу, используют специальный атрибут canonical, в котором содержится ссылка на нее.

Примеры из практики, в которых определенно требуется указание канонических ссылок:

  • Если по какой-то причине происходит добавление параметров в конец URL и у страниц при этом одинаковое (максимально схожее) содержимое.
  • Страница доступна из разных частей сайта и у нее меняется URL-адрес. Например, ей присвоены две (или более) категории, архивы, поиск по сайту и прочее. Часто такую проблему пытаются решить с помощью 301-редиректа, однако наиболее логичным вариантом будет обозначить канонический адрес страницы.
  • При использовании фильтров, сортировок и т.д. Этим грешат интернет-магазины, когда один и тот же товар, но с разными характеристиками имеет разные страницы. Та же история с фильтрами, когда каждый из них имеет свой уникальный URL.
  • Страницы пагинации на блогах часто содержат в себе дублированный контент. Иногда их пытаются принудительно закрыть от индексации, но это в корне не верно. Лучше применить атрибут canonical, определив приоритетной страницей ту, на которой содержится весь список товаров/постов.
  • Если на страницах схожий или одинаковый контент.

Способы применения rel=”canonical”

Существуют несколько основных вариантов применения тега canonical.

HTML-код

К примеру, имеется два URL-адреса страницы: page1.html?cat=1 и /cat1/page1.html. Если адрес «/cat1/page1.html» является каноническим, то в код первой страницы необходимо прописать следующую строчку:

<link rel="canonical" href="https://URL.ru/cat1/page1.html "/>

Отсюда следует, что страница, имеющая в своем HTML-коде атрибут rel=»canonical» (если при этом ссылка ведет не на саму себя), является неканонической. Рекомендуется использовать абсолютные ссылки, указывая домен.

HTTP-заголовок

Вариант подходит для определения первоисточника какого-либо файла (не HTML страниц). Для примера возьмем сайт с документом .DOCX, который доступен по адресу: /cat1/DOC.docs и /cat2/DOC.docs, в роли канонического выступает первый. Далее необходимо настроить сервер таким образом, чтобы передавался в HTTP-заголовок неканонической страницы данный тег:

Link: <http://URL.ru/cat2/DOC.docs>; rel=»canonical»

Плагины для CMS

Практически все популярные CMS имеют готовые плагины, автоматически проставляющие атрибут canonical на страницы дублей. Для WordPress таких плагинов существует много, к примеру, Yoast SEO. Joomla 3+ эту функцию имеет «из коробки», достаточно включить SEF в настройках.

Проанализируйте sitemap.xml

Для Google факт наличия страницы в карте сайта является признаком каноничности. Поэтому важно позаботиться о том, чтобы туда добавлялись исключительно страницы, участвующие в поисковой выдаче.

Проверка правильности настройки канонического адреса

Сделать это можно двумя способами: ручным и через программу Screaming Frog SEO Spider.

Ручной

Достаточно открыть интересующую страницу и посмотреть в ее HTML-коде наличие тега canonical.


Просмотр кода страницы


Ищем в HTML-коде

Screaming Frog SEO Spider

Ручной способ не подходит, если нужно проверить сайт с большим количеством страниц. Для этого воспользуемся программой Screaming Frog SEO Spider, она покажет страницы с атрибутом rel=”canonical”, на какие страницы ведут канонические ссылки и страницы без данного атрибута.

1. Делаем предварительные настройки краулера – включаем опцию сканирования канонических страниц.


Настройки Screaming Frog SEO Spider


Включаем сканирование канонических страниц

2. Запускаем сканирование сайта.


Сканирование сайта

3. В разделе «Canonicals» отображается список URL-адресов сайта (столбец Address) и указанные их Canonical-страниц (Canonical Link Element 1). К слову, столбцы можно перемещать.


Получаем список URL-адресов сайта

Часто встречающиеся ошибки при использовании rel=“canonical”

  1. Каноническая страница должна быть доступна, адрес не должен отдавать 4xx или 5xx-ошибку, либо атрибут игнорируется.
  2. Разрешается указывать относительный URL, однако так проще допустить критичную ошибку.
  3. Каноническая страница не должна быть закрытой от индексации.
  4. Не прописывайте атрибут каноникал со внутренних страниц пагинации на первую.
  5. Ошибочное расположение атрибута, например, в блоке <body>. Напомним, данный атрибут должен прописываться в <HEAD>.
  6. Регистр имеет значение, рекомендуется использовать нижний.
  7. Запрещается указывать более одной канонической ссылки на странице. В противном случае, они все игнорируются.
  8. Не добавляйте в карту сайта неканонические URL-адреса (особенно актуально для Google).
  9. Допустима схема, когда дубликаты имеют каноническую ссылку на страницу-первоисточник. Нельзя при этом выстраивать цепочку, когда страница-первоисточник ссылается на другую через атрибут canonical.
  10. Следует понимать разницу между принципами работы canonical и 301-редиректом. Заключается она в том, что при использовании canonical, поисковику указывается URL-первоисточник, при этом работа дубликата не нарушается. А при 301 редиректе происходит физическое перенаправление (как пользователей, так и ботов) на другую страницу, говоря о том, что страница-первоисточник уже неактуальна.
  11. Т.к. атрибут носит рекомендательный характер, то при существенной разнице в содержимом между страницами, поисковик может проигнорировать указание на канонический адрес и проиндексировать их все.
  12. При использовании с тегом noindex могут возникнуть проблемы. Нужно помнить, что в таком случае будет учитываться только canonical.
  13. Недопустимо перенаправление с канонической страницы на другую. Иными словами, канонический адрес должен быть конечен.

Как вернуть неканоническую страницу в поиск?

Возникают ситуации, когда страница признается неканонической и удаляется из поисковой выдачи. Скорее всего, она имеет прописанный атрибут rel=»canonical» в котором указан канонический адрес. Для возврата подобной страницы в органическую выдачу, достаточно удалить данный атрибут и при следующем обновлении поисковой выдачи она там появится.

Увидеть список неканонических страниц можно в панели Яндекс.Вебмастер: «Индексирование – Страницы в поиске – Исключенные».


Просмотр неканонических страниц в панели Яндекс.Вебмастера

В общем списке исключенных страниц будут представлены и неканонические, с соответствующим примечанием.

Правильное использование атрибута rel=»canonical», позволяет помочь в SEO-специалисту с продвижением сайта, улучшив качество его индексации. А игнорирование этого инструмента, напротив может привести к тому, что в индексе появятся схожие по содержанию страницы, как итог, ни одна из них не займет ТОП выдачи.

Что такое canonical и как его настроить для страниц-дублей

Canonical – это особый атрибут ссылочного тега. Он проставляется в тех случаях, когда на одном и том же ресурсе располагаются несколько одинаковых по содержимому страниц. Делается это с целью указания поисковым системам на приоритетные для индексирования разделы сайта, которые дублируются по тем или иным причинам.

Веб-страницы, для которых прописывается rel=“canonical”, называются каноническими. Они предпочитаются Яндексом, Гуглом и другими поисковиками при ранжировании. Таким образом, если у вас две одинаковые страницы на сайте, и вы настроили для одной из них соответствующий атрибут, в выдаче будет показываться  только она, а ее копия — нет.

В каких случаях без canonical не обойтись

Если есть определенные недостатки в системе управления контентом, могут создаваться дубли веб-страниц. Чтобы не искать каждый из них и не удалять вручную, просто укажите атрибут canonical для тех разделов, которые должны быть основными.

Еще одна причина появления копий – когда в интернет-магазине продается один и тот же товар с одинаковым описанием, но отличающийся по цвету. Или, когда продукция публикуется сразу в нескольких разделах ресурса. Например, на Главной и в Каталоге.

О том, как настроить canonical, вы узнаете ниже.

Как узнать, присутствуют ли дубли страниц на вашем сайте

Если у страниц нет дублей, то делать их каноническими не имеет смысла. Поэтому сначала узнайте, есть ли у них копии, которые сбивают с толку поисковые системы. Это делается при помощи сервисов проверки на плагиат text.ru или content watch.

Скопируйте текст со страницы, которую вы подозреваете в наличии клонов. Вставьте его в поле для проверки и нажмите «Проверить». Если в ее результатах высветятся несколько адресов с совпадающим текстом, это означает, что у проверяемой страницы есть дубли или же кто-то не пренебрег плагиатом. В первом случае совпадения будут в рамках домена вашего сайта.

Как настроить канонические страницы

Основной метод – прописать конструкцию с атрибутом canonical между тегами <head> конкретной веб-страницы. Рассмотрим на примере:

<link rel=”canonical” href= ”https://web-resurs.ru/” />.

Вы можете использовать конструкцию выше, заменив в ней только нашу ссылку на свою.

Существуют альтернативные методы указания канонического адреса:

Более детально про эти методы читайте в справочном центре Google.

Как избежать ошибок при настройке canonical

Не указывайте ссылку внутри тега canonical без протокола http или https перед доменом. Если пропустить протокол, возникнет ошибка. Допустимо указывать относительные линки (/main.html) или полные с наличием протокола. Лучше всего отдать предпочтение последним.

Убедитесь в том, что страница, которую вы собираетесь сделать канонической, открыта для индексации поисковиками. На ней НЕ должен быть прописан тег noindex, а в файле robots.txt не может стоять никаких запретов. В противном случае, Яндекс и Google не увидят страницу.

Атрибут canonical должен быть прописан вместе с ссылочным тегом только в рамках блока head. Если вы решите указать конструкцию в другом месте, нет никаких гарантий, что поисковые системы корректно распознают это и исключат из своей выдачи дубликаты.

Может быть так, что какой-то плагин или другой администратор ресурса ранее без вашего ведома настроил канонические страницы. Если вы это сделаете еще раз и адреса будут различаться между собой, поисковики проигнорируют настроенные вами страницы. Поэтому сначала проверьте, нет ли уже прописанных атрибутов canonical в интересующих вас разделах. Делается это, например, с помощью расширения для браузера Firefox — RDS bar.

Не используйте canonical для обычных страниц без дублей. Если вы пропишете этот атрибут для всех разделов своего сайта, независимо от того, присутствуют ли их копии или нет, поисковые системы перестанут учитывать все канонические страницы.

Атрибут rel=canonical: что это такое

Атрибут rel=«canonical» — специальный тег, который сообщает поисковым системам, какую из страниц с дублированным контентом считать дополнительной, а какую – основной.

Почему появляются страницы с дублированным контентом

Дубли страниц – это страницы с полностью идентичным содержанием, но с разными URL.

Почему вообще на сайте появляются дублированные страницы? Самые распространенные причины:

  • Из-за особенностей CMS на сайте могут появиться страницы с .php или .html, со слэшем и без слэша на конце. Например: http://site.ru/page/ и http://site.ru/page
  • На сайте есть страницы с динамическими параметрами URL,
  • Меняется структура сайта, но вебмастер, создавая новые страницы, забывает удалить старые.
  • Страницы фильтров, сортировок, поиска и страницы пагинации, где текст и мета-теги всех страниц могут быть одинаковыми.
  • Сайт переводят на защищенный протокол HTTPS, но он доступен и по HTTP
Если у сайта много дублированных страниц, вебмастеру стоит заняться этим вопросом, т.к.:
  • Дубли страниц затрудняют индексацию сайта,
  • Яндекс и Google не любят дублированный контент, и сайт может потерять позиции в поиске.
  • Поисковая система может отображать в поиске страницу, которая является второстепенной.

Поиск и устранение дублированных страниц является частью поисковой оптимизации сайта. Чаще всего проблему дублей решают с помощью 301 редиректа и атрибута rel=«canonical».

Когда нужно использовать атрибут rel=«canonical»

Основная задача атрибута rel=«canonical» показать поисковой системе, какую из страниц с одинаковым контентом считать канонической, т.е. главной, а какую – второстепенной. Благодаря каноническим ссылкам, поисковые роботы поймут, какие страницы нужно индексировать чаще и выбирать для показа в результатах поиска.

Атрибут rel=canonical является одним из сигналов для поискового робота при выборе канонической страницы. Поисковики также ориентируются на протокол (http или https), предпочтительный для пользователя домен, качество страницы, присутствие URL в файле Sitemap и т.д. Несмотря на то что атрибут является лишь рекомендацией для поискового робота, а не строгим предписанием, его использование очень желательно.

Чаще всего вебмастера используют канонические ссылки в следующих случаях:

  • Несколько страниц для одной серии продуктов,
  • Страницы сортировок товаров в каталоге,
  • Использование партнерской программы на сайте,
  • Использование одинакового контента на разных доменах или разных языковых версиях сайта,
  • Если вебмастер точно знает, что CMS может создавать дубли,
  • Страницы с дублями из-за UTM-меток и т.д.

Как использовать атрибут rel=«canonical» на сайте

Существует несколько способов использования атрибута rel=«canonical»:

  • В коде страницы, которая не является основной, между тегами head указать атрибут и абсолютную ссылку на страницу, которую следует считать приоритетной. Например, [link rel=»canonical» href=“https://site.ru/” /].
  • Канонические ссылки можно прописывать в файле Sitemap, но так как XML-карта является только рекомендацией для поисковых роботов, они могут ее игнорировать.
  • Если страница реализована не в HTML, то можно прописывать канонические ссылки в заголовке HTTP.
  • Есть специальные плагины, которые позволяют настраивать канонические ссылки на разных платформах.

Основные ошибки при создании канонических ссылок:

  • Каноническая ссылка не индексируется,
  • Каноническая ссылка отдает 404 ошибку или 200 код сервера,
  • На одной странице прописано несколько ссылок с атрибутом rel=«canonical» (в этом случае будет учитываться только первая ссылка),
  • При указании канонических ссылок для одной страницы несколькими способами (например, код сайта и XML-карта), ссылки оказались разными,
  • Указанный канонический URL находится на другом домене или поддомене,
  • Указана цепочка канонических адресов. Например, для страницы site.ru/1 указана каноническая ссылка на страницу site.ru/2, в то время как для адреса site.ru/2 указан канонический адрес site.ru/3.
  • На страницах пагинации в качестве канонической ссылки указывается первая страница, что делает невозможным индексацию всех остальных страниц. В данном случае корректнее делать каноническую ссылку на страницу «Показать все», если она есть на сайте.
  • Содержимое канонической страницы значительно отличается от наполнения второстепенной страницы. В таких случаях поисковые роботы могут игнорировать рекомендации и канонические ссылки.

Проверить корректность размещения ссылок с атрибутом rel=«canonical» можно с помощью программы Screaming Frog SEO Spider.

Поисковый робот узнает об изменениях на сайте при его обходе. Если вебмастер корректно указал канонические страницы и робот последовал рекомендациям, второстепенная страница пропадет из результатов поиска. В Яндексе, например, это можно отследить с помощью сервиса Вебмастер (страница Индексирование — Страницы в поиске (блок Исключённые страницы):

Простое руководство по тегу Canonical

Тематический трафик – альтернативный подход в продвижении бизнеса

Получи нашу книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».

Подпишись на рассылку и получи книгу в подарок!

Теги Canonical существуют с 2009 года. То есть, почти десять лет. Цель, для которой их создали — помочь вебмастерам решить проблему дублирующегося контента.

Что такое тег canonical

Это фрагмент HTML-кода, который определяет основную версию для нескольких страниц с похожим или полностью дублирующимся контентом. Другими словами, если по разным адресам есть одинаковый контент, вы можете использовать этот тег, чтобы указать, какая страница является основной, и следовательно, которую нужно проиндексировать.

Как выглядит тег canonical

Теги используют простой и согласованный синтаксис, размещаются в разделе веб-страницы:

<link rel=»canonical» >

Что значит каждая часть:

  • link rel=”canonical”: ссылка является основной (канонической) версией этой страницы;
  • href=»: каноническую версию можно найти по этому URL.

Важность канонических тегов для SEO

Google не любит дублирующийся контент, потому что сложно выбирать оригинал:

  • Какую версию страницы надо проиндексировать?
  • Какая версия страницы подходит для ранжирования по релевантным запросам?
  • Нужно ли объединять ссылочный профиль на одной странице или разбивать его на несколько версий?

Слишком большое количество дублирующегося контента также может повлиять на бюджет сканирования. Это значит, что Google будет тратить время на сканирование нескольких версий одной и той же страницы вместо поиска другого важного материала на вашем сайте.

Канонические теги решают все эти проблемы. Они позволяют вам сообщить, какую версию страницы следует сканировать и ранжировать, где консолидировать любые ссылки.

Если вы не укажите канонический адрес, Google все решит за вас. Самостоятельно.

А полагаться на его грамотный выбор — опрометчиво. Система может выбрать в качестве основной страницы ту, которая в действительности таковой не является.

…но у меня же нет дублирующегося контента!

Да, наверняка вы не стали публиковать одну и ту же статью несколько раз. Но поисковые системы обходят URL, а не страницы.

Это значит, что они воспринимают адреса example.com/product и example.com/product?color=red как уникальные, даже если на них содержится, по факту, один и тот же контент.

Это — параметрические адреса. Они — частая причина возникновения дублирующегося контента. Особенно, если у вас интернет-магазин с фасетной или фильтрованной навигацией.

Например, Brown Bag Clothing продает рубашки. Вот адрес для основной категории товаров:

https://www.bbclothing.co.uk/en-gb/clothing/shirts.html

Если в фильтре выбрать показы только рубашки размером XL, в адрес добавится параметр:

https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL

А если нам нужны вдобавок только рубашки голубого цвета, увидим еще один параметр:

https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size=XL&color=Blue

Это все отдельные страницы для Гугла, а содержание практически одно и то же.

Однако, такая проблема встречается не только для сайтов электронной коммерции. Вот еще несколько случаев:

  • Параметры поисковых запросов в URL (example.com?q=search-term)
  • Параметры сессии (https://example.com?sessionid=3)
  • Наличие раздельных версий страницы для просмотра и для печати ( example.com/page и example.com/print/page)
  • Уникальный url для постов в разных категориях (example.com/services/SEO/ и example.com/specials/SEO/)
  • Отдельные адреса для версий страниц для разных девайсов.
  • Наличие версий страницы с AMP и без нее.
  • Наличие одинакового контента по адресу с www и без него.

В этих случаях использование канонических тегов имеет решающее значение. Кроме того, важны проблемы дублирования контента на разных доменах. Например, при синдикации контента: газета хочет процитировать ваш текст. В таком случае вам надо попросить разместить на вас каноническую ссылку.

Во-первых, вы будете получать реферальный трафик. Во-вторых, обезопасите уникальность вашего контента.

Основы применения тега canonical

Применять легко. Мы рассмотрим четыре способа это сделать далее. Пока — пять основным правил, которые нужно знать и соблюдать.

Правило 1. Использовать абсолютные URL

Джон Мюллер из Google утверждает, что не рекомендуется использовать относительные ссылки вместе с тегом canonical. Чтобы они точно корректно обработались, используйте абсолютные URL.

То есть, вот так:

<link rel=“canonical” >

Вместо:

<link rel=“canonical” href=”/sample-page/” />

Правило 2: Соблюдать нижний регистр

Google может обработать и нижний, и верхний регистры как два разных адреса. Поэтому вначале установите принудиттельно строчные адреса на своем сервере, а затем используйте нижний регистр для написания адресов в ссылках с каноническим тегом.

Правило 3: Правильно использовать версию домена

Если переходите на SSL-сертификат, проверьте, что используете верный протокол передачи данных в адресе, то есть, HTTPS. Теоритически, это тоже может привести к путанице и неожиданным результатам.

Вот так правильно:

<link rel=“canonical” >

А вот так — нет:

<link rel=“canonical” href=“http://example.com/sample-page/” />

Правило 4: Использовать самоссылочные канонические теги

Джон Мюллер говорит, что это — рекомендация, а не обязательство.
Это — каноническая ссылка сама на себя.
Располагаться она будет на этой же странице.
Большинство популярных CMS делают это автоматически. Но на всякий случай проверьте.

Правило 5: Использовать один канонический тег на странице

В противном случае Googlebot проигнорирует вообще все канонические теги на странице.

Как применять канонические адреса

Всего есть 4 способа:

  • HTML-тег;
  • HTTP header;
  • Карта сайта;
  • 301 редирект.

Для подробностей можно посмотреть официальную справку.

1. Установка в HTML-тегах

Самый простой способ — указать тег rel-canonical в адресе. Добавьте нижеследующий код в раздел header:

<link rel=“canonical” href=“https://example.com/canonical-page/” />

Пример

Предположим, у вас есть интернет-магазин футболок. Вы хотите установить адрес каноническим. Учтем, что по разным адресам доступен одинаковый контент.

Можно просто на все дублирующиеся страницы добавить такую строку кода:

<link rel=“canonical” >

Обратите внимание, что если вы используете CMS, возиться с кодом не нужно. Есть более простой способ.

Настройка канонических тегов в WordPress

Установите плагин Yoast SEO. Сможете автоматически добавлять канонические адреса. Используйте вкладку “Дополнительно”.

Установка канонических тегов в Shopify

Shopify добавляет по умолчанию канонические адреса для продуктов и блогов. Чтобы установить пользовательские каноничные URL, отредактируйте файлы шаблона напрямую.

Установка канонических тегов в Squarespace

Squarespace добавляет рекурсивные URL-адреса также по умолчанию. Как и в случае со Shopify, придется редактировать код напрямую, если нужно добавить пользовательский канонический тег.

2. Установка канонических тегов в HTTP header

Для документов — например, PDF — нет возможности разместить канонические теги в заголовке страницы, потому что нет раздела. В таких случаях нужно использовать заголовки HTTP.

Пример

Например, представим, что создаем PDF-версию поста в блоге Ahrefs.

HTTP/1.1 200 OK

Content-Type: application/pdf

Link: <http://ahrefs.com/blog/canonical-tags/>; rel=»canonical»

3. Установка канонических адресов через карту сайта

Google заявляет, что неканонические страницы не нужно включать в карту сайта. Т. е. все страницы из карты сайта Google считает каноническими.

Но тем не менее, система не всегда воспринимает все адреса из sitemap должным образом: “Мы не гарантируем, что размещение адреса в sitemap — подтверждение его каноничности. Карта сайта — способ сказать Google, какие страницы сайта владелец считает наиболее важными”.

4. Настройка канонических тегов при помощи 301 редиректа

Используйте 301 редирект в случае, если вам надо перенаправить трафик с дубликата URL-адреса на каноническую версию.

Пример

Ваша страница доступна по адресам:

  • example.com
  • example.com/index.php
  • example.com/home/

Выбираем страницу, которая будет основной. На остальных размещаем редирект на нее.

Обратите внимание: обязательно должно быть соответствие протоколов передачи данных (HTTPS/HTTP и наличие/отсутствие www).

Распространенные ошибки и их профилактика

Есть много недоразумений и неправильных представлений о том, как правильно устанавливать каноничные адреса. Вот некоторые распространенные ошибки.

Ошибка 1: Блокирование канонического адреса через robots.txt

Блокировка URL-адреса в файле robots.txt не позволит Google его просканировать. А значит, он не увидит канонический тег на этой странице. В свою очередь, он не сможет определить отношение между страницами с одинаковым или схожим контентом.

Ошибка 2: Канонический URL и тег noindex

Никогда не смешивайте теги noindex и rel=canonical. Они противоречат друг другу.

Google обычно отдает приоритет каноничности, а не noindex, по словам Джона Мюллера. Но это все равно плохая практика. Если вам нужно запретить индексировать канонический URL, воспользуйтесь 301 редиректом.

Ошибка 3: Установка 4XX статуса HTTP для канонического URL

Установка состояния 4XX для канонизированного URL имеет те же последствия, что и использование тега noindex. Google не сможет увидеть канонический адрес и передать вес ссылок нужной версии страницы.

Ошибка 4: Канонизация всех страниц навигации на корневую директорию

Страницы навигации не нужно канонизировать относительно первой странице в цепочке. Вместо этого нужно использовать канонические ссылки на саму страницу.

Джон Мюллер заявил, что иной способ канонизации нецелесообразен.

Ошибка 5: Не использование hreflang при канонизации

Hreflang используют, когда нужно указать языковую версию страницы.

Google утверждает, что при использовании hreflang вам также нужно указывать каноническую страницу на том же языке.

Как найти и решить проблемы с каноническими адресами на сайте

1. Проблемы с 4XX

Возникает, когда вебмастер на страницах указывает канонический URL с кодом ответа вида 4ХХ.

Поисковые системы не индексируют страницы 4ХХ, потому что они — не рабочие. В результате поисковик игнорирует любые канонические теги, которые указывают на такие страницы. В итоге в индекс попадает неверная версия страницы.

Поэтому проверьте канонические ссылки, и если в них указан адрес с подобным кодом ответа — исправьте.

2. Проблемы с 5ХХ

Аналогично предыдущему пункту.

Коды ответа такого вида сигнализируют о проблемах на сервере. В результате каноническая страница все равно оказывается недоступна (как и в предыдущем случае).

Нужно, опять-таки, заменить все канонизированные урлы с кодом ответа 5ХХ на доступные. Однако отметим, что код ответа 5ХХ может быть временной проблемой на сервере — например, когда сервер перегружен. В таком случае ничего делать не нужно.

3. Проблемы с редиректами

Предупреждение срабатывает, когда на канонизированном адресе стоит перенаправление на другой URL.

Канонические урлы всегда должны указывать на самую авторитетную версию страницы. Сами понимаете, если на этой “авторитетной” странице стоит редирект, ее надежность под сомнением.

Замените канонические ссылки прямыми линками на наиболее авторитетную версию страницы, которая возвращает код 200.

4. Дублирующие страницы без канонизации

Возникает, когда существует одна или несколько дублирующихся страниц, для которых не указана каноническая версия.

Google будет пытаться самостоятельно определить наиболее подходящую страницу для показа в результатах поиска. В итоге он может выбрать не ту версию, которую хотите увидеть в выдаче вы.

Посмотрите группы дублирующихся страниц. Выберите одну каноническую версию, на остальных укажите ее в качестве основной версии. А на канонической странице установите рекуррентную каноническую ссылку.

5. Hreflang и non-canonical

Срабатывает, когда одна или несколько страниц содержат неканонический URL в аннотациях hreflang.

Ссылки в теге hreflang всегда должны указывать на канонические страницы. Ссылки на неканоническую версию могут ввести в заблуждение поисковую систему.

Поэтому проверьте и замените.

6. Канонический URL не имеет входящих ссылок

Проблема возникает, когда один или несколько указанных канонических адресов не имеет внутренних входящих ссылок.

Канонические адреса без внутренних ссылок недоступны для пользователей сайта. Вместо этого человек попадает на неканоническую версию страницы.

Поэтому проверьте на сайте внутренние ссылки на канонические адреса.

7. Неканонические страницы в sitemap

Возникает, когда в карте сайта указаны неканонические страницы.

Google утверждает, что указывать в картах сайта неканонические страницы не следует. Поэтому он предполагает, что все страницы в файле — те, которые вы хотите проиндексировать.

Не канонические страницы из карты сайта уберите.

8. Неканоническая страница определена как каноническая

Проблема возникает, когда на одной или нескольких страницах указывается канонический URL, который одновременно является каноническим для другой страницы.

Такие цепочки могут ввести в заблуждение поисковик.

Замените неканонические ссылки в канонических тегах затронутых страниц прямыми ссылками на канонические версии. Например, если для страницы А канонической страницей указана В, а для В — страница С, замените каноническую страницу для А с В на С.

9. Open Graph URL не соответствует каноническому

Возникает при несоответствии между указанным каноническим и URL-адресом Open Graph на одной или нескольких страницах.

Если URL-адрес Open Graph не совпадает с каноническим, то неканоническая версия страницы будет опубликована в социальных сетях.

Замените в OpenGraph адрес на канонический, чтобы в соцсети попадала правильная версия страницы.

Заключение

Canonical — это не сложно, если как следует разобраться в логике их работы.

Просто помните, что канонические теги — это не директива, а сигнал для поисковых систем. Другими словами, они могут выбрать каноническую страницу отличную от той, которую укажете вы.

Можно использовать URL Inspection Tool в GSC, чтобы понимать всю картину.

Источник.

На сайте компании SEMANTICA вы можете заказать продвижение сайта юридических услуг. Оставьте заявку, и мы вам перезвоним в ближайшее время.

Canonical и другие мета теги

Теперь Яндекс как и Google, Yahoo и MSN поддерживает атрибут rel=”canonical”, факт, несомненно, положительный. Но как вообще поисковики относятся к содержанию мета тегов, к указаниям для поисковых роботов?

В разделе помощи для вебмастеров Яндекс перечисляет «методы управления поведением» робота Яндекса, но в их описаниях подчеркивает, что все указания МОГУТ учитываться или использоваться, т.е. не являются обязательными для поискового робота, например:

<meta name=»keywords» content=»…»/> — может учитываться при определении соответствия страницы поисковым запросам
meta name=»description» content=»…»/> — может использоваться в сниппетах (описаниях сайтов на странице результатов поиска)

Содержание (content) этих мета тегов должно помогать роботу описывать страницу сайта, но робот, видимо, проверяет соответствие указанных ключевых слов или описания содержанию страницы. Это вполне логично, ведь по ошибке или преднамеренно в keywords и description могут быть использованы ключевые слова, которые не релевантны, и пользователь напрасно будет искать их на странице.

canonical

Атрибут rel=»canonical» мета тега <link> вебмастер может использовать, если на сайте есть «группы схожих по контенту страниц», т.е. страницы доступны по разным url. Чтобы избежать индексации дублей можно предпочитаемый (канонический) url, т.е. url страницы, которую вебмастер хочет видеть в результатах поиска, указать в разделе head страниц с неканоническими url.

Например, одна и та же страница с некоторыми отличиями содержимого или без отличий может открываться по url, которые содержат id сессий, переменные для сортировки и т.п.: www.сайт.ru/page50&category=2 или www.сайт.ru/page50&category=3.

<link rel="canonical" href="www.сайт.ru/page50">

Другой случай — одна и та же страница с url www.сайт.ru и сайт.ru.
Возможности атрибута canonical ограничены: «не рекомендуется создавать цепочки», т.е. если уж url указан как канонический, на странице с этим url не должно быть ссылки на другой канонический url, иначе смысл атрибута нивелируется.
Кроме того, каноническим может быть url только на том же домене. При переносе страниц на другой домен следует использовать постоянный редирект (301).
Также высказывается мнение, что редирект 301 надежнее использовать, если изменяются url страниц при смене движка, чтобы не потерять позиции в выдаче, т.е. полностью передать вес со старых.

noindex не работает?

Указание роботу в мета теге с name=»robots» работает однозначно, например
<meta name=»robots» content=»noindex»/>
запрещает индексацию текста страницы,
content=»nofollow» запрещает индексацию  и переходы по всем ссылкам на странице, а
content=»none» или  content=»noindex, nofollow» запрещает индексировать и то и другое.
Яндекс говорит, что ссылки на странице с nofollow не будут индексироваться, для робота они как бы не существуют.
Предполагается, что аналогично закрывает текст от индексации тег <noindex>, кстати его можно применять в формате

<!--noindex-->текст<!--/noindex-->

Закрывает ссылку атрибут rel=»nofollow» в теге <a>:

<a href="url" rel="nofollow">текст ссылки</a>

Но здесь есть свои тонкости. Например, есть мнение, что (как показывают  эксперименты) тег noindex работает не всегда, например, работает, когда закрывает целый блок текста, а при попытке закрыть отдельные слова игнорируется. В чем дело?
Понятно, что страница, закрытая от индексации, просто не должна попадать в поисковую выдачу. Если в noindex закрыта часть текста, ситуация становится неоднозначной. Возможны случаи, когда в неиндексируемой части содержится действительно нежелательный текст, который делает нежелательной всю страницу в целом? Получается, что поисковик просто обязан читать и учитывать текст внутри noindex.
Источник – блог Яндекс.Поиска, ‘Canonical и другие мета теги’

канонических тегов [2021 SEO] — Moz

Что такое канонический тег?

Канонический тег (также известный как rel canonical) — это способ сообщить поисковым системам, что конкретный URL-адрес представляет главную копию страницы. Использование канонического тега предотвращает проблемы, вызванные тем, что идентичный или «дублированный» контент появляется на нескольких URL-адресах. Фактически, канонический тег сообщает поисковым системам, какая версия URL-адреса должна отображаться в результатах поиска.

Пример кода

Почему канонизация важна?

Дублированный контент — сложная тема, но когда поисковые системы сканируют множество URL-адресов с идентичным (или очень похожим) содержанием, это может вызвать ряд проблем с поисковой оптимизацией.Во-первых, если поисковым роботам приходится преодолевать слишком много дублированного контента, они могут пропустить часть вашего уникального контента. Во-вторых, крупномасштабное дублирование может ослабить вашу способность к ранжированию. Наконец, даже если ваш контент действительно ранжируется, поисковые системы могут выбрать неправильный URL в качестве «оригинального». Использование канонизации помогает контролировать повторяющийся контент.


Удвойте дублированный контент с помощью Moz Pro.

Функция сканирования сайта Moz Pro находит и перечисляет страницы с отсутствующими каноническими тегами, чтобы вы могли быстро принять меры.Воспользуйтесь 30-дневной бесплатной пробной версией и посмотрите, чего вы можете достичь:

Начать бесплатную пробную версию


Проблема с URL-адресами

Вы можете подумать: «Зачем кому-то дублировать страницу?» и ошибочно полагают, что канонизация — это не то, о чем вам нужно беспокоиться. Проблема в том, что мы, люди, склонны воспринимать страницу как концепцию, такую ​​как ваша домашняя страница. Однако для поисковых систем каждый уникальный URL-адрес представляет собой отдельную страницу.

Например, поисковые роботы могут получить доступ к вашей домашней странице всеми из следующих способов:

Для человека все эти URL-адреса представляют одну страницу.Однако для поискового робота каждый из этих URL-адресов является уникальной «страницей». Даже в этом ограниченном примере мы видим, что в игре задействовано пять копий домашней страницы. На самом деле, это лишь небольшая часть вариаций, с которыми вы можете столкнуться.

Современные системы управления контентом (CMS) и динамические веб-сайты, управляемые кодом, еще больше усугубляют проблему. Многие сайты автоматически добавляют теги, разрешают несколько путей (и URL-адресов) к одному и тому же контенту и добавляют параметры URL-адресов для поиска, сортировки, вариантов валюты и т. Д.У вас могут быть тысячи повторяющихся URL-адресов на вашем сайте, и вы даже не подозреваете об этом.

Рекомендации по использованию канонических тегов

Проблемы с дублированием контента могут быть чрезвычайно сложными, но вот несколько важных моментов, которые следует учитывать при использовании канонических тегов:

1. Канонические теги могут быть самореференциальными

Это нормально, если канонический тег указывает на текущий URL. Другими словами, если URL-адреса X, Y и Z дублируются, а X — каноническая версия, можно разместить тег, указывающий на X, в URL-адресе X.Это может показаться очевидным, но это обычная путаница.

2. Проактивно канонизируйте свою домашнюю страницу

Учитывая, что дубликаты домашней страницы очень распространены и люди могут ссылаться на вашу домашнюю страницу разными способами (которые вы не можете контролировать), обычно рекомендуется использовать канонический тег. шаблон вашей домашней страницы, чтобы предотвратить непредвиденные проблемы.

Домашняя страница moz.com имеет самореференциальный канонический тег.

3. Выборочно проверьте свои динамические канонические теги

Иногда из-за плохого кода сайт записывает разные канонические теги для каждой версии URL (полностью пропуская весь канонический тег).Обязательно проверяйте свои URL-адреса, особенно на сайтах электронной коммерции и CMS.

4. Избегайте смешанных сигналов

Поисковые системы могут избегать канонического тега или неправильно интерпретировать его, если вы отправляете смешанные сигналы. Другими словами, не канонизируйте страницу A -–> страницу B, а затем страницу B-> страницу A. Точно так же не канонизируйте страницу A -–> страницу B, а затем 301 перенаправьте страницу B-> страницу A. Также, как правило, не рекомендуется связывать канонические теги (A -–> B, B -–> C, C –-> D), если вы можете этого избежать.Посылайте четкие сигналы, иначе вы заставите поисковые системы сделать неправильный выбор.

5. Будьте осторожны при канонизации почти дубликатов

Когда большинство людей думают о канонизации, они думают о точных дубликатах. Можно использовать канонический тег для почти дубликатов (страниц с очень похожим содержанием), но действуйте осторожно. По этой теме ведется много споров, но, как правило, можно использовать канонические теги для очень похожих страниц, таких как страница продукта, которая отличается только валютой, местоположением или небольшим атрибутом продукта.Имейте в виду, что неканонические версии этой страницы могут не подходить для ранжирования, и если страницы слишком разные, поисковые системы могут игнорировать тег.

6. Канонизация междоменных дубликатов

Если вы контролируете оба сайта, вы можете использовать канонический тег для разных доменов. Допустим, вы — издательская компания, которая часто публикует одну и ту же статью на полдюжине сайтов. Использование канонического тега сфокусирует вашу позицию в рейтинге только на одном сайте. Имейте в виду, что канонизация предотвратит ранжирование неканонических сайтов, поэтому убедитесь, что это использование соответствует вашему бизнес-сценарию.

Канонические теги против 301 редиректа

Один из распространенных вопросов SEO заключается в том, передают ли канонические теги равенство ссылок (PageRank, авторитет и т. Д.), Как 301 редирект. В большинстве случаев кажется, что да, но это может быть опасный вопрос. Имейте в виду, что эти два решения создают два совершенно разных результата для поисковых роботов и посетителей сайта.

Если вы 301 перенаправляете страницу A -> страницу B, то посетители-люди будут автоматически перенаправляться на страницу B и никогда не увидят страницу A. Если вы относитесь к странице A -> Page B, то поисковые системы будут знать эту страницу B является каноническим, но люди смогут посещать оба URL-адреса.Убедитесь, что ваше решение соответствует желаемому результату.

Как проводить аудит канонических тегов для SEO

При аудите канонических тегов есть ряд вещей, которые стоит проверить для оптимальной производительности SEO. Вот контрольный список:

  • Есть ли на странице канонический тег?
  • Указывает ли канонический на правую страницу?
  • Можно ли сканировать и индексировать страницы?

Распространенной ошибкой является указание канонической ссылки на URL, который либо заблокирован роботами.txt или установлено значение «noindex». Это может посылать поисковым системам смешанные и сбивающие с толку сигналы. Ниже приведены несколько распространенных способов проверки и аудита ваших канонических тегов.

1. View-source

В большинстве браузеров вы можете щелкнуть правой кнопкой мыши, чтобы просмотреть исходный код, или просто введите его в адресную строку, например: view-source: https: //moz.com/learn / seo / cano … исходный код, ищите канонический тег в. Если он присутствует, он должен выглядеть так:

2. Используйте MozBar

MozBar — это бесплатная панель инструментов SEO, которая легко покажет вам канонический тег на любой странице.После установки просто перейдите на вкладку «Анализ страницы», затем нажмите «Общие атрибуты», чтобы просмотреть любую каноническую информацию.

3. Массовый аудит с помощью программных решений

Большинство программ для SEO-аудита сайтов позволяют выполнять массовый аудит канонических тегов. Moz Pro проверяет отсутствие канонических тегов и может делать это для 100 тысяч страниц за раз.

Подробнее:


Продолжайте учиться

Объедините повторяющиеся URL-адреса с помощью Canonicals

Если у вас есть одна страница, доступная по нескольким URL-адресам, или разные страницы с похожими контент (например, страница с мобильной и настольной версией), Google видит их как повторяющиеся версии одной и той же страницы.Google выберет один URL как канонический версия и сканирование этого, а также все остальные URL-адреса будут считаться дублирующими, URL-адресами и ползал реже.

Если вы явно не укажете Google, какой URL является каноническим, Google сделает выбор для вы или можете считать их обоих одинаково важными, что может привести к нежелательному поведению, поскольку объяснено в разделе Причины выбора канонического URL.

Канонический URL-адрес : Канонический URL-адрес — это URL-адрес страница, которую Google считает наиболее репрезентативной из набора повторяющихся страниц вашего сайта.Например, если у вас есть URL-адреса той же страницы ( example.com?dress=1234 и example.com/dresses/1234 ), Google выбирает один как канонический. Страницы не обязательно должны быть абсолютно идентичными; незначительные изменения в сортировке или фильтрации страницы списка не делают страницу уникальной (например, сортировка по цене или фильтрация по элементам цвет).

Канонический URL-адрес может находиться в другом домене, чем повторяющийся URL-адрес.

Как робот Googlebot индексирует и выбирает канонический URL

Когда робот Googlebot индексирует сайт, он пытается определить основное содержание каждой страницы.Если Робот Googlebot находит на одном сайте несколько страниц, которые кажутся одинаковыми, и выбирает страницу. что он считает наиболее полным и полезным, и отмечает его как канонический. Каноническая страница будут сканироваться наиболее часто; дубликаты сканируются реже, чтобы уменьшить Google просматривает нагрузку на ваш сайт.

Google выбирает каноническую страницу на основании ряда факторов (или сигнализирует ), например обслуживается ли страница через HTTP или HTTPS, качество страницы, наличие URL-адреса в карте сайта, и любая разметка rel = canonical .Вы можете указать вы предпочитаете Google, используя эти методы, но Google может выбрать другую страницу каноничнее, чем вы, по разным причинам.

Разные языковые версии одной страницы считаются дубликатами, только если основной контент на том же языке (то есть, если только верхний, нижний колонтитул и другие некритические текст переводится, но тело остается прежним, тогда страницы считаются дубликаты).

Google использует канонические страницы в качестве основных источников для оценки содержания и качества.Google Результат поиска обычно указывает на каноническую страницу, если один из дубликатов явно не указан. лучше подходит для пользователя. Например, результат поиска, вероятно, будет указывать на мобильный страница, если пользователь находится на мобильном устройстве, даже если страница для ПК помечена как каноническая.

Достоверные причины сохранения похожих или повторяющихся страниц

Существуют веские причины, по которым на вашем сайте могут быть разные URL-адреса, указывающие на одну и ту же страницу, или иметь повторяющиеся или очень похожие страницы по разным URL-адресам.Вот наиболее частые причины:

  • Для поддержки нескольких типов устройств:
     https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage 
  • Чтобы включить динамических URL-адресов для таких вещей, как параметры поиска или идентификаторы сеанса:
     https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https: //www.example.ru / платья / зеленый / greendress.html 
  • Если ваша система блогов автоматически сохраняет нескольких URL-адресов по мере того, как вы размещаете тот же пост в нескольких разделах.
     https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/ 
  • Если ваш сервер настроен для обслуживания того же контента для www / без www http / https варианты :
     http: // example.com / зеленые платья
    https://example.com/green-dresses
    http://www.example.com/green-dresses
     
  • Если контент, который вы предоставляете в блоге для распространения на другие сайты, является частично или полностью реплицируется на этих доменах:
    https://news.example.com/green-dresses-for-every-day-155672.html (синдицированный пост) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (исходное сообщение)

Причины выбрать канонический URL

Существует ряд причин, по которым вы захотите явно выбрать каноническую страницу в набор повторяющихся или похожих страниц:

  • Чтобы указать, какой URL-адрес вы хотите, чтобы люди видели в результатах поиска. Вы может предпочесть, чтобы люди переходили на страницу вашего продукта в зеленых платьях через https://www.example.com/dresses/green/greendress.html скорее чем https://example.com/dresses/cocktail?gclid=ABCD .
  • Для объединения сигналов о ссылках на похожие или повторяющиеся страницы . Помогает поиску движки, чтобы иметь возможность консолидировать информацию, которую они имеют для отдельных URL-адресов (например, ссылки на них) в один предпочтительный URL.Это означает, что ссылки с других сайтов на http://example.com/dresses/cocktail?gclid=ABCD объединить со ссылками на https://www.example.com/dresses/green/greendress.html .
  • Для упрощения отслеживания метрик для отдельного продукта или темы . С разнообразием URL-адреса, сложнее получить консолидированные метрики для определенного фрагмента контента.
  • Для управления синдицированным контентом. Если вы распространяете свой контент для публикации в других доменах вы хотите, чтобы ваш предпочтительный URL появлялся в результатах поиска.
  • Чтобы не тратить время на сканирование дублирующихся страниц . Вы хотите, чтобы робот Google получить максимальную отдачу от своего сайта, поэтому ему лучше потратить время на сканирование новых (или обновлено) на вашем сайте, а не сканировать настольную и мобильную версии те же страницы.

Узнайте, какую страницу Google считает канонической

Используйте URL Инструмент проверки, чтобы узнать, какую страницу Google считает канонической.

Примечание : Даже если вы явно указываете каноническую страницу, Google может выбрать другую каноническую версию по разным причинам, например по производительности или содержанию.

Укажите каноническую страницу

Чтобы указать канонический URL-адрес для повторяющихся URL-адресов или похожих страниц, выберите один из следующих методы. Обязательно следуйте общим рекомендациям.

Хотя мы рекомендуем вам использовать любой из этих методов, ни один из них не обязательный. Если вы не укажете канонический URL, мы определим, что мы считаем лучшим версия или URL.
Метод и описание
rel = canonical tag

Добавьте тег в код для всех повторяющихся страниц, указывая на каноническую страницу.

Плюсы:
  • Может отображать бесконечное количество повторяющихся страниц.

Минусы:

  • Можно увеличить размер страницы.
  • Может быть сложно поддерживать отображение на более крупных сайтах или сайтах, где URL-адреса часто меняются.
  • Работает только для HTML-страниц, но не для таких файлов, как PDF. В таких случаях вы можете используйте HTTP-заголовок rel = canonical .
rel = canonical HTTP-заголовок

Отправьте заголовок rel = canonical в ответ на странице.

Плюсы:

  • Не увеличивает размер страницы.
  • Может отображать бесконечное количество повторяющихся страниц.

Минусы:

  • Может быть сложно поддерживать отображение на более крупных сайтах или сайтах, где URL-адреса часто меняются.
Карта сайта

Укажите свои канонические страницы в карте сайта.

Плюсы:

  • Простота в использовании и обслуживании, особенно на крупных объектах.

Минусы:

  • Робот Googlebot по-прежнему должен определять связанный дубликат для любых канонических файлов. которые вы указываете в карте сайта.
  • Менее мощный сигнал для робота Googlebot, чем rel = canonical картографическая техника.
301 перенаправление Используйте переадресацию 301, чтобы сообщить роботу Googlebot, что перенаправленный URL-адрес является лучшей версией, чем данный URL. Используйте это только при отказе от дублирующейся страницы.
Вариант AMP Если одним из ваших вариантов является страница AMP, следуйте инструкциям по AMP, чтобы указать каноническая страница и вариант AMP.

Общие указания

Для всех методов канонизации соблюдайте следующие общие правила:

  • Не использовать роботов.txt для канонизации.
  • Не использовать инструмент удаления URL для канонизации. Удаляет все версии URL из поиска.
  • Не указывайте разные URL-адреса как канонические для одной и той же страницы, используя одинаковые или разные методы канонизации (например, не указывайте один URL в карта сайта, но другой URL для той же страницы с использованием rel = "canonical" ).
  • Не использовать noindex как средство предотвращения выбора канонической страницы.Эта директива предназначена для исключения страницу из индекса, чтобы не управлять выбором канонической страницы.
  • Укажите каноническую страницу при использовании hreflang теги. Укажите каноническую страницу на том же языке или лучшую замену язык, если канонического не существует для того же языка.

  • Ссылка на канонический URL-адрес, а не на повторяющийся URL-адрес, при создании ссылок на вашем сайте. Последовательная ссылка на URL, который вы считаете каноническим, помогает Google понять ваше предпочтение.

Предпочитать HTTPS над HTTP для канонических URL

Google предпочитает страницы HTTPS эквивалентным страницам HTTP как каноническим, за исключением тех случаев, когда есть проблемы или противоречивые сигналы, например:

  • На странице HTTPS указан недопустимый сертификат SSL.
  • Страница HTTPS содержит небезопасные зависимости (кроме изображений).
  • Страница HTTPS перенаправляет пользователей на страницу HTTP или через нее.
  • На странице HTTPS есть ссылка rel = "canonical" на страницу HTTP.

Хотя наши системы по умолчанию предпочитают страницы HTTPS страницам HTTP, вы можете убедиться, что это поведение, выполнив любое из следующих действий:

  • Добавить перенаправления со страницы HTTP на страницу HTTPS.
  • Добавьте ссылку rel = "canonical" со страницы HTTP на страницу HTTPS.
  • Внедрить HSTS.

Чтобы Google не сделал неправильную страницу HTTP канонической, избегайте следующие практики:

  • Избегайте неверных сертификатов TLS / SSL и переадресации HTTPS-to-HTTP, потому что они заставляют Google очень сильно предпочитаю HTTP.Внедрение HSTS не может отменять это сильное предпочтение.
  • Избегайте включения HTTP-страницы в карту сайта или hreflang. записи, а не версию HTTPS.
  • Избегайте внедрения сертификата SSL / TLS для неправильного варианта хоста. Например, example.com, обслуживающий сертификат для www.example.com. Сертификат должен соответствовать вашему полный URL-адрес сайта или подстановочный сертификат, который можно использовать для нескольких поддоменов на домен.
Только для опытных пользователей: скажите Google, чтобы он игнорировал динамические параметры

Использовать параметр Обработка сообщения роботу Googlebot о любых параметрах, которые следует игнорировать при сканировании. Игнорирование определенных параметров может уменьшить количество дублированного контента в индексе Google и сделать ваш сайт более проходимый. Например, если вы укажете, что параметр sessionid следует игнорировать, робот Googlebot будет рассматривать следующие два URL-адреса как дубликаты:

  • https: // www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

Используйте тег ссылки

rel = "canonical"

Чтобы указать, что страница является копией другой страницы, вы можете использовать тег в разделе head вашего HTML.

Предположим, вы хотите, чтобы https://example.com/dresses/green-dresses был канонический URL-адрес, хотя доступ к этому содержимому может иметь множество URL-адресов.Укажите этот URL как canonical с этими шагами:

  1. Отметьте все повторяющиеся страницы элементом ссылки rel = "canonical" .

    Добавьте элемент с атрибутом rel = "canonical" to the раздел повторяющихся страниц, указывающий на каноническую страницу. Например:

      
  2. Если каноническая страница имеет мобильный вариант, добавьте rel = "alternate" ссылка на него, указывающая на мобильную версию страницы:
      
  3. Добавьте любой hreflang или другие перенаправления, подходящие для страницы.
Используйте абсолютные пути, а не относительные пути с rel = "canonical" элемент ссылки.

Рекомендуется : https://www.example.com/dresses/green/greendresss.html

Не рекомендуется : /dresses/green/greendress.html

Если вы можете настроить свой сервер, вы можете использовать rel = "canonical" Заголовок HTTP (а не тег HTML), чтобы указать канонический URL-адрес документа, поддерживаемого поиском, включая документы не в формате HTML, такие как файлы PDF.

Если вы открываете PDF-файл по нескольким URL-адресам, вы можете вернуть rel = "canonical" Заголовок HTTP, сообщающий роботу Googlebot, какой канонический URL для файла PDF:

.
 Ссылка: ; rel = "canonical" 

Google в настоящее время поддерживает этот метод только для результатов веб-поиска.

Используйте абсолютные пути, а не относительные пути. с rel = "canonical" элемент ссылки.

Рекомендуется : http://www.example.com/downloads/white-paper.pdf

Не рекомендуется : /downloads/white-paper.pdf

Использовать карту сайта

Выберите канонический URL-адрес для каждой из своих страниц и отправьте их в карта сайта. Все страницы, перечисленные в карте сайта предлагаются как канонические; Робот Googlebot решит, какие страницы (если есть) страницы являются дубликатами, на основе схожести содержания.

Мы не гарантируем , что мы будем считать URL-адреса карты сайта каноническими, но это простой способ определения канонических значений для большого сайта, а карты сайта — полезный способ определить Погуглите, какие страницы на своем сайте вы считаете наиболее важными.

Не включать неканонические страницы в карту сайта. Если вы используете карту сайта, укажите в карте сайта только канонические URL.

Использовать переадресацию 301 для устаревших URL-адресов

Используйте этот метод, если вы хотите избавиться от существующих повторяющихся страниц, но при этом необходимо плавный переход, прежде чем вы удалите старые URL-адреса.

Предположим, на вашу страницу можно попасть несколькими способами:

  • https://example.com/home
  • https: // home.example.com
  • https://www.example.com

Выберите один из этих URL-адресов в качестве канонического URL-адреса и используйте переадресацию 301 для отправки трафика с другие URL-адреса на ваш предпочтительный URL-адрес. Редирект 301 на стороне сервера — лучший способ гарантировать, что пользователи и поисковые системы направляются на правильную страницу. Код состояния 301 означает, что страница навсегда переехала в новое место.

Если вы пользуетесь услугами хостинга веб-сайтов, поищите их документацию по настройке 301 редирект.

Поиск и устранение неисправностей

Если канонический URL-адрес находится в собственности, которой вы не владеете, вы не сможете увидеть ни один из посещаемость вашей дублирующейся страницы. Вот несколько общих причин, по которым каноническое может существовать в отдельный объект недвижимости:

  • Неправильно отмеченные языковые варианты: Если у вас несколько веб-сайтов, обслуживать практически один и тот же контент, локализованный для разных пользователей по всему миру, убедитесь, что следовать нашим рекомендациям для локализованные сайты.
  • Неверные канонические теги: Некоторые системы управления контентом (CMS) или CMS плагины могут неправильно использовать методы канонизации, чтобы указывать на URL-адреса на внешних веб-сайты. Проверьте свой контент, чтобы узнать, так ли это. Если на вашем сайте отображается неожиданный канонический URL-адрес, возможно, из-за неправильного использования rel = "canonical" или 301 редирект, исправьте эту проблему напрямую.
  • Неверно настроенные серверы: Некоторые неправильные настройки хостинга могут вызывать непредвиденные выбор междоменного URL.Например:
    • Сервер может быть неправильно сконфигурирован для возврата контента с a.com в ответ на запрос для URL на b.com
    • Два несвязанных веб-сервера могут возвращать идентичные мягкие страницы 404, которые Google не может быть идентифицирован как страница с ошибкой.
  • Вредоносный взлом: Некоторые атаки на веб-сайты вводят код, который возвращает перенаправление HTTP 301 или вставки элемент междоменной ссылки rel = "canonical" в HTML или заголовок HTTP, обычно указывающий на хостинг URL вредоносный или спам-контент.В этих случаях наши алгоритмы могут выбрать вредоносный или спам-URL вместо URL-адреса взломанного веб-сайта.
  • Сайт-подражатель: В редких случаях наш алгоритм может выбрать URL с внешнего сайта, на котором размещается ваш контент без вашего разрешения. Если ты веришь что другой сайт копирует ваш контент в нарушение закона об авторских правах, вы можете связаться с хост сайта, чтобы запросить удаление. Кроме того, вы можете попросить Google удалить страницу, нарушающую авторские права, из результатов поиска, заполнив запрос в соответствии с Законом о защите авторских прав в цифровую эпоху.

Простое руководство для начинающих

Хотите узнать, что такое канонические теги и как их использовать, чтобы избежать ужасных проблем с дублированием контента?

Канонические теги не новость. Они существуют с 2009 года — лучшую часть десятилетия.

Google, Microsoft и Yahoo объединились для их создания. Их цель? Чтобы предоставить владельцам веб-сайтов способ быстро и легко решить проблемы с дублирующимся контентом.

Они работают? Да, отлично … но только если ты умеешь ими пользоваться!

В этом руководстве вы узнаете:

Что такое канонический тег?

Канонический тег (rel = «canonical») — это фрагмент HTML-кода, который определяет основную версию для повторяющихся, почти повторяющихся и похожих страниц.Другими словами, если у вас есть одинаковый или похожий контент, доступный по разным URL-адресам, вы можете использовать канонические теги, чтобы указать, какая версия является основной и, следовательно, должна быть проиндексирована.

Как выглядит канонический тег?

Канонические теги используют простой и согласованный синтаксис и размещаются в разделе веб-страницы:

Вот что означает каждая часть этого кода на простом английском языке:

  1. ссылка rel = «canonical»: Ссылка в этом теге является главной (канонической) версией этой страницы.
  2. href = «https://example.com/sample-page/»: Каноническую версию можно найти по этому URL-адресу.

Google не любит дублированный контент. Им становится сложнее выбрать:

  1. Какую версию страницы индексировать (они будут индексировать только одну!)
  2. Какую версию страницы следует ранжировать по релевантным запросам.
  3. Должны ли они консолидировать «ссылочный капитал» на одной странице или разделить его между несколькими версиями.

Слишком много повторяющегося контента также может повлиять на ваш «краулинговый бюджет».Это означает, что Google может в конечном итоге тратить время на сканирование нескольких версий одной и той же страницы вместо того, чтобы обнаруживать другое важное содержание на вашем веб-сайте.

Правда о бюджете сканирования

Заставить Google тратить время на сканирование дублированного контента, конечно, следует по возможности избегать. Однако Google заявляет, что для большинства сайтов это не проблема.

Если новые страницы, как правило, сканируются в тот же день, когда они публикуются, веб-мастерам не стоит обращать внимание на бюджет сканирования.Аналогичным образом, если на сайте меньше нескольких тысяч URL-адресов, большую часть времени он будет сканироваться эффективно.

Канонические теги решают все эти проблемы. Они позволяют вам указать Google, какую версию страницы они должны проиндексировать и ранжировать, и где консолидировать любой «ссылочный вес».

Если не указать канонический URL, Google возьмет дело в свои руки.

Если вы не укажете канонический URL, мы определим, какая, по нашему мнению, лучшая версия или URL.

Полагаться на Google — не лучшая идея.Они могут выбрать версию вашей страницы, которую вы не хотите делать канонической.

ВАЖНОЕ ПРИМЕЧАНИЕ

Google заявляет, что они обычно уважают установленный вами канонический URL, но не всегда. Это потому, что теги canonicals являются подсказками, а не директивами. Пока они соблюдаются, любые сигналы, такие как ссылки, должны объединяться в канонический URL.

Использование лучших практик канонических тегов также помогает снизить риск того, что Google сочтет нежелательную версию страницы канонической.

Но у меня нет повторяющегося контента, не так ли?

Учитывая, что вы, вероятно, не публиковали одни и те же сообщения и страницы несколько раз, легко предположить, что на вашем веб-сайте нет повторяющегося содержания.

Но поисковые системы сканируют URL-адреса, а не веб-страницы.

Это означает, что они видят example.com/product и example.com/product?color=red как уникальные страницы, даже если это одна и та же веб-страница с идентичным или похожим содержанием.

Это так называемые параметризованные URL-адреса, и они являются частой причиной дублирования контента, особенно на сайтах электронной торговли с фасетной / отфильтрованной навигацией.

Например, Brown Bag Clothing продает рубашки. Это URL-адрес их главной страницы категории:

https://www.bbclothing.co.uk/en-gb/clothing/shirts.html

Если вы фильтруете только рубашки XL, параметр добавляется к URL:

https://www.bbclothing.co.uk/en-gb/clothing/shirts.html ? Size = XL

Если вы затем отфильтруете только синие рубашки, еще одним параметром будет добавлен:

https: // www.bbclothing.co.uk/en-gb/clothing/shirts.html ? Size = XL & color = Blue

В глазах Google это отдельные страницы, хотя их содержание лишь незначительно.

Но не только сайты электронной торговли становятся жертвами дублирования контента.

Вот несколько других распространенных причин дублирования контента, которые применимы ко всем типам веб-сайтов:

  • Параметризация URL-адресов для параметров поиска (например, example.com?q=search-term )
  • Параметризация URL-адреса для идентификаторов сеанса (e.g., https://example.com?sessionid=3)
  • Имея отдельные версии для печати страниц (например, example.com/page и example.com/print/page )
  • Имея уникальные URL-адреса для сообщений в разных категориях (например, example.com/ услуги / SEO / и example.com/ специальные / SEO / )
  • Наличие страниц для разных типы устройств (e.g., example.com и m.example.com )
  • Наличие версий AMP и без AMP страницы (например, example.com/page и amp.example / page )
  • Обслуживание одного и того же контента в вариантах без www и www (например, http://example.com и http://www.example.com )
  • Обслуживание одного и того же контента без https и https варианты (например, http://www.example.com и https: // www.example.com )
  • Обслуживание одного и того же контента с косой чертой в конце и без нее (например, https://example.com/page/ и http://www.example.com/page )
  • Обслуживание одного и того же контента в версиях страницы по умолчанию, таких как индексные страницы (например, https://www.example.com/ , https://www.example.com/index.htm , https : //www.example.com/index.html , https://www.example.com/index.php , https: // www.example.com/default.htm и т. д.)
  • Обслуживание одного и того же контента с заглавными буквами и без них (например, https://example.com/page/ и http: //www.example. com / Page / )

В таких ситуациях правильное использование канонических тегов имеет решающее значение.

Кроме того, существуют проблемы с междоменным дублированием контента. Если вы распространяете контент, рекомендуется использовать в своей статье канонический тег с самооценкой, а в синдицированном содержании указывать вас как каноническую версию с междоменным каноническим тегом.

Это не всегда предотвращает появление синдицированного содержания в результатах поиска, но помогает снизить риск того, что он превзойдет оригинал.

Если люди сознательно решили синдицировать свой контент, это затруднит определение источника. Вот почему мы рекомендуем использовать канонический или блокирующий. Это может потребоваться издателям, участвующим в синдикации. https://t.co/hblGLsD0ir pic.twitter.com/yjtx43II8j

— Дэнни Салливан (@dannysullivan) 18 сентября 2019 г.

Sidenote.

Некоторые сайты отказываются добавлять каноническую ссылку. В таких случаях вам решать, хотите ли вы пойти на риск.

Основы реализации канонических тегов

Канонические теги легко реализовать. Мы обсудим четыре различных способа сделать это сейчас. Но независимо от того, какой метод вы выберете, есть пять золотых правил, которые вы должны всегда помнить.

Правило №1: используйте абсолютные URL-адреса

Джон Мюллер из Google утверждает, что лучше не использовать относительные пути с элементом ссылки rel = «canonical».

Вы можете использовать любой из них, но я бы рекомендовал использовать абсолютные URL-адреса, чтобы вы были уверены, что они интерпретируются правильно. — 🍌 John 🍌 (@JohnMu) 24 октября 2018 г.

Итак, вам следует использовать следующую структуру :

https://example.com/sample-page/ » />

В отличие от этого:

/ sample-page / ” />

Правило № 2: Используйте строчные URL-адреса

Поскольку Google может обрабатывать URL-адреса в верхнем и нижнем регистре как два разных URL-адреса, сначала убедитесь, что URL-адреса в нижнем регистре server, а затем используйте строчные URL-адреса для своих канонических тегов.

Правило № 3: Используйте правильную версию домена (HTTPS или HTTP).

Если вы перешли на SSL, убедитесь, что вы не объявляете в своих канонических тегах URL-адреса, отличные от SSL (т. Е. HTTP). Теоретически это может привести к путанице и неожиданным результатам. Если вы находитесь в защищенном домене, убедитесь, что вы используете следующую версию своего URL:

https : //example.com/sample-page/» />

В отличие от:

http : // example.com / sample-page / ”/>

Sidenote.

Если вы не используете HTTPS, то все наоборот.

Правило №4. Используйте канонические теги с саморегулированием.

Джон Мюллер из Google говорит, что, хотя это и не обязательно, рекомендуются канонические теги с саморегулированием.

Я рекомендую [использовать] самореференциальный канонический, потому что он действительно дает нам понять, какую страницу вы хотите проиндексировать или каким должен быть URL при индексировании.

Даже если у вас одна страница, иногда есть разные варианты URL, которые могут подтянуть эту страницу вверх.Например, с параметрами в конце, возможно, в верхнем нижнем регистре или с www и без www. Все это можно очистить с помощью тега rel canonical.

Если вы не знаете, как работает самореференциальный канонический тег, это, по сути, канонический тег на странице, который указывает на себя. Например, если URL-адрес был https://example.com/sample-page , , то каноническим URL-адресом, ссылающимся на себя на этой странице, было бы:

Самые современные популярные CMS автоматически добавляют URL-адреса, ссылающиеся на себя, но вам потребуется жестко запрограммировать это разработчиком, если вы используете собственную CMS.

Правило № 5: Используйте один канонический тег на странице

Если на странице есть несколько канонических тегов, Google проигнорирует оба.

В случае нескольких объявлений rel = canonical Google, скорее всего, проигнорирует все подсказки rel = canonical.

Как реализовать канонические URL-адреса

Существует пять известных способов указать канонические URL-адреса.Вот так называемые сигналы канонизации:

  1. HTML-тег (rel = canonical)
  2. HTTP-заголовок
  3. Карта сайта
  4. 301 редирект *
  5. Внутренние ссылки

Для получения информации о плюсах и минусах каждого метода см. Официальную документацию Google. .

1. Установка канонических значений с помощью тегов HTML rel = «canonical»

Использование тега rel = canonical — это самый простой и очевидный способ указать канонический URL.

Просто добавьте следующий код в раздел любой повторяющейся страницы:

Пример

Допустим, у вас есть веб-сайт электронной коммерции, на котором продаются футболки. Вы хотите, чтобы https://yourstore.com/tshirts/black-tshirts/ был каноническим URL-адресом, даже если содержимое этой страницы доступно через другие URL-адреса (например, https://yourstore.com/offers/black- tshirts /)

Просто добавьте следующий канонический тег на любые повторяющиеся страницы:

Обратите внимание: если вы используете CMS, вам не нужно возиться с кодом своей страницы.Есть способ попроще.

Установка канонических тегов в WordPress:

Установите Yoast SEO, и канонические теги, ссылающиеся на себя, будут добавлены автоматически. Чтобы установить собственные канонические элементы, используйте раздел «Дополнительно» на каждом посте или странице.

Установка канонических тегов в Shopify:

Shopify по умолчанию добавляет саморегулирующиеся канонические URL-адреса для продуктов и сообщений в блогах. Чтобы задать собственные канонические URL-адреса, вам необходимо напрямую отредактировать файлы шаблона (.liquid).

В этой ветке есть информация о том, как это сделать.

Установка канонических тегов в Squarespace:

Squarespace по умолчанию также добавляет ссылки на себя. Но, как и в случае с Shopify, вам нужно отредактировать код напрямую, если вы хотите добавить собственный канонический URL.

2. Установка канонических тегов в заголовках HTTP

Для таких документов, как PDF, нет возможности размещать канонические теги в заголовке страницы, поскольку на странице нет раздела. В таких случаях вам нужно будет использовать заголовки HTTP для установки канонических значений. Вы также можете использовать канонические заголовки HTTP на стандартных веб-страницах.

Пример

Представьте, что мы создаем PDF-версию этого сообщения в блоге и размещаем его в подпапке нашего блога (ahrefs.com/blog/*).

Вот как может выглядеть наш HTTP-заголовок для этого файла:

 HTTP / 1.1 200 OK
Тип содержимого: приложение / pdf
Ссылка: ; rel = "canonical"
 

Рекомендуемая литература: Как добавить канонический тег в заголовки HTTP

3. Установка канонических значений в карты сайта

Google заявляет, что неканонические страницы не должны быть включены в карты сайта .Должны быть указаны только канонические URL-адреса. Это потому, что Google видит страницы, перечисленные в карте сайта, как предполагаемые канонические.

Однако они не всегда выбирают URL-адреса в файлах Sitemap как канонические.

Мы не гарантируем, что мы будем считать URL-адреса карты сайта каноническими, но это простой способ определения канонических ссылок для большого сайта, а карты сайта — полезный способ сообщить Google, какие страницы вы считаете наиболее важными. твой сайт.

4. Настройка канонических адресов с переадресацией 301

Используйте переадресацию 301, если вы хотите перенаправить трафик с повторяющегося URL-адреса на каноническую версию.

Пример

Предположим, ваша страница доступна по следующим URL-адресам:

  • example.com
  • example.com/index.php
  • example.com/home/

Выберите один URL-адрес в качестве канонического и перенаправьте другой URL есть.

Вы должны сделать то же самое для защищенных версий HTTPS / HTTP и www / без www вашего сайта. Выберите одну каноническую версию и перенаправьте остальные на эту версию.

Например, каноническая версия ahrefs.com — это HTTPS-URL без www ( https: // ahrefs.com ). Все следующие URL-адреса перенаправляют туда:

  • http://ahrefs.com/
  • http://www.ahrefs.com/
  • https://www.ahrefs.com/

Прочитать наше полное руководство по реализации 301 редиректа .

5. Внутренние ссылки

То, как вы переходите с одной страницы на другую по всему сайту, является сигналом канонизации.

Аналитик Google Webmaster Trends Джон Мюллер описывает сигналы, используемые для определения канонических URL, в этом видео #AskGoogleWebmasters:

https: // youtube.com / watch? v = 8j_hxBw5B4E

Чем более последовательны вы со всеми этими сигналами, тем легче поисковым системам будет определить ваш предпочтительный канонический URL. Как упоминал Джон в видео, Google также отдает предпочтение HTTPS, а не HTTP-URL-адресам, а также более красивым URL-адресам.

Распространенные ошибки канонизации, которых следует избегать

Канонизация — довольно сложная тема. Таким образом, существует множество недоразумений и заблуждений о том, как правильно канонизировать.

Вот некоторые распространенные ошибки, которые люди пытаются канонизировать:

Ошибка №1: блокирование канонизированного URL-адреса через robots.txt

Блокирование URL-адреса в robots.txt не позволяет Google сканировать его, а это означает, что они не могут видеть любые канонические теги на этой странице. Это, в свою очередь, не позволяет им переводить любую «ссылочную массу» с неканонических на канонические.

Ошибка № 2: установка для канонического URL значения «noindex»

Никогда не смешивайте noindex и rel = canonical.Это противоречивые инструкции.

Google обычно отдает предпочтение каноническому тегу над тегом noindex, как заявляет здесь Джон Мюллер. Но это все еще плохая практика. Если вы хотите не индексировать и канонизировать URL, используйте 301 редирект. В противном случае используйте rel = canonical.

Ошибка № 3: Установка кода состояния HTTP 4XX для канонического URL-адреса

Установка кода состояния HTTP 4XX для канонического URL-адреса имеет тот же эффект, что и использование тега noindex: Google не сможет увидеть канонический тег и перенести «ссылочный капитал» в каноническую версию.

Ошибка №4: Канонизация всех страниц с разбивкой на страницы в корневую страницу

Страницы с разбивкой на страницы не должны быть канонизированы до первой страницы с разбивкой на страницы в серии. Вместо этого на всех страницах с разбивкой на страницы следует использовать канонические ссылки с самими ссылками.

Почему? Как заявил на Reddit Джон Мюллер из Google, использование атрибута rel = canonical.

Главное, чего следует избегать, поскольку этот пост посвящен канонизации, — это использовать атрибут rel = canonical на странице 2, указывающий на страницу 1.Страница 2 не эквивалентна странице 1, поэтому такой атрибут rel = canonical будет неправильным.

Вы также должны использовать теги rel = prev / next для разбивки на страницы. Они больше не используются Google, но Bing все еще их использует.

Ошибка № 5: Не используются канонические теги с hreflang

Теги Hreflang используются для указания языкового и географического таргетинга веб-страницы.

Google заявляет, что при использовании hreflang вы должны «указать каноническую страницу на том же языке или наилучший возможный язык-замену, если канонического не существует для того же языка.”

Ошибка № 6: Наличие нескольких тегов rel = canonical

Наличие нескольких тегов rel = canonical приведет к их игнорированию со стороны Google. Во многих случаях это происходит из-за того, что теги вставляются в систему в разных точках, например, CMS, темой и плагином (ами). Вот почему многие плагины имеют возможность перезаписи, чтобы убедиться, что они являются единственным источником канонических тегов.

Другая область, где это может быть проблемой, — это канонические файлы, добавленные с помощью JavaScript.Если вы не указали канонический URL-адрес в ответе HTML, а затем добавили тег rel = canonical с помощью JavaScript, его следует учитывать при отображении страницы Google. Однако, если у вас есть каноническая версия, указанная в HTML, и вы заменили предпочтительную версию на JavaScript, вы отправляете смешанные сигналы в Google.

Ошибка № 7: Rel = canonical в

Rel = canonical должно появляться только в документа. Канонический тег в разделе страницы будет проигнорирован.

Проблема может возникнуть при синтаксическом анализе документа. В то время как исходный код страницы может иметь тег rel = canonical в правильном месте, когда страница фактически создается в браузере или отображается поисковой системой, много разных вещей, таких как незакрытые теги, внедренный JavaScript или в разделе может привести к преждевременному завершению во время рендеринга. В этих случаях канонический тег может быть случайно добавлен в отображаемой страницы, где он не будет соблюдаться.

Как найти и исправить проблемы канонизации на вашем сайте

При канонизации легко ошибиться, поэтому стоит регулярно проверять свой сайт на предмет проблем, связанных с каноническими тегами, и исправлять их как можно скорее.

Для этого вы можете использовать инструмент Ahrefs Site Audit.

Site Audit сканирует ваш сайт на предмет более 100 проблем SEO, включая те, которые связаны с каноническими тегами.

Вот двенадцать проблем, связанных с каноническими тегами, которые может обнаружить аудит сайта, и способы их устранения:

1.Канонический указывает на 4XX

Это предупреждение срабатывает, когда одна или несколько страниц канонизированы для URL-адреса 4XX.

Почему это проблема

Поисковые системы не индексируют страницы 4XX, потому что они не работают. В результате они игнорируют любые канонические теги, указывающие на такие страницы, и часто в конечном итоге индексируют неправильную (неканоническую) версию страницы.

Как исправить

Просмотрите затронутые страницы и замените мертвые (4XX) канонические ссылки ссылками на рабочие (200) страницы, которые вы хотите проиндексировать.

2. Канонические указывает на 5XX

Это предупреждение срабатывает, когда одна или несколько страниц канонизированы для URL-адреса 5XX.

Почему это проблема

Коды состояния HTTP 5XX указывают на проблемы с сервером, которые приводят к недоступности канонической страницы. Google вряд ли проиндексирует недоступные страницы, поэтому может игнорировать канонические.

Как исправить

Замените все ошибочные канонические URL-адреса действительными. Проверьте правильность конфигурации сервера, если указанное каноническое значение кажется правильным.Обратите внимание, что это может быть временной проблемой, если сканирование произошло, когда ваш сайт был остановлен на техническое обслуживание или сервер вашего сайта был перегружен.

3. Канонические точки для перенаправления

Это предупреждение срабатывает, когда одна или несколько страниц канонизированы для перенаправленного URL-адреса.

Почему это проблема

Канонические ссылки всегда должны указывать на наиболее авторитетную версию страницы. Это не относится к перенаправляемым URL-адресам. В результате поисковые системы могут неверно истолковать или игнорировать каноническое.

Как исправить

Замените канонические ссылки прямыми ссылками на наиболее авторитетную версию страницы (то есть на ту, которая возвращает код состояния HTTP 200 и не перенаправляет).

4. Дублирующиеся страницы без канонической версии.

Это предупреждение срабатывает, когда существует одна или несколько повторяющихся или очень похожих страниц, для которых не указана каноническая версия.

Почему это проблема

Поскольку каноническая версия не указана, Google попытается определить наиболее подходящую версию для отображения в результатах поиска.Возможно, это не та версия, которую вы хотите проиндексировать.

Как исправить

Просмотрите группы дубликатов. Выберите одну каноническую версию, которую следует проиндексировать в результатах поиска. Укажите это как каноническую версию для всех дубликатов (и добавьте к канонической версии канонический тег, ссылающийся на себя).

5. Hreflang to non-canonical

Это предупреждение срабатывает, когда одна или несколько страниц указывают неканонический URL-адрес в своих аннотациях hreflang.

Почему это проблема

Ссылки в тегах hreflang должны всегда указывать на канонические страницы.Ссылка на неканоническую версию страницы из аннотаций hreflang может запутать и ввести в заблуждение поисковые системы.

Как исправить

Замените ссылки в аннотациях hreflang затронутых страниц на их канонические.

6. Канонический URL-адрес не имеет входящих внутренних ссылок

Это предупреждение срабатывает, когда один или несколько указанных канонических URL-адресов не имеют внутренних входящих ссылок.

Почему это проблема

Канонические URL без внутренних ссылок недоступны для посетителей сайта.Вместо этого где-то на сайте они перенаправляются на неканоническую версию страницы.

Как исправить

Замените любые внутренние ссылки на канонические страницы прямыми ссылками на канонические.

7. Неканоническая страница в карте сайта

Это предупреждение срабатывает, когда одна или несколько неканонических страниц указаны в карте сайта.

Почему это проблема

Google заявляет, что вам не следует включать неканонические URL-адреса в карту сайта. Причина в том, что они видят страницы в файлах Sitemap как предполагаемые канонические.Вы должны перечислять только те страницы, которые хотите проиндексировать в файлах Sitemap.

Как исправить

Удалите неканонические URL-адреса из карты сайта.

8. Неканоническая страница указана как каноническая

Это предупреждение срабатывает, когда на одной или нескольких страницах указан канонический URL-адрес, который также является каноническим для другой страницы. Это создает «каноническую цепочку», где страница A канонизируется до страницы B, которая затем канонизируется до страницы C.

Почему это проблема

Канонические цепочки могут сбивать с толку и вводить в заблуждение поисковые системы.В результате они могут неверно истолковать или проигнорировать указанное каноническое.

Как исправить

Замените неканонические ссылки в канонических тегах затронутых страниц прямыми ссылками на канонические. Например, если страница A канонизируется на страницу B, которая затем канонизируется на страницу C, замените каноническую ссылку на странице A ссылкой на страницу C.

9. URL-адрес Open Graph не соответствует каноническому

Это предупреждение срабатывает, когда существует несоответствие между указанным каноническим URL-адресом и URL-адресом Open Graph на одной или нескольких страницах.

Почему это проблема

Если URL Open Graph не соответствует каноническому, неканоническая версия страницы будет опубликована в социальных сетях.

Как исправить

Замените URL-адрес Open Graph на затронутых страницах каноническим URL-адресом. Убедитесь, что два URL-адреса совпадают.

Примечание. URL-адреса

внутри тегов Open Graph должны быть абсолютными и использовать протоколы http: // или https: //, как в случае с каноническими.

10. Canonical from HTTPS to HTTP

Это предупреждение срабатывает, когда на одной или нескольких защищенных (HTTPS) страницах указывается небезопасная (HTTP) версия в качестве канонической.

Почему это проблема

HTTPS — это фактор ранжирования, поэтому имеет смысл указывать безопасные версии страниц как канонические там, где это возможно.

Как исправить

Перенаправить страницу HTTP на эквивалент HTTPS. Если это невозможно, добавьте ссылку rel = «canonical» из HTTP-версии страницы в HTTPS-версию.

Примечание.

Google также перечисляет внедрение HSTS в качестве потенциального решения.

11. Canonical from HTTP to HTTPS

Это предупреждение срабатывает, когда одна или несколько незащищенных (HTTP) страниц указывают безопасную (HTTPS) версию в качестве канонической.

Почему это проблема

HTTPS предпочтительнее HTTP. Наличие HTTP-версии страницы с последующим указанием версии HTTPS как канонической нелогично.

Примечание.

Скорее всего, это не вызовет серьезных проблем, но все же стоит исправить, если это возможно.
Как исправить

Реализуйте 301 редирект с HTTP на HTTPS. Вам также следует заменить все внутренние ссылки на HTTP-версию страницы ссылками непосредственно на HTTPS-версию.

12. Неканоническая страница получает органический трафик

Это предупреждение срабатывает, когда одна или несколько неканонических страниц появляются в результатах поиска и получают органический поисковый трафик (чего не должно происходить).

Почему это проблема

Либо ваши канонические теги настроены неправильно, либо Google решил игнорировать указанные канонические теги.

Как исправить

Убедитесь, что теги rel = canonical правильно настроены на всех страницах, о которых было сообщено. Если проблема не в этом, воспользуйтесь инструментом проверки URL в Google Search Console, чтобы узнать, считают ли они указанный канонический URL каноническим. Если есть несоответствие, выясните, почему это может быть так.

Заключительные мысли

Канонические теги не , а сложные.Поначалу их просто сложно осознать.

Просто помните, что канонические теги — это не директива, а сигнал для поисковых систем. Другими словами, они могут выбрать каноническую информацию, отличную от той, которую вы объявляете.

Вы можете использовать инструмент проверки URL-адресов в Google Search Console, чтобы увидеть как объявленные пользователем, так и выбранные Google канонические.

Это классификации, которые Google использует в отчете о статусе индексации в Google Search Console и относится к каноническим URL-адресам:

  • Альтернативная страница с правильным каноническим тегом. Здесь показаны страницы, на которых вы указали альтернативную страницу с каноническим тегом, и она была соблюдена. По сути, он работает, как и предполагалось, на выбранной вами странице.
  • Дубликат без выбранной пользователем каноники. Есть повторяющиеся страницы, и ни на одной из них не выбрана каноническая. В данном случае Google выбрал для вас один, поэтому, если он не тот, который вам больше нравится, вам следует добавить тег rel = canonical.
  • Дубликат, Google выбрал каноническое, отличное от пользовательского. Здесь показаны случаи, когда Google решил проигнорировать предложенную вами каноническую версию, но все же выбрал другую версию для отображения в индексе.
  • Повторяющийся, отправленный URL не выбран как канонический. Это также случай игнорирования сигнала канонизации (отправляемого в карту сайта). В этом наборе повторяющихся страниц нет явно отмеченного канонического URL-адреса, и в этом случае Google считает, что в индексе должен отображаться другой URL-адрес, помимо отправленного вами.

Есть вопросы? Дайте мне знать в комментариях или в Твиттере.

полное руководство по каноническим URL • Yoast

Йост де Валк

Йост де Валк — основатель и директор по продуктам Yoast. Он интернет-предприниматель, который незадолго до основания Yoast инвестировал и консультировал несколько стартапов. Его основная специализация — разработка программного обеспечения с открытым исходным кодом и цифровой маркетинг.

Канонический URL-адрес позволяет вам сообщать поисковым системам, что некоторые похожие URL-адреса на самом деле совпадают.Потому что иногда у вас есть продукты или контент, которые можно найти по нескольким URL-адресам или даже на нескольких веб-сайтах. Используя канонические URL-адреса (теги ссылок HTML с атрибутом rel = canonical), вы можете разместить их на своем сайте без ущерба для вашего рейтинга. В этом полном руководстве я расскажу, что такое канонические URL-адреса, когда их использовать и как предотвратить или исправить несколько распространенных ошибок!

Что такое канонический элемент ссылки?

Элемент rel = canonical, часто называемый «канонической ссылкой», представляет собой элемент HTML, который помогает веб-мастерам предотвращать проблемы с дублированием контента.Это достигается путем указания «канонического URL», «предпочтительной» версии веб-страницы. В большинстве случаев это исходный URL. Использование канонических URL улучшает SEO вашего сайта.

Идея проста. Если у вас есть несколько версий одного и того же контента, вы выбираете одну «каноническую» версию и указываете на нее поисковым системам. Это решает проблему дублирования контента, когда поисковые системы не знают, какую версию показывать в своих результатах.

Например, канонический URL-адрес нашей статьи WordPress SEO выглядит так:

    

Преимущества rel = canonical

для SEO

Выбор правильного канонического URL-адреса для каждого набора похожих URL-адресов улучшает SEO вашего сайта. Это связано с тем, что поисковая система знает, какая версия является канонической, и может считать все ссылки, указывающие на разные версии, как ссылки на каноническую версию. По идее, установка канонического значения аналогична перенаправлению 301, только без фактического перенаправления.

История rel = canonical

Элемент канонической ссылки был введен Google, Bing и Yahoo! в феврале 2009 г.Если вас интересует его история, я бы порекомендовал пост Мэтта Каттса от 2009 года. В этом посте вы найдете некоторую предысторию и ссылки на различные интересные статьи. Или посмотрите видео, в котором Мэтт представляет канонический элемент ссылки. Потому что, хотя идея проста, особенности ее использования часто немного сложнее.

Процесс канонизации

Ироническая сторона примечания

Термин «канонические» происходит от римско-католической традиции, где был составлен список священных книг, признанных подлинными и названных каноническими Евангелиями Нового Завета.Ирония заключается в том, что Римско-католической церкви потребовалось около 300 лет и многочисленные сражения, чтобы составить канонический список, и в конечном итоге они выбрали четыре версии одной и той же истории …

Если у вас есть несколько вариантов URL продукта, канонизация — это процесс выбора одного из них. К счастью, во многих случаях будет очевидно: один URL-адрес будет лучшим выбором, чем другие. Но в некоторых случаях это может быть не так очевидно. Не о чем беспокоиться. Даже тогда это все еще довольно просто: выберите один! Отказ от канонизации URL-адресов всегда на хуже, чем канонизация URL-адресов.

Как установить канонические URL-адреса

Предположим, у вас есть две версии одной и той же страницы, каждая с точно — 100% — одинаковым содержанием. Единственная разница в том, что они находятся в отдельных разделах вашего сайта. Из-за этого цвет фона и активного пункта меню разные — но это все. На обе версии есть ссылки с других сайтов, поэтому само содержание явно ценно. Так какую версию поисковые системы должны показывать в результатах?

Например, это могут быть их URL-адреса:

  • https: // пример.com / wordpress / seo-plugin /
  • https://example.com/wordpress/plugins/seo/

Правильный пример использования rel = canonical

Описанная выше ситуация возникает довольно часто, особенно во многих системах электронной коммерции. У продукта может быть несколько разных URL-адресов в зависимости от того, как вы туда попали. Но именно для этого была изобретена rel = canonical. В этом случае вы должны применить rel = canonical следующим образом:

  1. Выберите одну из двух страниц в качестве канонической версии.Это должна быть та версия, которую вы считаете наиболее важной. Если вам все равно, выберите тот, у которого больше всего ссылок или посетителей. Когда все эти факторы равны, бросьте монетку. Вам нужно выбрать.
  2. Добавить rel = canonical ссылку с неканонической страницы на каноническую. Итак, если мы выберем самый короткий URL-адрес в качестве нашего канонического URL-адреса, другой URL-адрес будет ссылаться на самый короткий URL-адрес в разделе страницы — например:
    

Это так просто! Ни больше ни меньше.

Это «слияние» двух страниц в одну с точки зрения поисковой системы. Это «мягкое перенаправление» без фактического перенаправления пользователя. Ссылки на оба URL-адреса теперь считаются единой канонической версией URL-адреса.

Хотите узнать больше об использовании rel = canonical на страницах категорий и продуктов вашего сайта электронной коммерции? Я также обсуждаю эту тему в этом видео Ask Yoast.

Установка канонического URL в Yoast SEO

С помощью функции тегов канонических URL-адресов плагина Yoast SEO вы можете легко добавить канонический URL-адрес в сообщение или страницу. Вам нужно сделать это только в том случае, если вы хотите изменить канонический URL на что-то отличное от URL-адреса текущей страницы. Yoast SEO уже отображает правильный канонический URL практически для любого типа страницы при установке WordPress.

Для сообщений, страниц и пользовательских типов сообщений вы можете редактировать канонический URL-адрес на вкладке «Дополнительно» метабокса Yoast SEO — или на боковой панели редактора блоков WordPress:

Установка канонического URL-адреса в Yoast SEO

Для категорий, тегов и других терминов таксономии вы можете изменить канонический URL-адрес в том же месте в метабоксе Yoast SEO или на боковой панели.Если у вас есть другие расширенные варианты использования, вы также можете использовать фильтр wpseo_canonical для изменения вывода Yoast SEO.

Когда следует использовать канонические URL-адреса?

Yoast Duplicate Post

Canonicals может помочь вам, когда на вашем сайте есть аналогичный контент на разных страницах. Создание этих страниц может занять у вас много времени. Если вы ищете простой способ дублировать сообщения или страницы, Yoast Duplicate Post — это плагин для вас!

Этот плагин может сэкономить вам массу времени, копируя такие вещи, как текст, избранное изображение, метаданные и оптимизацию SEO.Таким образом, вам не придется начинать каждую новую страницу с нуля. Только не забудьте установить каноническую версию, если ваша скопированная страница очень похожа на оригинал.

301 редирект или канонический

Если вы не уверены, делать 301 редирект или установить канонический, что делать? Ответ прост: вы всегда должны делать перенаправление, если нет технических причин не делать этого. Если вы не можете выполнить переадресацию, потому что это может навредить пользовательскому опыту или вызвать другие проблемы, установите канонический URL.Менеджер перенаправления в Yoast SEO Premium помогает настроить перенаправления.

Должна ли страница иметь канонический URL со ссылками на себя?

На изображении выше мы связываем неканоническую страницу с канонической версией. Но должна ли страница устанавливать для себя атрибут rel = canonical? Этот вопрос — очень обсуждаемая тема среди оптимизаторов поисковых систем. В Yoast мы настоятельно рекомендуем иметь элемент канонической ссылки на каждой странице, и Google подтвердил, что это лучший вариант. Это потому, что большинство CMS допускают параметры URL без изменения содержания.Таким образом, все эти URL-адреса будут отображать один и тот же контент:

  • https://example.com/wordpress/seo-plugin/
  • https://example.com/wordpress/seo-plugin/?isnt=it-awesome
  • https://example.com/wordpress/ seo-plugin /? cmpgn = twitter
  • https://example.com/wordpress/seo-plugin/?cmpgn=facebook

Проблема в том, что если у вас нет канонической ссылки на себя на странице, которая указывает на самую чистую версию URL-адреса, вы рискуете попасть под удар. А если вы не сделаете этого сами, кто-то другой может сделать это с вами и вызвать дублирование контента.Поэтому добавление канонических ссылок на себя к URL-адресам на вашем сайте — это хороший «защитный» ход SEO. К счастью, наш плагин Yoast SEO позаботится об этом за вас.

Междоменные канонические URL

Возможно, у вас есть один и тот же контент в нескольких доменах. Некоторые сайты или блоги самостоятельно переиздают статьи с других сайтов, поскольку считают, что их содержание актуально для их пользователей. В прошлом у нас были веб-сайты, на которых переиздавались статьи с Yoast.com ( с явного разрешения ).

Но если вы просмотрели HTML-код каждой из этих статей, то обнаружили бы ссылку rel = canonical, указывающую прямо на нашу исходную статью. Это означает, что все ссылки, указывающие на их версию статьи, учитываются при ранжировании нашей канонической версии. Они могут использовать наш контент, чтобы угодить своей аудитории, и мы получаем от этого явную выгоду. Таким образом, выигрывают все!

Неверные канонические URL-адреса: общие проблемы

Существует множество примеров того, как неправильная реализация rel = canonical может привести к серьезным проблемам.Я видел несколько сайтов, на которых канонический элемент на их домашней странице указывал на статью, а их домашняя страница исчезла из результатов поиска. Но это не все. Есть и другие вещи, которые нельзя делать с rel = canonical. Вот самые важные из них:

  • Не канонизировать разбитый на страницы архив на страницу 1. Атрибут rel = canonical на странице 2 должен указывать на страницу 2. Если вы укажете его на страницу 1, поисковые системы фактически не будут индексировать ссылки на этих более глубоких страницах архива.
  • Сделайте их на 100% конкретными.По разным причинам многие сайты используют ссылки, относящиеся к протоколу, то есть они оставляют бит http / https в своих URL-адресах. Не делайте этого для своих канонических изданий. У вас есть предпочтение, так что покажите его.
  • Создайте каноническую версию на основе URL-адреса запроса. Если вы используете такие переменные, как домен или URL-адрес запроса, используемые для доступа к текущей странице, при создании канонической страницы, вы делаете это неправильно. Ваш контент должен знать свои собственные URL-адреса. В противном случае, например, у вас может быть такой же фрагмент контента.com и www.example.com, и пусть каждый из них канонизирует для себя.
  • Множественные rel = canonical ссылки на странице вызывают хаос. Когда мы сталкиваемся с этим в плагинах WordPress, мы пытаемся связаться с разработчиком, который делает это, и научить их этого не делать, но это все равно происходит. А когда это произойдет, результаты совершенно непредсказуемы.

Подробнее: 6 распространенных ошибок SEO и как их избежать »

rel = канонические и социальные сети

Facebook и Twitter также соблюдают rel = canonical, и это может привести к странным ситуациям.Если вы поделитесь URL-адресом на Facebook с каноническим указанием в другом месте, Facebook поделится деталями из канонического URL-адреса. Фактически, если вы добавите кнопку «Мне нравится» на странице, имеющей каноническое указание в другом месте, она покажет такое же количество лайков для канонического URL, а не для текущего URL. Твиттер работает точно так же. Так что помните об этом при совместном использовании URL-адресов или при использовании этих кнопок.

Расширенное использование rel = canonical

Каноническая ссылка HTTP-заголовок

Google также поддерживает HTTP-заголовок канонической ссылки.Заголовок выглядит так:

 Ссылка: ; rel = "canonical" 

Канонические ссылки HTTP-заголовки могут быть очень полезны при канонизации файлов, таких как PDF-файлы, поэтому хорошо знать, что такая возможность существует.

Использование rel = canonical на не очень похожих страницах

Хотя я бы не рекомендовал это, вы, , можете очень агрессивно использовать атрибут rel = canonical. Google уважает это в почти смехотворной степени, когда вы можете канонизировать совершенно другой фрагмент контента для другого фрагмента контента.Однако, если Google поймает вас на этом, он перестанет доверять каноническим данным вашего сайта и причинит вам еще больший вред…

Использование rel = canonical в сочетании с hreflang

Мы также говорим о канонических значениях в нашем полном руководстве по hreflang. Это потому, что важно , чтобы при использовании hreflang каноническое значение каждого языка указывало на себя. Убедитесь, что вы хорошо понимаете, как использовать canonical при реализации hreflang; в противном случае вы можете убить всю реализацию hreflang.

Заключение: rel = canonical — это электроинструмент

Rel = canonical — мощный инструмент в наборе инструментов SEO. Процесс канонизации может иметь решающее значение и привести к значительным улучшениям SEO, особенно для крупных сайтов. Но, как и с любым другим электроинструментом, вы должны использовать его с умом, так как вы легко можете порезаться. Я надеюсь, что это руководство помогло вам понять этот мощный инструмент и понять, как (и когда) вы можете его использовать.

Использование канонических URL-адресов является важной частью технического SEO.Хотите знать, насколько соответствует техническая SEO вашего сайта? Мы создали технический тест на пригодность для SEO, который поможет вам понять, над чем вам нужно работать!

Продолжайте читать: WordPress SEO: полное руководство по повышению рейтинга сайтов WordPress »

Далее!

  • Событие Конференция онлайн 2021 14-15 октября 2021 г. Команда Yoast спонсирует онлайн-конференцию 2021 года, нажмите здесь, чтобы узнать, будем ли мы там, кто будет и многое другое! Все мероприятия, в которых мы будем участвовать »
  • Вебинар по SEO Yoast Вебинар по новостям SEO — 31 августа 2021 г. 31 августа 2021 г. Зарегистрируйтесь на наш веб-семинар по новостям SEO в августе 2021 года.Наши SEO-эксперты Джоно и Джуст расскажут вам о последних новостях Google и WordPress. Все вебинары Yoast SEO »

Руководство по каноническим тегам для новичков

Понимание того, как правильно использовать канонизацию и устанавливать канонические URL-адреса, является важным знанием для любого оптимизатора поисковых систем, а их неправильная реализация может вызвать широко распространенные проблемы, отрицательно влияющие на производительность вашего сайта.

Канонические теги были впервые представлены в 2009 году, чтобы помочь веб-мастерам преодолеть дублирующийся или очень похожий контент, доступный по нескольким URL-адресам.

Но чтобы правильно использовать канонические теги, вы должны понимать, что они собой представляют, как они работают и как их реализовать.

Руководство по каноническим тегам

Вот основные моменты, которые мы рассмотрим в этом руководстве:

Канонические теги, часто называемые rel = «canonical», позволяют сообщить поисковым системам, что указанный URL является главной копией страница. Они позволяют указать канонический URL-адрес для страницы. Каноническая ссылка позволяет веб-мастерам предотвратить проблемы с дублированием контента, указав «каноническую» или «предпочтительную» версию веб-страницы.

Но подождите, в чем разница между каноническими тегами и каноническими URL-адресами? И есть ли другие способы указать это?

Канонические теги

Канонический тег, находящийся в разделе исходного HTML-кода веб-страницы, выглядит следующим образом:

Они могут ссылаться на себя (когда канонический тег указывает на собственный URL-адрес страницы) или может ссылаться на URL-адрес другой страницы для объединения сигналов.

Часто мы видим, что терминология канонических тегов и URL-адресов используется взаимозаменяемо, хотя этого быть не должно.

Это происходит по той простой причине, что использование тега rel = «canonical» является наиболее часто используемым методом для установки канонических URL-адресов, однако он ни в коем случае не единственный.

Канонические URL-адреса

Итак, что такое каноническая ссылка? Каноническая ссылка — это URL-адрес, который выбирается в качестве «главного» URL-адреса для набора повторяющихся страниц.

Собственными словами Google:

Канонический URL-адрес — это URL-адрес страницы, которая, по мнению Google, является наиболее репрезентативной из набора повторяющихся страниц на вашем сайте.

— Справка Google Search Console

Вы можете указать предпочитаемый канонический URL. Однако Google может выбрать другую страницу по разным причинам.

Тем не менее, в большинстве случаев при правильной настройке в качестве канонического выбирается указанный вами URL.

Проще говоря, канонические URL-адреса определяют, какая страница обычно (за исключением случая, когда дубликат явно лучше подходит для пользователя, скажем, версия для мобильных устройств) будет отображаться в результатах поиска.

Канонический URL-адрес страницы может находиться в другом домене.

Как еще можно указать канонические URL-адреса?

Канонические теги — не единственный способ указать канонический URL-адрес, несмотря на то, что вы, скорее всего, будете его использовать.

Вы также можете установить canonicals:

  • , установив rel = canonical HTTP-заголовок для ответа.
  • В вашей карте сайта (однако, хотя все страницы, перечисленные в карте сайта, предлагаются как канонические; Google решит, какие страницы (если есть) страницы являются дубликатами).
  • Используя 301 редирект.

Тем не менее, хотя все эти способы рекомендованы Google, не все они подходят для использования в каждой ситуации, как мы рассмотрим ниже, и у каждого из них есть свои рекомендуемые причины для использования.

Для того, чтобы вы знали, установка канонических URL-адресов не является обязательным требованием, и в тех случаях, когда вы их не укажете, Google будет использовать другие сигналы для определения страницы, которая, по их мнению, является лучшей версией.

Однако рекомендуется эффективно использовать каноникализацию, чтобы иметь возможность контролировать то, как ваш сайт отображается в поисковых системах, и предотвращать проблемы, возникающие в результате дублирования контента.

Проверьте работоспособность вашего веб-сайта

С помощью инструмента аудита сайта SEMrush

Причины, по которым существует дублированный контент

Прежде чем мы рассмотрим причины, по которым вам следует использовать канонические URL-адреса и как указать их в самых популярных CMS, вам необходимо: понять, почему существует дублированный контент. Никто не собирается создавать дублированный контент на сайте.

Обычно это происходит, когда системы управления контентом создают несколько URL-адресов при запуске страницы, когда у вас есть разные индексируемые версии вашего сайта, есть альтернативные версии для разных типов устройств или используются динамические URL-адреса.

Взгляните на следующие URL-адреса и предположите, что для пользователя все они отображают одно и то же содержимое:

  1. https://www.website.com/category/product-a/
  2. https: // www.website.com/product-a/
  3. https://website.com/product-a/
  4. http://www.website.com/product-a/
  5. http://website.com/ product-a /
  6. https://m.website.com/product-a/
  7. https://www.website.com/product-a
  8. https://www.website.com / product-A /

Для поисковой системы это не одна страница контента, это восемь повторяющихся страниц:

  • URL-адреса №1 и №2 появляются в результате того, что CMS сохраняет URL-адреса продуктов как с названием категории и без него.
  • URL-адреса № 3, № 4 и № 5 являются результатом того, что сайт доступен как в версиях HTTP и HTTPS, так и в версиях с www и без www.
  • URL # 6 — это мобильная версия, которая находится на субдомене.
  • URL-адрес №7 — это версия URL-адреса №2 без косой черты.
  • URL-адрес № 8 использует заглавную букву «А» вместо строчной буквы, которая используется где-либо на сайте.

Вы также можете обнаружить дублированный контент по URL-адресам, например:

  • https://www.website.com/
  • https://www.website.com/index.php

Теперь посмотрим, как это легко дублировать контент?

Фактически, на многих сайтах есть эти проблемы, о которых вы даже не подозреваете, но канонические URL-адреса помогают поисковым системам идентифицировать различные варианты страницы как единый URL-адрес.

Почему вам следует использовать канонические URL-адреса для SEO

Канонические URL-адреса существуют, чтобы помочь вам справиться с проблемами дублирования контента, которые могут повлиять на производительность вашего сайта.

Но, более конкретно, существует ряд причин, по которым вы должны использовать канонические URL-адреса только как одну техническую область внимания SEO:

Укажите URL-адрес, который должен отображаться в результатах поиска

Когда вы устанавливаете канонический URL-адрес, вы указывают, какая версия страницы должна отображаться в поисковой выдаче.

Подумайте об этом так, на что вы с большей вероятностью нажмете?

  • https://www.domain.com/page-1/
  • https://www.domain.com/index.php?id=2

Скорее всего, первый.

Используйте канонические символы, чтобы указать URL-адрес, который должны ранжироваться поисковыми системами.

Объединение сигналов ссылок на повторяющихся или почти идентичных страницах

Если на вашем сайте есть повторяющиеся или почти идентичные страницы, есть вероятность, что отдельные URL-адреса могут получать ссылки из внешних источников.

Используйте канонические URL-адреса для объединения сигналов ссылок с нескольких страниц в один указанный вами URL-адрес.

Это само по себе может помочь вашему сайту в рейтинге, учитывая, что сигналы, которые в противном случае распределяются по нескольким URL-адресам, объединяются в одну более надежную страницу.

Управление синдицированным контентом

Нередко контент распространяется на разных веб-сайтах, чтобы представить его новой аудитории.

Чтобы предотвратить ранжирование повторяющихся страниц в выдаче и гарантировать, что ранжируется исходный фрагмент контента, вы можете использовать канонические URL-адреса для консолидации сигналов ранжирования.

Предотвратить сканирование повторяющихся страниц роботом Googlebot

Особенно, если вы работаете с большим веб-сайтом с большим количеством страниц, вы можете использовать канонические URL-адреса, чтобы гарантировать, что робот Googlebot тратит время на сканирование ваших новых страниц, а не на дублированные версии одного и того же на мобильных и мобильных устройствах. настольные версии, например.

Тем не менее, бюджеты сканирования не являются проблемой для большинства сайтов, если у вас нет сотен тысяч или более страниц.

Как правильно реализовать тег rel = canonical

На сегодняшний день наиболее распространенным способом указания канонических URL-адресов является использование тега rel = «canonical» в заголовке страницы.

Добавление тегов и HTML-кода может показаться сложным, если вы не разработчик, но большинство платформ CMS позволяют вам прямо из коробки указывать канонические элементы.

Установка канонического URL-адреса в Magento и Magento 2

Если вы используете магазин Magento 1, выполните следующие действия, чтобы указать канонические URL-адреса для продуктов и категорий.

Страница продукта Magento 1 Canonicals

После входа в панель администратора перейдите в Система> Конфигурация , выберите вкладку Каталог и откройте раздел Search Engine Optimizations :

The ‘Use Canonical Link Мета-тег для продуктов »должен быть установлен в« Да ».

Во многих случаях вы обнаружите, что это уже установлено на да , что означает, что вам не нужно ничего делать с этим.

Magento 1 Категория Canonicals

Вернитесь в раздел Search Engine Optimizations на странице каталога и найдите параметр «Использовать метатег Canonical Link для категорий».

Убедитесь, что установлено значение no , чтобы вы могли вручную указать канонический URL-адрес для категорий.

Перейдите на страницу редактирования любой категории, которую вы хотите канонизировать, найдите вкладку Custom Design и в поле Custom Layout Update и добавьте следующий код, не забудьте переключиться на свой собственный канонический URL.



canonical
https://www.website.com/page-a/

Magento 2 Canonicals

Если вы используете магазин Magento 2, выполните следующие действия, чтобы указать канонические URL-адреса на своем сайте.

После входа в панель администратора перейдите в Магазины> Настройки> Конфигурация , откройте раскрывающийся список Каталог , выберите Каталог и откройте вкладку Search Engine Optimization .

Изображение предоставлено Amasty.com

Если вы установите для параметра «Использовать канонические метатеги для категорий» значение Да, , страницы категорий вашего магазина будут настроены так, чтобы указывать канонический URL-адрес для полного URL-адреса категории, например http: //www.website.ru / category / product.html.

Если для параметра «Использовать канонические метатеги для продуктов» задано значение Да, , страницы продуктов вашего магазина будут настроены так, чтобы указывать канонический URL-адрес для имени домена / ключа URL-адреса продукта.

Даже если вы включите путь категории в URL-адрес для продуктов, он все равно будет канонизирован в имя-домена / URL-адрес продукта.

Рекомендуется выбрать Да , чтобы добавить канонические значения как для продуктов, так и для категорий.

Установка канонического URL-адреса в WordPress

Установка канонического URL-адреса в WordPress очень проста.Однако то, как их реализовать, зависит от того, какой плагин WordPress SEO вы используете.

Мы рассмотрим, как это сделать с помощью двух самых популярных плагинов — Yoast и RankMath.

Канонические теги с Yoast

Если вы используете Yoast, просто перейдите к параметрам Yoast SEO на любой странице или в публикации и разверните вкладку «Дополнительно».

Здесь вы найдете поле, в котором вы можете указать канонический URL страницы.

Канонические теги с RankMath

Если вы используете RankMath, это аналогичный способ реализации, описанный выше.

На любой странице или в сообщении перейдите на вкладку «Дополнительно» в мета-поле RankMath, и вы увидите возможность указать канонический URL-адрес для страницы.

Установка канонического URL в Wix

По умолчанию на страницах Wix используется канонический тег, ссылающийся на себя.

Если вам нужно изменить это, вы можете сделать это, перейдя к Меню и страницы , наведя курсор на соответствующую страницу и щелкнув значок показать больше , затем перейдите к Параметры SEO> Расширенный SEO и ‘ Добавить New Tag ‘под заголовком Custom Meta Tags .

Изображение предоставлено: Wix

Обязательно введите полный канонический тег, а не только URL-адрес.

Вы можете изменить свой канонический URL в этом коде:

Установка канонического URL на Shopify

Из box, с магазинами Shopify существует ряд проблем с поисковой оптимизацией, из-за которых важно понимать каннибализацию — при этом ключевой проблемой является то, что платформа позволяет одной странице продукта существовать по нескольким URL-адресам.

Взгляните на руководство Shopify, и вы увидите, что при разработке темы Shopify вы можете использовать объект {{canonical_url}} для вывода канонического URL-адреса текущей страницы.

Но давайте проясним, что вы не можете указать собственные канонические URL-адреса так же, как в Magento, WordPress или Wix.

Проблема в том, что по умолчанию Shopify создает URL-адреса продуктов, которые обновляются динамически, так что они содержат коллекцию, из которой они происходят.

Вы можете найти один продукт по следующим URL-адресам:

  • https: // www.website.com/products/product-a
  • https://www.website.com/featured-collection/products/product-a
  • https://www.website.com/sales-collection/products/product- a

Все они возвращают одну и ту же страницу продукта, только по разным URL-адресам, и хотя канонические теги Shopify правильно преобразовываются в правильный канонический URL-адрес, вы также найдете внутренние ссылки, указывающие на повторяющиеся версии, что усугубляет путаницу.

Вы можете очистить это, выполнив шаги, описанные в этом замечательном руководстве от Path Interactive.

Загляните в жидкие файлы вашей темы и найдите следующий код, который чаще всего встречается в файле collection-template.liquid:

{{product.url | inside: collection}}

Отредактируйте это на:

{{product.url}}

Теперь вы должны убедиться, что ваши канонические теги и внутренние ссылки верны.

Альтернативой использованию канонических тегов является реализация HTTP-заголовка rel = «canonical».

Это подход к реализации, который необходимо использовать для указания канонического URL-адреса для PDF-файлов или других документов, отличных от HTML.

Чтобы реализовать это, вам необходимо иметь доступ к файлу .htaccess вашего сайта и указать канонический URL, используя следующий код:


Header add Link "; rel = \ "canonical \" "

Использование переадресации 301 для указания канонических URL-адресов

Google заявляет, что вы можете использовать переадресацию 301 для указания канонические URL-адреса.

Однако давайте проясним, что если вы используете 301 редирект, фактически будет существовать только канонический URL. Другие повторяющиеся версии будут перенаправлены на это.

Тем не менее, это, как правило, лучший способ решить проблемы с дублированием контента:

  • HTTP и HTTPS
  • Non-WWW и WWW
  • Trailing-Slash и Non-Trailing Slash URL-адреса

На одностраничной основе , Необходимо более внимательно относиться к этому, и обычно канонические теги — лучшее решение, если вы не можете уверенно удалить и перенаправить страницу.

Канонические URL-адреса в файлах Sitemap

Проще говоря, будьте осторожны, чтобы не включать неканонические URL-адреса в карты сайта, поскольку Google предполагает, что URL-адреса, указанные в карте сайта, являются каноническими версиями.

Указание канонических URL-адресов не гарантируется, но рекомендуется учитывать при структурировании карт сайта.

Рекомендации по использованию канонических тегов

Внедрение канонических тегов не должно быть сложной задачей, и как только вы поймете несколько простых рекомендаций, вы обнаружите, что обнаружение и устранение проблем с дублированным контентом становится намного проще.

При реализации канонических URL-адресов всегда обязательно:

Указывайте только один канонический URL-адрес на страницу

Вам следует указывать только один канонический URL-адрес на странице, иначе вы, скорее всего, обнаружите, что все они игнорируются.

Укажите правильный протокол домена

Если ваш сайт использует протокол HTTPS, убедитесь, что правильно указали его как свой канонический URL. Ссылка на неправильный протокол — это легко сделать ошибку, поэтому обязательно проверьте, не происходит ли это, чтобы иметь возможность поймать его, прежде чем это станет проблемой.

Укажите либо завершающую косую черту, либо URL-адреса без косой черты.

Обратите внимание, использует ли ваш сайт конечную косую черту или нет в конце URL-адресов, и убедитесь, что таким образом правильно ссылаетесь на свой канонический URL.

Укажите URL без WWW или WWW

Версии URL без WWW и WWW рассматриваются поисковыми системами как дублирующиеся страницы; поэтому обязательно укажите правильный.

Использовать абсолютные URL-адреса

Для ссылки на канонические теги следует использовать абсолютные, а не относительные URL-адреса, чтобы гарантировать их правильную интерпретацию.

Это означает, что вы должны использовать:

А не:

<ссылка rel = "canonical" href = "/ page-a /" />

Использовать канонические URL-адреса со ссылками на себя, если они не канонизированы на другой URL-адрес

Хотя это не является обязательным требованием, вы всегда должны быть уверены в том, что реализуете самообслуживание. ссылка на канонические URL-адреса, когда страница не канонизируется на другой URL-адрес.

Здесь канонический тег страницы ссылается на себя.

Нередко случаются непреднамеренные ошибки при реализации канонических тегов, и вот некоторые из наиболее распространенных из них.

Канонизация для переадресации 301

Будьте осторожны, чтобы не канонизировать URL-адрес, который затем перенаправляется, вместо этого вам следует установить канонический URL-адрес в качестве цели перенаправления.

Канонизация в неправильный протокол домена

Если ваш сайт работает по протоколу HTTPS, будьте осторожны, чтобы случайно не задать канонические URL-адреса с помощью HTTP.

Канонизация до нерелевантного содержания

Вы не должны канонизировать свои URL-адреса для содержания, которое не является дубликатом или почти идентичным.

Иногда мы видим, что оптимизаторы поисковых систем пытаются передавать сигналы ссылок через канонические теги из несвязанного контента, чтобы попытаться повысить рейтинг — это не тот способ, которым следует использовать каноникализацию, и ее следует избегать любой ценой.

Установка нескольких канонических URL-адресов

Следует использовать только один канонический тег или указать один канонический URL-адрес для каждой страницы, в противном случае вполне вероятно, что все будут проигнорированы.

Будьте осторожны, чтобы случайно не включить два канонических тега в вашей страницы, так как это может иногда происходить при попытке переопределить значения по умолчанию в некоторых CMS.

Нельзя отрицать, что разбивка на страницы, если она реализована неправильно, может привести к дублированию контента. Но канонизация всех URL-адресов в серии обратно на первую страницу — не всегда лучшее решение.

Скорее, вы должны превратить их в каноническую страницу для просмотра всех.

Чтобы найти какие-либо проблемы, связанные с канонизацией, вам необходимо проверить канонические теги вашего сайта.

Это можно сделать с помощью инструмента SEMrush Site Audit. Когда вы запустите отчет об аудите своего веб-сайта, вы обнаружите ряд проверок, связанных с каноническими тегами.

Давайте посмотрим, что это такое и как исправить проблемы.

AMP-страницы не имеют канонических тегов

  • Если на ваших AMP-страницах нет канонических тегов, инструмент Site Audit пометит это как проблему.
  • Важно, чтобы канонизация существовала между AMP и не-AMP версиями вашей страницы.
  • Это можно исправить, добавив тег rel = «canonical» в раздел каждой страницы AMP.

Нет перенаправления или канонического перехода на домашнюю страницу HTTPS с версии HTTP

Если к вашему сайту можно получить доступ как по HTTPS, так и по HTTP-версиям, вы столкнетесь с проблемами с дублированным контентом, и это будет отмечено в аудите сайта.

Это можно исправить, перенаправив 301 одну версию на правильную версию или добавив канонический тег, который ссылается на версию HTTPS на страницах HTTP.

Страницы с неработающей канонической ссылкой

Если на ваших страницах есть неработающие канонические ссылки, они не будут восприниматься как канонические URL-адреса.

Эта ошибка может означать, что ваши канонические ссылки указывают на несуществующие веб-страницы и, как следствие, усложняют процесс сканирования и индексации вашего контента.

Если вы обнаружите страницы с неработающими каноническими ссылками, обязательно обновите их на правильные канонические URL-адреса.

Страницы имеют несколько канонических URL-адресов

  • Вы увидите эту ошибку, если на странице имеется несколько канонических URL-адресов.
  • Чтобы исправить это, вам нужно удалить повторяющиеся теги и оставить только один на месте.

Канонизация — одна из наиболее важных концепций, которую вы должны понимать как оптимизатор поисковых систем, и ее неправильное использование может отрицательно сказаться на производительности вашего сайта.

Тем не менее, как только вы поймете, как он работает и что он делает, а также как находить и устранять проблемы, у вас будет отличная возможность убедиться, что вы сможете эффективно использовать его и избавить свой сайт от дублированного контента.

Каноникализация Google SEO Mythbusting

Что такое канонический тег и как он может помочь вашему SEO?

Знаете ли вы, почему ваш веб-сайт занимает такое же место на странице результатов поисковой системы? Хотели бы вы улучшить рейтинг своего сайта?

Было бы неплохо, если бы Google предоставил полный отчет о том, почему веб-сайт занимает такое же место. К сожалению, даже у самых опытных специалистов по SEO нет полного листа ответов.Однако со временем Google и другие поисковые системы предоставляют общественности информацию о том, как они могут улучшить свой поисковый рейтинг путем внесения технических изменений в свой веб-сайт. Одним из самых значительных достижений этих выпусков, и по-прежнему остается одним из самых непонятых, является разработка канонического тега.

Что делает канонический тег?

Канонический тег определяет URL-адрес источника (или страницу с исходным содержанием) данной страницы для поисковой системы, такой как Google.Канонические теги используются для объявления отдельной страницы как ее собственного источника или для дублирования страниц для ссылки на их исходную / исходную страницу. Поисковые системы используют канонический тег для борьбы с проблемами дублирования контента и присваивают значение рейтинга в поисковых системах для этого контента странице, обозначенной как URL « источник ».

Почему канонические теги важны?

Дублирующийся контент — большой запрет для поисковых систем. Наличие на вашем веб-сайте страниц с идентичным или очень похожим содержанием рассматривается как отрицательный фактор и может использоваться Google для обесценивания вашего веб-сайта при определении рейтинга.Если вы используете https на своем сайте, используете систему управления контентом, такую ​​как WordPress или Drupal, или запускаете веб-сайт электронной коммерции, комбинация разных URL-адресов, которые люди могут использовать для доступа к вашему веб-сайту, открывает вам серьезную уязвимость SEO, если ее не устранить должным образом. Правильно применяя канонические теги к страницам своего сайта, вы можете избежать этой ловушки и в полной мере воспользоваться как надежным сайтом, так и оптимизированными методами поисковой оптимизации.

Как применить канонический тег?

На страницах, которые вы хотите, чтобы Google распознал как канонические, добавьте тег ссылки в заголовок HTML-кода.Например, чтобы обозначить www.LTnow.com каноническим тегом, код будет выглядеть так:

Промойте и повторите для каждой страницы вашего сайта, которую вы хотите сделать канонической. Опять же, использование системы управления контентом, такой как WordPress, может упростить эти усилия.

На каких страницах я должен разместить канонический тег?

Столько, сколько необходимо. Посещения из социальных сетей, внутренний поиск по сайту, реферальные ссылки и другие входящие ссылки — все это может привести к созданию уникального URL-адреса, который может негативно повлиять на рейтинг вашего сайта.Кроме того, многие системы управления контентом позволяют использовать несколько URL-адресов для доступа к одному и тому же контенту. Все эти пути можно сканировать, и Google потенциально может идентифицировать их как отдельные страницы с дублированным содержанием.

Если вы не уверены, влияют ли проблемы с дублированным контентом на вашу SEO-оптимизацию, мы можем провести полный SEO-аудит вашего сайта, чтобы выявить проблемы, которые влияют на то, как ваш сайт сканируется и занимает лидирующие позиции. Как только вы узнаете, в чем заключаются проблемы, вы можете приступить к их устранению.Свяжитесь с нами, и мы сразу же приступим к работе!

Что, почему и как канонические теги и URL-адреса

«Это канон!»

Возможно, вы слышали эту фразу для описания творческого произведения, которое остается верным оригинальному произведению или вымышленной вселенной.

Если вы знакомы с каноном, вы хорошо на пути к пониманию канонизации и того, как она влияет на веб-страницы.

Здесь давайте разберемся, что такое канонизация, почему это важно для SEO и как добавить тег на свой веб-сайт.

Что такое каноникализация?

Canonicalization объявляет исходную или предпочтительную веб-страницу, что помогает объединить повторяющиеся страницы для сканирования.

Без указания канонического URL-адреса поисковые роботы могут сканировать и индексировать несколько версий вашей веб-страницы. Google указывает, что он будет реже сканировать неканонические страницы, чтобы снизить нагрузку сканирования на ваш сайт.

Менее частое сканирование некачественных повторяющихся страниц означает, что вместо этого можно установить приоритет для сканирования более важных страниц.

Хорошо, но зачем нам намеренно дублировать контент? Ну … когда-нибудь публиковали свой контент на своем веб-сайте, а также на Medium? Или, возможно, после гостевой публикации вы также разместите версию сообщения в блоге на своем веб-сайте.

Для этого вы должны ссылаться на исходную версию как на канонический URL. Канонические URL-адреса могут ссылаться на разные домены — это означает, что канонические URL-адреса могут находиться на другом веб-сайте.

Даже если вы не создаете активно дублирующиеся страницы для многоканального продвижения, дублирование происходит естественным образом из-за разных частей веб-адреса.Использует ли ваш сайт безопасный протокол, например HTTPS? Тогда у вас может быть HTTP- и HTTPS-версия вашей веб-страницы.

То же самое с www и без www. Используется ли на вашем веб-сайте косая черта в конце или нет? Если ваш веб-сайт не всегда перенаправляет на предпочтительную версию вашей страницы (безопасную или нет, www или нет, и завершающую косую черту или нет), может произойти дублирование.

Даже если вы форсируете предпочтительную версию с помощью перенаправления, параметры запроса, используемые для отслеживания посещений или фильтрации просмотров на странице, также могут выглядеть как отдельные URL-адреса для поисковых роботов.Объявление канонического URL-адреса указывает поисковым роботам игнорировать параметры запроса или другие версии URL-адреса.

Что такое канонический URL?

Элемент внешнего ресурса определяет отношения между текущей страницей и другими ресурсами. Атрибут rel используется в теге для обозначения типа связи. Некоторые распространенные типы ссылок включают «предыдущая» и «следующая» для разбивки на страницы, «таблица стилей» и, конечно же, «каноническая».

Тег использует атрибут href для установки URL-адреса, который служит каноническим для активной страницы.Хотя это и предназначены для ссылок на внешние ресурсы, канонический URL-адрес может быть «самодостаточным», что означает, что это точная версия текущей страницы. Использование канонических ссылок с самими ссылками помогает уменьшить ненужное сканирование нежелательных версий вашей страницы, если вы всегда используете абсолютный URL в качестве значения href.

В Google Search Console вы можете использовать инструмент Inspect URL, чтобы понять, что Google считает каноническим URL, даже если вы его не установили. Даже если вы объявили канонический URL-адрес, Google иногда все равно выбирает другой URL-адрес, указанный как «выбранный Google канонический.»По этой причине канонизация не является гарантией того, что Google выберет вашу предпочтительную версию или что другие версии не будут проиндексированы.

Как добавить канонический тег

Добавить канонический тег в HTML-документ

Как уже упоминалось, вы можете использовать элемент для установки вашего канонического URL. Элементы ссылки — это самозакрывающиеся теги. Атрибуты rel и href обязательны. .

Чтобы добавить каноническую ссылку в документ HTML, добавьте элемент в элемент.Убедитесь, что для атрибута rel установлено значение canonical. Не забудьте указать абсолютный URL вашего предпочтительного веб-адреса в качестве значения атрибута href.

Добавить канонический тег в HubSpot

В HubSpot вы можете установить свой канонический URL-адрес на отдельной странице или в настройках публикации в разделе «Дополнительные параметры». Подробнее о параметрах настройки канонических URL.

Добавить канонический тег в WordPress

стандартных плагинов WordPress для SEO, включая Yoast и RankMath, упрощает настройку канонических URL-адресов, особенно для нескольких страниц. Если вы немного более продвинуты и не хотите добавлять другой плагин, вы также можете обновить канонический URL-адрес с помощью хуков WordPress.

1. Использование ловушки get_canonical_url.

Хук фильтра WordPress позволяет изменять данные во время выполнения WordPress. Функция add_filter () принимает как минимум два параметра: тег и функцию обратного вызова.Тег будет ловушкой, в данном случае get_canonical_url.

Параметр функции обратного вызова будет именем создаваемой вами функции, которая возвращает канонический URL. Функция обратного вызова может использовать условные операторы для соответствия определенным сообщениям. Обратитесь к этому примеру ответа Stack Exchange.

В этом примере функция обратного вызова «wpse_302620_canonical_url» использует оператор if для возврата нового канонического значения, когда идентификатор сообщения, который передается в качестве аргумента функции, совпадает с конкретным сообщением.Имея это в виду, это решение кажется исправлением для нескольких сообщений или типов сообщений, но может плохо масштабироваться. Чтобы применить к нескольким страницам, вероятно, лучшим вариантом будет использование плагина.

2. Использование подключаемого модуля Yoast.

Если вы используете Yoast, вы можете применять канонические URL-адреса к сообщениям, страницам и таксономиям. Выберите тип контента, который вы хотите отредактировать, в левом меню, затем «отредактируйте» отдельный фрагмент контента. В мета-поле Yoast SEO переключите раздел «Дополнительно». Добавьте предпочтительный веб-адрес в поле «Канонический URL» и сохраните.Узнайте больше о настройках канонических URL-адресов Yoast.

3. Использование подключаемого модуля Rank Math.

При редактировании конкретной страницы или публикации выберите вкладку «Дополнительно» в Rank Math. Добавьте предпочтительный веб-адрес в поле «Канонический URL» и сохраните. Узнайте больше о настройке канонических URL-адресов в Rank Math.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *