Что такое атрибут rel canonical и как с ним работать
Содержание:
- Что такое rel=“canonical” и чего для он нужен?
- В каких случаях необходимы канонические ссылки
- Как правильно использовать rel=canonical
- Проверка корректности настройки
- Основные ошибки
- Заключение
В этой статье мы выясним, для чего нужен атрибут rel=“canonical”, как его используют и как можно оптимизировать его работу.
Что такое rel=“canonical” и чего для он нужен?
Этот атрибут является одним из основных способов борьбы с дублирующимся контентом. Если разместить его между тегами на любой html-странице, то поисковые роботы автоматически будут считать ее канонической и она будет иметь максимальный приоритет. Отмеченная таким образом страница попадет в поисковую выдачу и к ней перейдет весь ссылочный вес и прочие характеристики страниц с аналогичным содержанием.
Часто бывает, что на сайте есть или полностью идентичный, или схожий контент, доступный по разным url-адресам. С помощью атрибута rel=“canonical” можно дать команду поисковикам всегда указывать на ту страницу, которая является предпочтительной для индексации.
В каких случаях необходимы канонические ссылки
Для профилактики дублирования
Наиболее часто встречающиеся примеры:
- дубли, возникающие из-за UTM-меток /*utm_content=, /*utm_term=, /*utm_medium=, *utm_source=, /*utm_campaign=
- дубли, возникающие из-за особенностей CMS-движка (могут появляться уже в процессе работы ресурса)
- страницы сортировок /*sort, asc, desc, list=*
- другие страницы с GET-параметрами в url-адресе
В таких случаях нужно добавлять атрибут каноничности на все статистические страницы.
Для страниц с похожим контентом и разным url-адресом
Очень актуально для интернет-магазинов. Например, единицы товара внутри одной серии могут различаться лишь расцветкой, т.е. 99% контента страниц по ним будет полностью совпадать. Еще один вариант – товар, расположенный в разных категориях одновременно.
В таком случае со всех страниц нужно указать ссылку на приоритетную (это может быть страница с товаром самой популярной расцветки или самой логичной категории).
Для страниц пагинации (при наличии опции «Показать все»)
На каждой странице пагинации нужно указать каноническую страницу «Показать все», иначе они будут считаться идентичными по контенту. Таким образом, для многочисленных страниц типа https://site.ru/category-1/page-2 и https://site.ru/category-1/page-3 каноническим url-адресом следует указывать .
Читайте также:
Что такое бэклинки сайта и для чего нужны
Как правильно использовать rel=canonical
- Между тегами html-страницы. Это самый популярный способ. Между тегами на «дочерних» страницах указывается полный url-адрес канонической ссылки. Единственный подводный камень – после атрибута rel=“canonical” рекомендуется использовать абсолютные, а не относительные ссылки, иначе повышается вероятность ошибок в link-элементах.
- В файле Sitemap. Многие руководства на вопрос «как прописать rel=“canonical”» первым делом предлагают использовать XML-карту сайта. В файл Sitemap можно внести канонические ссылки для любой страницы, причем, в отличие от предыдущего метода, можно сделать это сразу для многих страниц, не редактируя каждую в отдельности. Актуально для крупных ресурсов. Но здесь тоже есть вероятная проблема – поисковики могут игнорировать атрибут каноничности, внесенный в карту сайта, поэтому лучше сначала попробовать на одной странице, а только потом тратить время на внесение всех остальных.
- В заголовке HTTP. Первые два способа перекрывают почти все потребности, но где прописывать rel=“canonical”, если у вас не страница html-формата, а что-то другое – например, pdf-файлы? В таком случае единственный вариант – указать каноничную ссылку в http-заголовке. Тогда, если на сайте обнаружится дубль файла, сервер сможет определить каноничный первоисточник.
Специалисты не рекомендуют использовать этот метод для html-страниц – для них он может привести к ошибкам. - С помощью плагина. Чтобы не возиться с ручным внесением каноничных ссылок, было создано множество плагинов, автоматизирующих процесс. Например, для WordPress можно настроить каноничность с помощью Yoast SEO, в OpenCart – в настройках CMS, а в Joomla – через функцию SEF.
Проверка корректности настройки
Один из самых популярных методов анализа – программа Screaming Frog SEO Spider. С ее помощью можно выяснить, какие страницы на сайте содержат атрибут rel=“canonical”, а какие являются каноническими.
Основные ошибки
- Несколько ссылок с одной страницы. Можно указать только один канонический вариант, если же их будет несколько – сервер верифицирует первый.
- Разные канонические ссылки. Ситуация возможна, если вы используете атрибут сразу несколькими способами – например, через карту сайта и через редактуру html-страницы.
- Каноническая ссылка выдает ошибку 404. Необходимо проверить, указана ли она корректно.
- Каноническая ссылка находится на другом домене. Это недопустимая ситуация, поскольку поисковики не смогут корректно с ней работать и она фактически станет бесполезной.
- Ссылка со всех страниц пагинации на первую страницу. Это приводит к невозможности индексировать остальные страницы. Канонической ссылкой для страниц пагинации должна быть либо она сама, либо вариация с «Показать все», как было описано выше.
Заключение
Указание канонических ссылок с помощью атрибута rel=“canonical” – безусловно, очень удобный инструмент для оптимизации вашего сайта с точки зрения поисковых роботов. Его верное использование приведет к повышение ранга сайта в поисковой выдаче, ускорит индексацию и спасет от фильтров поисковиков из-за дублирования контента.
Для чего нужен rel canonical и как его правильно указать
Уникальность страниц — один из ключевых факторов для продвижения. Любой SEO-специалист, хоть опытный, хоть начинающий, знает, что за идентичный контент поисковые системы могут наказывать санкциями. А выводить сайт из-под санкций ох как не просто. Поэтому лучше до этого вовсе не доводить.
Однако бывает такое, что контент не совсем повторяется. Например, в интернет-магазине на одной страничке включена фильтрация товаров по популярности, а на другой — по цене. Вроде как товар будет показываться разный, но страницы всё равно будут считаться одинаковыми. Здесь и пригодится тег rel=»canonical». Он сообщает краулеру поисковика, какой адрес считать каноническим.
Канонической считается та страница, которая содержит основной URL. Тег rel=»canonical» прописывают в коде дублирующих страниц и указывают в нём URL основной, чтобы робот понимал, какую версию стоит индексировать и ранжировать.
Для чего прописывать canonical?
Это требуется делать по нескольким причинам:
- чтобы не попасть под санкции из-за неуникального контента;
- правильно передавать ссылочную массу;
- чтобы выбрать страницу для ранжирования;
- не расходовать краулинговый бюджет на дубли.
Допустим, есть страница, открывающаяся по трём разным ссылкам:
https://qupe.ru/blog/?id=123
https://qupe.ru/blog/novosti/seo
https://qupe.ru/blog/seo
Нам нужно, чтобы в выдачу попадала версия https://qupe.ru/blog/novosti/seo. Именно она должна получать весь ссылочный вес и другие сигналы, то есть быть канонической. В такой ситуации на самой этой страничке никаких действий нам делать не надо, а вот в коде дублей необходимо прописать атрибут. Вставляем туда такую строчку:
Теперь поисковые системы знают, что https://qupe.ru/blog/?id=123 и https://qupe.ru/blog/seo — это неканонические страницы, соответственно, участвовать в ранжировании они не будут.
Попадают ли неканонические страницы в индекс?
Да, они могут оказаться в результатах выдачи. Однако такое может произойти только тогда, когда они релевантны поисковому запросу, а их содержимое на момент сканирования имело существенные отличия от основной версии.
Увидеть их можно в Яндекс.Вебмастере. Для этого необходимо открыть «Страницы в поиске» и найти строчки, в которых стоит отметка «Неканоническая».
Если с Яндексом всё понятно, то Google лёгкий путь выбирать не стал. С одной стороны, поисковая система говорит, что может признавать URL, который указан как канонический. Но с другой — она может просто это проигнорировать.
Всё потому, что тег rel=»canonical» — всего лишь рекомендация, а не руководство к действию. Соответственно, если Google решит, что неканоническая страница более релевантна, он покажет именно её. Однако указывать атрибут всё же стоит, так как это снижает вероятность того, что поисковик самостоятельно выберет основной не ту версию.
Канонические страницы в любом случае попадают в выдачу чаще. Если же ошибиться с настройкой атрибута, велик риск возникновения проблем с индексацией.
Когда необходим канонический тег?
Пользоваться rel=»canonical» имеет смысл, когда по разным ссылкам открывается идентичное содержимое. Рассмотрим все случаи.
Дубли
Дубли со схожим содержимым могут генерироваться CMS. Такие есть на любых сайтах интернет-магазинов, которые дают возможность настраивать параметры поиска. Проще говоря, если в каталоге есть фильтры или любая другая сортировка.
Например, у вас магазин одежды и там есть одинаковые модели костюма, представленные в разных цветах. Можно взять лидера продаж и сделать его каноническим. Остальные расцветки будут по-прежнему доступны пользователям, но в выдаче будет показываться именно самый популярный, ссылочный вес будет идти тоже на страницу с этим товаром.
Страницы пагинации
Когда вы переключаете странички каталога, создаются дубли. Часто для всех страниц пагинации основной указывают первую. Но это неправильно, потому что в таком случае под индексацию попадёт только она. Есть три способа решения проблемы:
- При наличии кнопки «Показать все» версию, содержащую все товары, и стоит сделать канонической. Просто в теге rel=»canonical» на всех других страницах пагинации необходимо указать её.
- Если кнопка «Показать все» отсутствует, стоит каждую страничку сделать канонической.
- Способ для тех, кто по тем или иным причинам не хочет делать все странички пагинации каноническими. Тегом rel=»canonical» тогда лучше не пользоваться, а страницы пагинации закрыть в noindex, follow. При этом необходимо применить dissalow в robots для /page. Тогда странички не проиндексируются, но будут открываться по ссылкам.
HTTPS, HTTP, www
На одну страницу могут вести три типа ссылок: http://url, http://www.url и https://www.url. Однако поисковики будут расценивать их как три разные странички, у которых идентичное содержимое. Поэтому здесь canonical тоже имеет смысл указать.
Мобильный URL
Мобильный трафик сейчас превосходит десктопный, по этой причине все сайты сейчас разрабатываются сразу с адаптивкой. Google тоже давно уже использует мобильную индексацию. То есть при обходе он ориентируется прежде всего на мобайл-версию сайта. В этой ситуации рекомендуется у адаптивной версии страничек проставить тег rel=»canonical», отсылающий к дескстопной как основной. А для десктопной необходимо прописать тег rel=»alternate», который будет вести на мобильную.
URL страны
Иногда для определённой страны делают несколько идентичных страниц с отличными URL. Однако контент там абсолютно одинаковый или имеет всего лишь несущественные различия. Здесь тоже следует выбрать одну версию, которая будет канонической, а на всех остальных прописать canonical. Если версии сделаны на разных языках, но содержимое одинаково, используют атрибут hreflang.
Регистры
Поисковые системы могут счесть разными два одинаковых адреса, которые были написаны с использованием разных регистров. Соответственно, необходимо следить, чтобы при назначении URL использовался только нижний регистр.
Как настроить атрибут
Существует несколько вариантов настройки атрибута:
CMS
Сейчас CMS обычно имеют интегрированную функцию для настройки канонических страниц или дают возможность устанавливать соответствующие плагины. Например, на WordPress есть плагин Yoast SEO, в Joomla есть возможность активировать функцию SEF (начиная с 3 версии) и т.д.
Указать между тегами HTML-страницы
Наиболее простой и «употребительный» способ — вписать rel=»canonical» в секцию любого дубля.
В заголовке HTTP
У некоторых документов отсутствует . К таким относится, например, PDF. Соответственно, прописать атрибут туда не выйдет. Если вам доступны настройки сервера, canonical можно добавить в заголовок HTTP, применяя .htaccess или PHP. Тогда при обращении к дублирующему документу запрос будет перенаправляться на основной.
В файле Sitemap
Все адреса в XML-файле воспринимаются поисковыми системами как канонические. Так, Google требует, чтобы в Карту были включены только основные страницы. Однако Карта тоже является лишь рекомендацией, поэтому поисковые системы вполне могут ею пренебречь.
Через 301 редирект
301 редирект часто используют, чтобы перенаправить трафик на определённую страницу. Этим методом также пользуются, если сайт открывается по нескольким адресам, как в примере с http/https/www. Тут мы тоже выбираем основной одну версию, а на всех остальных настраиваем 301 редирект. Тогда пользователь, переходя по ссылкам дублей, будет перенаправляться на основную страничку, как и весь трафик, ссылочная масса и т.д.
Однако нужно учитывать, что поисковики могут самостоятельно решать, какой версии отдавать предпочтение. Так, например, Google среди двух одинаковых вариантов, отличающихся https и http, выберет версию с https. Кроме того, поисковик может считать основной ту страницу, которая, по его мнению, имеет более привлекательный URL. Также система может отдать предпочтение неканонической версии, если сочтёт её более подходящей, несмотря на то, что вы на ней прописали canonical.
Типичные ошибки при работе с canonical
Много canonical ссылок для одной страницы
У одной странички может быть только один канонический адрес. Если их будет несколько, краулер поисковой системы либо вовсе её пропустит, либо возьмёт за основной первый указанный адрес.
Последовательность канонических URL
Если вы указываете основной какую-то страницу, но для неё тоже указана какая-то каноническая, то краулер не будет рассматривать её как основную. То есть страничку, в коде которой прописан атрибут canonical, нельзя сделать основной по отношению к какой-либо другой.
Неправильное размещение атрибута
Тег rel=»canonical» можно размещать только в . Если вы напишете его в другой секции, поисковики на него не обратят внимания.
Применение canonical вместо 301 редиректа
301 редирект можно применять вместо rel=»canonical», но атрибутом нельзя заменять редирект. Редирект — это перенаправление трафика с одной страницы на другую, при этом та, с которой настроен редирект, становится недоступна. Если вы воспользуетесь rel=»canonical», обе версии останутся доступными, будут получать трафик, единственное — дубль не отобразится в индексе.
Указание главной как канонической
Нельзя главную делать канонической по отношению к другим страницам. Иначе краулер поисковой системы может не проиндексировать их, и они не попадут в выдачу, а ранжироваться будет только главная.
Закрытие основной страницы от индексации
Если вы указали канонической страничку, которая закрыта для индексации, краулер не сможет её проиндексировать, соответственно, в выдачу она не попадёт. Тогда поисковые системы возьмут за основную другую релевантную неканоническую версию.
Понимать канонические теги
Каждая из страниц вашего интернет-магазина имеет каноническую ссылку (или тег), встроенную в код раздела
. Эта ссылка сигнализирует поисковым системам об исходном или исходном URL-адресе страницы.
Использовать канонические ссылки
Когда к определенной странице в вашем интернет-магазине можно получить доступ через несколько URL-адресов, каноническая ссылка указывает поисковым системам, какая версия этой страницы является исходной версией. Это также имеет место, когда есть несколько страниц с разными URL-адресами, содержащими лишь незначительные различия в содержании.
Использование канонических ссылок на страницах вашего интернет-магазина повышает рейтинг в поисковых системах, поскольку поисковые системы используют их для консолидации ссылок на дублирующийся или похожий контент. Это означает, что они присваивают более высокий рейтинг тем страницам, которые помечены как исходный URL.
Ниже приведен пример того, как это может выглядеть на вашем сайте.
Скажем, робот переходит по следующей ссылке:
http://www.mystore.com/shoes/category/mens_shoes
В
, эта страница может содержать канонический URL
<голова>
Если робот переходит по какой-либо ссылке, которая приводит к той же странице, но с другим адресом, например :
http://www. mystore.com/obuv/category/mens_shoes
Канонический URL указывает на первую категорию.
<голова>
Использовать канонические теги и теги разбиения на страницы
Commerce предоставляет два разных макета разбивки на страницы: числовой (по умолчанию) или
и rel="prev"
ссылки.
Для первой страницы последовательности в нумерованном макете страниц вы увидите обычный запрос страницы категории и запрос нулевой страницы последовательности. Ноль следует использовать для отображения первой партии контента на страницах со списком продуктов. Все канонические теги на страницах с разбивкой на страницы в последовательности должны ссылаться на самих себя, поэтому URL-адреса могут выглядеть как 9.0003 www.example.com/category/c1234 , www.example.com/category/cshoes/2
, www. example.com/category/c1234/3
и так далее. Атрибут rel=canonical
для «/1» будет указывать на URL-адрес страницы нулевой категории.
Если тип страницы «Статья», добавляется непараметризованная ссылка на себя.
Каждая страница покупок и статей содержит элемент
с атрибутом rel="canonical"
. Если тип страницы:
- «Дом», то канонический атрибут указывает на https://www.hostname.domain.
- «Продукт», то к непараметризованной версии страницы сведений о продукте добавляется ссылка на самого себя.
- «Коллекция», затем добавляются канонические элементы в зависимости от того, включает ли список нумерацию страниц, как описано ранее: нулевая страница, страница/2, страница/3 и т. д.
Разметка страниц с атрибутами HTML rel="next"
и rel="prev"
указывают поисковым системам, что связь между отдельными URL-адресами должна следовать логической последовательности.
Если в последовательности есть предыдущая страница, вы увидите элемент rel="prev"
, ссылающийся на предыдущую страницу.
Если в последовательности есть следующая страница, вы увидите rel="next"
элемент, указывающий на следующую страницу.
Следовательно, за исключением нулевой страницы и последней страницы в заданной последовательности, все промежуточные составные страницы будут содержать как rel=»prev», так и rel=»next».
Внесение изменений в настройки разбивки на страницы может привести к тому, что некоторые из последующих URL-адресов станут недоступными для поисковых систем. Например, вы можете захотеть использовать бесконечную прокрутку для загрузки дополнительных элементов в коллекцию, однако сканеры поисковых систем не прокручивают, поэтому все, что появляется после события прокрутки, не будет обнаружено сканером.
Поэтому вам не следует удалять ссылки на страницы из мобильных представлений, и перед запуском сайта вы всегда должны проверять их работу. Числовой макет страниц обеспечивает оптимальное SEO для всех типов магазинов, в то время как 9Ссылки 0003 rel=»next» и rel="prev"
лучше всего работают там, где есть 1 или 2 страницы с разбивкой на страницы.Использовать канонические и языковые теги
Если существует хотя бы один дополнительный язык витрины, то тег hreflang
добавляется ко всем страницам. Независимо от того, использует ли многоязычный магазин каталоги или поддомены, необходимо использовать аннотации « hreflang
», поскольку они сигнализируют о связи между многоязычными сайтами. Канонические теги на разных языковых сайтах всегда должны быть самоканоническими.
Что такое канонический тег и почему канонизация важна для SEO? — Halo Lab
В этой статье наша команда расскажет вам все о каноническом теге: что это такое, когда вам (не нужно) его использовать и почему он может повысить посещаемость вашего сайта.
Что такое rel canonical и для чего он нужен?
Канонический атрибут — это атрибут, указывающий на наиболее приоритетную страницу среди дубликатов для поисковых систем. Он используется, когда страницы веб-сайта имеют дублированный или похожий контент и, как следствие, мешают ранжированию друг друга. Тег canonical позволяет указать, какая страница среди дубликатов должна быть проиндексирована для оценки вашего контента и его качества.
Если у вас есть одна страница, доступная по нескольким URL-адресам, или разные страницы с похожим содержанием (например, страница с мобильной и настольной версиями), Google рассматривает их как дубликаты одной и той же страницы. Google выберет один URL-адрес в качестве канонической версии и просканирует его, а все остальные URL-адреса будут считаться повторяющимися URL-адресами и сканироваться реже.
Документация Google Developers
Обычно Google учитывает канонический URL-адрес, указанный вами в качестве основного, но не всегда. Важно отметить, что для поиска Google тег canonical является не директивой, а лишь подсказкой. Следовательно, когда вам нужно определить наиболее релевантную страницу для более высокого рейтинга, помните, что данные об установленном вами URL учитываются наряду с другими сигналами.
Тег canonical указывает поисковым системам самую приоритетную страницу среди похожих
Если не указать, какие URL будут главными среди дубликатов, ждите двух сценариев: 1) поисковая система выберет ее сама, полагаясь на другие сигналы; 2) поисковая система увидит все похожие страницы как дубликаты. В обоих случаях негативное влияние на ранжирование почти неизбежно, поэтому мы рекомендуем вам не рассчитывать на Google и настроить главную страницу самостоятельно.
Основные правила указания каноничности
Определить потенциальный канонический URL довольно просто. Тем не менее, есть правила, которым вы должны следовать, чтобы заставить его работать правильно:
- Укажите абсолютные URL-адреса, а не относительные.
- Выберите версию HTTPS, если вы перешли на SSL.
- Убедитесь, что регистр букв URL-адреса, указанного в атрибуте, совпадает с регистром абсолютного URL-адреса.
- Не указывайте несколько разных URL-адресов как канонический для одной и той же страницы.
- Убедитесь, что каноническая страница может быть отсканирована и проиндексирована.
- Добавить только одну каноническую ссылку в разделе на страницу.
Как указать канонический адрес
Существуют различные способы указать канонический адрес. В справке Google можно найти 5 основных вариантов канонизации:
- тег rel=canonical в атрибуте;
- rel=канонический заголовок HTTP;
- Файл Sitemap;
- 301 редирект;
- AMP-версия сайта.
Тег rel=canonical в атрибуте
Во избежание проблем с дублированием содержимого можно использовать тег ссылки rel=canonical . Каноническая ссылка — самый простой и известный способ указать канонический адрес для страницы. В данном конкретном случае это фрагмент HTML-кода. Вы должны просто добавить тег к копии страницы и указать версию главной страницы, чтобы выделить канонический URL-адрес .
Пример кода:
Синтаксис прост и понятен:
- link 90 «canonical» указывает, что эта страница имеет каноническую версию.
- href=»https://example.com/» показывает адрес сайта, по которому можно найти каноническую версию сайта.
Плюсы этого метода:
- Вы можете отметить любое количество страниц.
- Легко писать даже с базовыми знаниями HTML.
- Многие популярные оптимизированные для SEO CMS имеют либо специальные поля для канонических страниц, либо специальные плагины, такие как Yoast SEO для WordPress.
Минусы этого метода:
- Увеличивает размер кода страницы.
- Размещение на крупных сайтах может занять некоторое время.
- Подходит только для документов HTML.
HTTP-заголовок rel=canonical
Этот вариант постоянно используется для документов, в которых нельзя указать link rel=»canonical» , например, для документов типа PDF, т.к. в них нет раздела . Однако этот метод маркировки канонических страниц подходит и для обычных HTML-документов.
Чтобы установить rel=canonical , нужно открыть файл .htaccess и написать в шапку команду Link . Здесь вы можете увидеть, как это будет выглядеть:
Ссылка:
Плюсы этого метода:
- Вы можете отметить любое количество страниц.
- Подходит для всех документов, поддерживаемых поиском Google.
- Не увеличивает размер страницы.
- Вы можете создать правило автоматизации для канонических тегов (но только если на сайте есть четкая структура URL-адресов).
Минусы этого метода:
- Может потребоваться доступ к настройкам сервера.
- В настоящее время Google поддерживает его только для веб-поиска.
- Размещение на крупных сайтах может занять некоторое время.
Файл карты сайта
Карта сайта — это файл, в котором вы можете предоставить ценную информацию о содержании вашей страницы для повышения эффективности сканирования веб-сайта. Google рассматривает страницы, включенные в файл sitemap.xml , как канонические, поэтому вам нужно добавить каждую каноническую страницу в файл. Если пропустить этот момент, Google сам поставит каноническую версию, что может плохо закончиться.
Если вам интересна эта тема, мы написали полную статью о правильной настройке файлов — Best Sitemap XML Optimization Practices для SEO и Google.
Плюсы этого метода:
- Простая настройка и обновление.
- Идеально подходит для больших объектов.
- Размер страницы остается прежним.
Минусы этого метода:
- Нет гарантии, что URL-адреса, указанные в карте сайта, будут считаться каноническими во всех случаях.
- Менее важен для робота Googlebot, чем атрибут rel=canonical .
- Роботы Google по-прежнему должны определять дубликат страницы для каждой канонической страницы, которую вы указали в файле Sitemap.
301 редирект
Если вы хотите указать каноническую страницу и убрать на некоторое время дублирующиеся версии, этот способ вам подойдет лучше всего. С помощью 301 перенаправления довольно легко показать боту, что URL-адрес, на который отправляется перенаправление, более важен и актуален.
301 редирект означает, что страница находится по другому адресу (адрес редиректа). Для его настройки нужно зайти на хостинг, выбрать каноническую версию и перенаправить на нее другие версии.
Плюсы этого метода:
- Позволяет избавиться от устаревших и неактуальных копий.
Минусы этого метода:
- Не позволяет сохранять дубликаты страниц для индексации в будущем.
- Запрашивает доступ к настройкам сервера.
Практика канонического использования
Несмотря на то, что канонический используется, чтобы избежать похожего или дублированного контента в результатах поиска, есть еще несколько случаев, когда указание канонической страницы важно для вашего веб-сайта. В следующих главах мы расскажем вам об этом подробнее, описав дополнительные бонусы, которые вы можете получить от использования канонических тегов .
Как правило, хорошие цифровые манеры
Сегодня, используя 9Канонический атрибут 0123 стал частью интернет-этикета. Даже если у вас небольшой сайт с маловероятным дублированием, мы рекомендуем указать каноническую страницу, чтобы предотвратить возможные проблемы.
В этом случае необходимо добавить самоссылающиеся канонические версии для всех версий главной страницы. Как только это будет сделано, страницы с дополнительными параметрами будут защищены от индексации и отвлечения трафика от канонического.
Опции отображения и сортировки
Традиционный способ использования канонического заключается в указании главной страницы с помощью параметров сортировки или отображения, которые приводят к дополнительным параметрам GET и другим модификациям URL. Часто можно встретить на сайтах интернет-магазинов и агрегаторов; например, посмотрите, как это работает на etsy.com.
На странице Мужские рубашки и футболки мы видим множество фильтров и вариантов сортировки: по цене, популярности, отзывам и так далее.
Канонический тег помогает идентифицировать основной документ при использовании параметров сортировки или отображения
Благодаря этим параметрам вы можете добавить GET-идентификатор к URL-адресу.
Например, если мы выберем сортировку по Самая низкая цена , мы получим следующий URL-адрес:
https://www.etsy.com/c/clothing/mens-clothing/shirts-and-tees ? явно=1&category_landing_page=1&order=price_asc
Эти URL-адреса могут появляться до бесконечности, в зависимости от параметров сортировки и фильтрации. Хотя они будут отображать ту же информацию (список товаров), что и на главной странице, поисковая система не увидит между ними разницы.
Если все эти страницы будут проиндексированы и появятся в поиске, мы получим жесткую внутреннюю конкуренцию за ранжирование. Вот почему нам нужен канонический тег . Если такие страницы важны для пользователей, но бесполезны для продвижения, нужно указать главную как каноническую.
Говоря техническими словами, вы должны написать в страницы сортировки. Это значит, что на странице указана основная версия документа, которая должна быть в поиске без ПОЛУЧИТЬ параметры .
Неоптимизированные страницы фильтров
Этот случай аналогичен предыдущему, но здесь больше простора для маневра. Видите ли, если конкретный запрос соответствует фильтру, страницу можно оптимизировать и продвигать отдельно. Тогда ставить каноническую на основную не надо.
Однако бывают ситуации, когда вы не можете оптимизировать страницу фильтрации ни для одного из кластеров, особенно если эта страница формируется с использованием нескольких фильтров одновременно.
UTM и параметры отслеживания
Для сбора определенной информации, такой как отслеживание источников переходов, вы можете добавить определенные параметры к URL-адресу, например, если вы хотите отслеживать, сколько пользователей посетили ваш сайт из-за новостной рассылки или публикации в Facebook. .
Вы можете проверить, есть ли URL-адреса с тегами, которые ведут на ваш сайт в Google Analytics.
URL-адреса с параметрами GET, которые ведут на веб-сайт в GA
Несмотря на то, что UTM и параметры отслеживания используются для сбора определенной информации, эти URL-адреса содержат дублированный контент. Поскольку вы не единственный, кто может создавать такие теги, использование канонической страницы с самоссылкой было бы отличным решением.
Распространенные ошибки канонизации
Канонизация имеет некоторые подводные камни, так что не относитесь к этому слишком легкомысленно. При небрежном отношении можно все испортить и ухудшить рейтинг сайта.
Давайте рассмотрим самые распространенные ошибки и как их избежать или исправить.
1. Использование канонического тега для страниц с разным содержанием
Некоторые веб-мастера ошибочно связывают канонические страницы с неидентичными, надеясь улучшить свои усилия по SEO. Однако это не работает, так как Google рекомендует использовать канонический, если у вас есть одна страница с разными адресами или несколько страниц с похожим содержанием.
Типичным примером является указание страницы товара, которой нет в наличии, или страницы категории, проиндексированной как каноническая, и наоборот. Так как содержание таких страниц существенно отличается, поисковые системы могут просто игнорировать этот атрибут и отображать обе страницы в результатах поиска.
2. Блокировка неканонических адресов с помощью robots.txt
Блокировка страницы в файле robots.txt может предотвратить ее сканирование. Следовательно, бот не сможет распознать указанные канонические теги . Если вы хотите узнать больше о robots.txt, обязательно ознакомьтесь с другой нашей статьей, как только вы закончите с этой.
3. Блокировка неканонических URL-адресов с помощью тега noindex
Canonical и noindex теги противоречат друг другу, поэтому, когда вы объединяете их оба в одном URL-адресе, Google обычно предпочитает rel=canonical . Если вам не нужно индексировать URL-адрес, используйте тег noindex и забудьте о отн=канонический . Но если вам не нужно индексировать страницу и при этом вы хотите указать каноническую, используйте только rel=canonical или 301 редирект .
4. Игнорирование кода ответа сервера 4xx для неканонических документов
Если неканонический документ возвращает код 4xx , вы получите тот же результат, что и в предыдущем случае. Боты поисковых систем не распознают канонический тег для таких страниц, потому что код 4xx заблокирует их.
5. Указание первой страницы как канонической для всех последующих страниц пагинации
Поскольку первая страница и страницы пагинации имеют разное содержание, не следует указывать только первую страницу как каноническую. Когда вы устанавливаете первую страницу как каноническую для всех страниц, Google может рассматривать их как дубликаты, удаляя весь их контент, включая внутренние ссылки. Вместо этого мы рекомендуем вам использовать канонические теги , ссылающиеся на самих себя, для страниц с нумерацией страниц.
6. Указание нескольких канонических тегов для одного документа
Использование нескольких тегов rel=canonical для одной и той же страницы является ошибкой, поскольку Google, вероятно, проигнорирует их все. Вы можете столкнуться с этой проблемой, если тег добавляется на страницу несколькими агентами либо путем добавления вручную, либо с помощью плагина, либо с помощью какой-либо настройки CMS. В таких случаях лучше перепроверить и убедиться, что ваш тег rel=canonical работает должным образом.
7. Указание rel=canonical в других разделах HTML (не в)
Важным требованием для правильной работы rel=canonical является его включение в раздел HTML-документа. Если атрибут добавлен в или другой раздел страницы, он будет проигнорирован.
8. Игнорирование кода ответа сервера 4xx или 3xx для канонических документов
Код состояния HTTP 4xx или 3xx означает, что страница, которую вы хотите указать как каноническую, недоступна для поисковых систем и не будет отображаться на страница результатов поиска. Это может произойти, если страница, указанная как основная, работает некорректно и не может быть проиндексирована. В этом случае нужно заменить адрес страницы на правильный.
9. Добавление дубликатов страниц без указания каноничности
Это предупреждение появляется, если есть одна или несколько одинаковых или похожих страниц, но для них не указана каноническая версия. В этом случае Google самостоятельно определит главную страницу, отображая ее в результатах поиска. Естественно, она может отличаться от версии, которую вы хотите индексировать и продвигать.
Для исправления необходимо проанализировать группы дубликатов и указать наиболее подходящую страницу как каноническую.
10. Указание некорректного канонического тега для страниц с разными языковыми версиями
Указание канонической страницы при использовании тегов с атрибутом hreflang . Каноническая страница должна быть на том же языке, что и альтернативная, или, по крайней мере, на наиболее близком к ней языке.
11. Указание канонического URL-адреса, который также канонизируется для другой страницы
Эта проблема возникает, когда страница A имеет каноническую страницу B , а страница B имеет каноническую страницу C . В результате возникает проблема «цепочки каноничности».
Пример канонической цепочки
Из-за канонической цепочки поисковые системы могут неправильно интерпретировать теги или полностью игнорировать их. Поэтому при написании URL-адреса убедитесь, что страница, на которую вы указываете, не имеет канонического, указывающего на другую страницу.
12. Указание URL с другим протоколом
При указании канонической страницы ссылаться на протокол в основной версии сайта. Если он использует протокол HTTPS, вы должны указать HTTPS в 9Атрибут 0123 href .
13. Прикрепление внутренних ссылок к каноническому URL
Внутренние входящие ссылки должны указывать на основную версию документа. Следовательно, вам необходимо свести к минимуму количество внутренних ссылок на канонизированные страницы, чтобы увеличить краулинговый бюджет. Но есть некоторые исключения, например, когда вы ссылаетесь на неканоническую, неосновную версию документа для улучшения UX или когда хотите показать товары сразу с помощью сортировки.
Заключение
Многие до сих пор думают, что каноничность — это всего лишь рекомендация для поисковых систем, но она может стать эффективным инструментом управления индексацией сайта, и с этим можно справиться даже самостоятельно. Настройка канонического тега вам не по зубам — вам просто нужно определиться с лучшим вариантом для вашей цели и аккуратно воплотить его в жизнь.
Будьте уверены, что ваши усилия того стоят, так как канонические теги сильно влияют на успех вашего интернет-магазина. Правильное использование инструмента канонизации положительно влияет на ранжирование сайта, способствует продвижению сайта и минимизирует последствия копирования вашего контента сторонними сайтами.