Яндекс canonical

Содержание

Яндекс подружился с тегом rel=canonical — Devaka SEO Блог

Со вчерашнего дня поисковая система Яндекс поддерживает тег rel=canonical (через два года после введения поддержки тега западными поисковыми системами).

Теперь и для Яндекса вы можете указать, какая страница является канонической (предпочтительной для индексации и попадания в поиск) для ряда дублирующихся страниц на сайте. Однако, по утверждению представителей Яндекса, канонический тег сработает лишь в случае, если содержимое страниц будет одинаковым.

Напомню, что для западных поисковых систем склейка происходит не обязательно при полном совпадении контента, но при подобии одного и другого (используется какая-то степень подобия), это удобно, например, для склейки результатов поиска /search?q=abc и /search?q=dle на один адрес /search. Или же для склейки страниц из пейджинга, сортировки, или архива, и ряда других подобных друг другу страниц, не представляющих уникальности для посетителя. То есть, западные поисковики решают не только проблему с сессиями и другими параметрами в URL, но также и помогают оптимизаторам сконцентрировать веса побочных (и в то же время подобных друг другу) страниц на одной главной. Подробней о том, как работает тег rel=canonical в Яндексе, сотрудники не комментируют.

Интересно также отметить, что:

1. Яндекс не знает, или скрывает, как поведет себя робот, если вы на одной странице укажете несколько канонических URL.

2. Яндекс не рекомендует использовать цепочки из канонических страниц и не комментирует, что произойдет, если цепочки будут иметь место.

3. При указании в качестве canonical URL другого домена или поддомена, атрибут Яндексом не учтется, в отличие от Google.

4. В примерах на блоге Яндекса используются абсолютные значения канонических адресов. Как поведет себя Яндекс при указании относительных адресов страниц неизвестно.

В общем, нововведение хорошее, но подробную документацию от Яндекса, видимо, можно ожидать ещё через пару лет. А каковы ваши комментарии?

P.S.: Читайте также об атрибуте rel=»canonical» от Google

Яндекс canonical содержимое страницы существенно отличалось

Неоднократно задавали вопрос «Почему игнорируется canonical на странице?».

В данном случае речь пойдет в основном про Яндекс, просто потому что в панели вебмастера он отображает соответствующую информацию. Но принципиальных отличий в Google нет.

Страница попала в поиск, поскольку во время её сканирования роботом её содержимое существенно отличалось от содержимого страницы по адресу …

В панели для вебмастера Яндекс не так давно добавилось отображение информации по атрибуту canonical, что сделало более прозрачным отслеживание страниц.

Вебмастера стали наблюдать сообщения такого рода.

Страница попала в поиск, поскольку во время её сканирования роботом её содержимое существенно отличалось от содержимого страницы по адресу http… который был указан в атрибуте rel=»canonical» в исходном коде. Исправьте или удалите атрибут canonical, если он указан некорректно. Робот отследит изменения автоматически.

Чаще всего я вижу эти страницы у тех, кто пытался закрыть пагинацию когда это не нужно, неверно оценив ситуацию на сайте. Так же нередко бывают страницы фильтров, если на них выставлены ссылки.

Цитата из объяснения Яндекс:

Они будут показаны в том случае, если они более релевантны запросу и их контент существенно отличался от канонической версии во время сканирования роботом. В Вебмастере такие страницы можно увидеть на странице «Страницы в поиске» с пометкой «Неканоническая». Помимо этого статуса мы начали показывать статусы «Каноническая» и «Каноническая страница не указана» для всех страниц, попавших в поиск.

Соответственно на страницы с разным контентом canonical не нужно указывать, он будет игнорироваться, а «осадочек останется».

Наши исследования показывают, что страницы, размеченные как неканонические могут быть полезны, а их наличие в поиске может влиять на качество и полноту ответа на запрос пользователя.

Убирая страницы, вы можете отрезать себе часть трафика.

Google и canonical

Обратите внимание, что, даже если вы укажете ее, Google может выбрать другую. Это зависит от многих факторов, например от представленных на странице материалов или ее эффективности в Google Поиске.

Тут стоит пояснить, что это нужно читать не буквально. Данная цитата отражает ситуацию при которой одна и та же страница имеет несколько адресов (содержимое 100% идентично).

~~А и Б сидели на трубе~~

Касательно же случаев когда есть страница «А» и страница «Б» и для «Б» указана в атрибуте canonical страница «А», канонической признают и «А» и «Б» (обе попадут в выдачу), при условии что это страницы с отличающимся содержанием.

Как сделать правильную пагинацию Google и Яндекс (canonical prev next) Opencart

Постраничная навигация

Она же пагинация — важный элемент структуры сайтов. Часто можно встретить запрос «страницы пагинации нужно ли закрывать от индексации или нет?». Ответ на который я разберу.

Важные изменения

С 21 марта 2019 Google объявил что прекращает поддержку rel prev/next. На данный момент мало информации. Это следует учитывать.

Немного конспирологии

Вначале несколько риторических вопросов…

1. Заинтересован ли Яндекс в том чтобы Гугл хорошо ранжировал ваш сайт?

2. Нужен ли Яндексу рост количества людей, пишущих «яндекс-г**но, в гугле всё норм, а тут хрен»?

3. К какой поисковой системе будет более лоялен владелец сайта? К той где он ниже или выше? И куда более вероятно понесет денежки?

4. Как проще: поднимать у себя или подтолкнуть к шагу вниз у конкурента?

Подумайте на досуге.

Немного терминологии

Переобуваться [несовершенное действие], Переобуться [совершенное действие] — Снимать с себя обувь и надевать другую.

Коротко будем называть НД и СД.

Что такое Дубли

Явные дубли — страницы с одинаковым содержимым по разным адресам, например на Opencart:

сайт/товар
сайт/категория/товар
сайт/поиск/товар

Неявные дубли — страницы похожие между собой «на 99%», например:

iPhone X 128Gb черный РСТ
iPhone X 128Gb черный Евротест

При этом полностью одинаковое описание и характеристики.

Отличия в картинках в принципе не учитываются, только текстовое содержание.

Дубли ли страницы Пагинации

Основополагающим на странице является контент(он должен различаться), заголовки и метатеги это лишь названия и краткое описание (различий в один символ в них достаточно).

В случае интернет-магазинов на каждой странице размещены разные товары (это и есть контент), он не повторяется.

Технически поисковым системам сложно сравнивать контент со 100% гарантией, в отличии от title, description, h2. Поэтому нужно делать их уникальными для каждой из страниц. Так же полезно для юзабилити информировать пользователя дополнительной меткой с указанием например номера страницы.

Возможны исключения, когда категории состоят из очень похожих товаров, и сами по себе товары по сути неявные дубли. Например:

категория ГВОЗДИ гладкие

Гвоздь гладкий 10мм
Гвоздь гладкий 12мм
Гвоздь гладкий 15мм
…
Гвоздь гладкий 250мм

При таком раскладе не имеет смысла пускать лишние страницы в индекс. Хотя тут проблемы куда глобальнее чем пагинация.

Что говорит Гугл

https://support.google.com/webmasters/answer/1663744

Если кратко:

prev | next
или canonical на страницу «показать все» если имеется (не на первую, а на «показать все»)
или ничего не делать

и давать полный доступ для индексации

Ну и контрольный в голову

https://webmasters.googleblog.com/2013/04/5-common-mistakes-with-relcanonical.html

Топ 5 заблуждений про canonical от Гугл, и первый в списке «Mistake 1: rel=canonical to the first page of a paginated series»

Есть люди утверждающие что на страницы пагинации Яндекс требует ставить canonical, опираясь на статью в блоге https://yandex.ru/blog/platon/2878.

Произведем разбор…

1. Если!

Если в какой-либо категории на вашем сайте находится большое количество товаров, могут появиться страницы пагинации (порядковой нумерации страниц), на которых собраны все товары данной категории. Если на такие страницы нет трафика из поисковых систем и их контент во многом идентичен, то советую настраивать атрибут rel=»canonical» тега на подобных страницах и делать страницы второй, третьей и дальнейшей нумерации неканоническими, а в качестве канонического (главного) адреса указывать первую страницу каталога, только она будет участвовать в результатах поиска.

Если!

Подробнее ниже ↓

2. Отделяем мух от котлет

Это касается тех случаев когда в веб-мастере вы видите страницы пагинации отмеченные как дубли т.е. подразумеваются такие входные данные: Одинаковые заголовки, метаданные, описания.

И canonical предлагается как решение этой проблемы.

Гораздо проще посоветовать «лепите canonical», нежели объяснить как уникализировать страницы.

Если же страницы уникализированы (заголовки, метаданные, описания, в идеале так же нужно лишние блоки убрать) это не требуется.

3. Непостоянство

Вспоминаем терминологию и спускаемся в комментарии этой же статьи.

НД

Угу упустил… LOL Яндекс за 4 года не изучил официальное руководство от Гугл?

Кто изучал психологию, подумайте, случайна ли тут опечатка?

СД

Если была реальная необходимость было бы объяснение, а тут просто «можно не ставить»

4. Еще чуть-чуть конспирологии

Статья опубликована

29 декабря 2015, 15:24

Сидят ли перед Новым годом реальные специалисты в Яндекс, или же вместе с топ-менеджментом уходят в отпуск?

Кто же писал статью?

Самое тупое

Включаем логику, переводим атрибуты на простой язык:

canonical — я копия, вот оригинал (ссылка)
prev — я часть единого целого, вот предыдущая часть (ссылка)
next — я часть единого целого, вот следующая часть (ссылка)

Попробуем составить общее предложение если вывести все три на странице и canonical указывает на первую.

Я копия, которая является следующей частью оригинала, есть еще следующая моя часть и она тоже следующая копия оригинала, а наши предыдущие части это оригинал.

Имея хоть зачатки логики и iq чуть больше чем у аудитории Дом-2, можно сразу понять что это вещи противоречащие друг другу.

как Яндекс и Google учитывают rel=»canonical»

В феврале 2009 года Google ввел поддержку атрибута rel=»canonical», который был призван помочь вебмастерам разобраться с дублированным контентом. Появилась возможность указать какая именно страница из группы страниц с похожим (или одинаковым) содержанием должна участвовать в поиске. Вслед за Гуглом, в мае 2011 года, поддержку атрибута rel=»canonical» ввел Яндекс.

У вебмастеров появилась отличная возможность убрать из выдачи дублированный контент, однако встал вопрос – если на неканонический URL стояла внешняя ссылка, то будет ли передан «ссылочный вес» канонической странице? Не менее интересен вопрос – имеет ли значение, что появилось раньше – «внешняя ссылка на неканоническую страницу», или «rel=»canonical» с неканонического на канонический URL»? Если почитать хелпы Google и Яндекса, то в них Вы не найдете в них ответа на этот вопрос. Значит нужен эксперимент 🙂

Цель эксперимента: выяснить, будет ли передан «вес ссылки» со страницу А на страницу С, в том случае, если страница А ссылается на страницу Б, а на странице Б стоит rel=»canonical», который указывает, что канонической страницей является страница С.

Если со страницы А на страницу С «вес ссылки» передается, то необходимо выяснить имеет ли значение «первоочередность».

Вариант №1. Страница А ссылается на страницу Б и эта ссылка проиндексирована поисковыми системами. Через некоторое время на странице Б устанавливается rel=»canonical», который указывает, что канонической является страница С, что в итоге приводит к исключению страницы Б из индекса.

Вариант №2. На странице Б устанавливается rel=»canonical», который указывает, что канонической является страница С, что приводит к исключению страницы Б из индекса. Через некоторое время после этого со страницы А на страницу Б устанавливается ссылка.

Необходимо выяснить в каком из двух вариантов будет передан «вес ссылки» со страницы А на страницу С. Под «весом ссылки» я понимаю так называемый «анкорный вес», т.е. если страница акцептор ищется по тексту стоящей на нее ссылки, то считаем, что «вес ссылки» передается, если не ищется, то не передается.

Описание эксперимента

На тестовом сайте было создано 4 экспериментальных страницы:

Страница «Альфа 1» является полным дублем страницы «Альфа 2». При создании страницы на странице «Альфа 1» изначально был прописан rel=»canonical», который указывал, что канонической является страница «Альфа 2».

Страница «Бета 1» является полным дублем страницы «Бета 2», но изначально на страницах этой группы атрибут rel=»canonical» отсутствовал.

После того как сайт был проиндексирован в Яндекс и Google, было проверено какие страницы попали в индекс. Как и следовало ожидать страница «Альфа 1» в индекс не попала.

Выдача Яндекса:

Выдача Google. Обратите внимание, на различия заголовков у страниц группы Бета, цифры «1» и «2» отсутствуют в тегах title и по всей видимости Google «взял» их из анкоров ссылок стоящих на главной странице, хотя возможен вариант, что цифры были взяты из URL, хотя на мой взгляд это менее вероятно:

После того как сайт был проиндексерован, на страницу «Альфа 1» и «Бета 1» были поставлены ссылки с уникальными анкорами.

Ссылка на страницу «Альфа 1» в Яндексе. Как видите по ссылке сразу же стала искаться страница «Альфа 2», т.е. атрибут rel=»canonical» передал «вес ссылки»:

Ссылка на страницу «Бета 1» в Яндексе. Тут все ожидаемо, нашлась именно страница «Бета 1»:

В Google ситуация оказалась полностью аналогичной как для ссылки на страницу «Альфа 1»:

Так и для ссылки на страницу «Бета 1»:

После того как ссылки были проиндексированы, на странице «Бета 1» был установлен атрибут rel=»canonical», который указывал, что канонической является страница «Бета 2». После переиндексации сайта в индексе Яндекса осталось только 3 страницы (Главная, «Альфа 2», «Бета 2»):

По анкору ссылки стоящей на страницу «Бета 1» стала искаться страница «Бета 2»:

Со страницей «Альфа 2» естественно ничего не поменялось:

В Google ситуация с переиндексацией страницы «Бета 1» заметна затянулась, пришлось ждать на 3 недели дольше чем в Яндексе (это к слову о быстрой индексации). Как и ожидалось страница «Бета 1» выпала из индекса, в выдаче осталось 3 страницы (Главная, «Альфа 2», «Бета 2»):

Страница «Альфа 2» по прежнему искалась по уникальному слову:

А вот страница «Бета 2» искаться перестала и это, мягко говоря, было неожиданно:

Выводы

Для Яндекса не имеет значения что появилось раньше — rel=»canonical», или внешняя ссылка – в любом случае «вес ссылки» будет передан с неканонического URL на канонический.
Для Google имеет значение что появилось раньше раньше — rel=»canonical», или внешняя ссылка.
- Если изначально со страницы А на страницу Б стоял rel=»canonical» и страница А была исключена из поиска как неканоническая, то в случае если на страницу А появится внешняя ссылка, то ее «вес» будет передан на страницу Б.
- Если же изначально на страницу А вели внешние ссылки и Вы решили поставить со страницы А на страницу Б rel=»canonical», то в этом случае «вес ссылок» не будет передан на страницу Б.

Да, но…

Я понимаю, что данный эксперимент не до конца является «чистым», поэтому с радостью выслушаю конструктивную критику.
Я понимаю, что если страница не ищется по тексту внешней ссылки, то это не обязательно означает, что ссылка не учитывается. Тем не менее, это самый простой из возможных вариантов определения «работоспособности» ссылки.

Я понимаю, что «анкорный» и «статический» вес ссылки – это разные вещи, но определить влияние статического веса в данном случае не представляется возможным (если Вы подскажите как это можно сделать, то респект Вам и уважуха).
Не исключено, что спустя некоторое время страница «Бета 2» будет искаться по тексту ссылки и в Google. Если это произойдет, то очень хорошо, заодно можно будет определить временной лаг.

Вот как то так. Вопросы?

P.S. Забыл указать, начало эксперимента: 22.02.2013, окончание: 22.04.2013.

Яндекс поддерживает атрибут rel=»canonical» | Блог SEO Дилетанта

Доброго времени суток, уважаемые блоггеры. Буквально вчера, 23 мая 2011 года в блоге Яндекс.Поиск появилась новость о том, что теперь Яндекс учитывает атрибут rel=»canonical».

Что такое rel=»canonical»?

rel=»canonical» – это указание канонической страницы сайта. С приходом CMS, динамических сайтов, одна и также страница может находиться по разным адресам, атрибут rel=»canonical» указывает, какой из всех адресов является предпочтительным для индексации.

До вчерашнего дня данный атрибут поддерживал только Google и его использование для русскоязычного интернета было, так сказать, эффективным только наполовину. Не смотря на это, многие активно его использовали на своих сайтах, при этом, кстати, забывая, что атрибут rel=»canonical» является всего лишь рекомендацией, но не правилом, в отличии от правил, которые прописываются в файле robots.txt. Но сейчас речь не об этом. На самом деле я считаю данную новость очень важной для пользователей платформы Blogger и в этой статье объясню почему.

Как мы знаем, на Blogger нет доступа к файлу Robots.txt, поэтому мы как могли и на сколько это возможно управляли индексацией блога с помощью мета-тегов. При этом часто сталкивались с проблемой индексации комментариев, как отдельной страницы, когда в индекс попадали URL комментариев:

http://адрес_страницы?showComment=1300141814394#c8988727275282672241

От использования встроенных кнопок социальных сетей в индексе Яндекса появлялись ссылки на сайт такого вида:

http://адрес_страницы?spref=bl

Разработчики платформы по какой-то своей причине каждой кнопке социальной сети приделали свой параметр:

Blogger — spref=bl
Twitter — spref=tw
Facebook — spref=fb и т.д.

Как мы знаем, все подобные страницы создают дублирование контента, что негативно отражается на индексации блога.

Но, если сам Google предусмотрел исключение таких страниц из индекса в панели инструментов для вебмастера, то в Яндексе решить проблему с индексацией этих страниц никак не удавалось.

Я отдельно не писала про исключение подобных URL из индекса Google, поэтому сейчас вкратце расскажу об этом. В инструментах для вебмастера Google – Конфигурация сайта – Настройки – вкладка Обработка параметров. На этой вкладке Google уже большинство параметров сам определил и исключил из поиска, указав команду Пропускать. Если какого либо из параметров там не указано, а страница с ним в URL есть в индексе, то добавляем по аналогии параметр и сохраняем настройки.

Яндекс пока такие настройки в Яндекс Вебмастер не предусмотрел, но теперь, когда Яндекс стал учитывать rel=»canonical», я очень надеюсь, из индекса этого поисковика исчезнут все дублирующиеся страницы имеющие в URL различные параметры, которые придумал Google.

При этом нам для этого специально делать ничего не нужно. Если вы посмотрите исходный код любой страницы своего блога, то увидите, что на каждой из них уже присутствует rel=»canonical».

Даже если вы посмотрите страницу по ссылкам с комментариями или параметрами социальных кнопок, то на этих страницах стоит именно канонический адрес страницы, что означает, что Яндекс будет индексировать только одну, каноническую страницу, остальные будут проигнорированы.

Правда хорошая новость? Надеюсь, поклонников платформы будет все больше, а пользователей, которые считают, что Яндекс не любит Blogger, все меньше.

Не совсем про Яндекс, но про канонические страницы. Если вы пользуетесь стандартной постраничной навигацией в блоге, и при листании главной страницы у вас образуются такие ссылки:

http://адрес_блога/search?updated-max=2011-05-10T23%3A14%3A00%2B03%3A00&max-results=4

То канонический адрес страницы получается таким же:

Чтобы независимо от листания страниц канонический адрес страницы оставался URL главной страницы блога, нужно добавить условную конструкцию после открывающего тега <head>

<b:if cond=’data:blog.pageType == "index"’> <link expr:href=’data:blog.homepageUrl’ rel=’canonical’/> </b:if>

После этого любая страница, на которую мы попадаем по ссылкам Предыдущие – Следующие будет иметь канонический адрес главной страницы блога.
На этом все. Статья получилась компактной, но от этого не менее полезной. Удачи в продвижении.

Нужен ли атрибут rel=’canonical’ в оригинале

Кейс о rel=’canonical’

Когда-то я столкнулся с проблемой. Сайт выпал из индекса, потому что на оригинальной странице была ссылка «каноникал», ссылающаяся на саму себя

Убрал каноникал — после этого сайт зашел в индекс.

Вот что об этом писал Яндекс

В коде документа в тэге содержится параметр rel=’canonical’, содержащий канонический адрес страницы, по которому она индексируется роботом. Как правило, тег с атрибутом rel=»canonical» прописывают НА ДУБЛИРУЮЩИХ СТРАНИЦАХ сайта, в этом случае ничего исправлять не требуется.

Если страницы дублями не являются и должны индексироваться роботом, то вам необходимо убрать атрибут из их исходного кода. Более подробную информацию об использовании rel=»canonical» вы можете прочитать на следующей странице нашей Помощи //help.yandex.ru/webmaster/controlling-robot/html.xml#canonical

А в Помощи написано:

Также если на странице расположен атрибут rel=»canonical», С УКАЗАНИЕМ непосредственного АДРЕСА ЭТОЙ СТРАНИЦЫ, робот посчитает ее канонической. Данная страница будет индексироваться и появится в поисковой выдаче Яндекса.
Получается противоречие или с того времени поменялись правила.

Myvector / Shutterstock.com

Хотя если читать первую часть, то там не говорится что в оригинале должен быть атрибут rel=»canonical». Одно точно известно, что на всех дублях должна быть ссылка с rel=»canonical» на оригинал. Нужно ли ставить rel=»canonical» в оригинале ссылаясь на саму себя? Вопрос открыт.

Ссылки по теме

Поддержка атрибута rel=”canonical” роботом Яндекса //webmaster.ya.ru/replies.xml?item_no=10371
Канонические страницы https://support.google.com/webmasters/answer/139066?hl=ru

Понравилась статья? Поделиться с друзьями: