Файл sitemap xml: Как сделать и настроить карту сайта sitemap.xml — Офтоп на vc.ru

Содержание

что это, из чего состоит, для чего нужна карта сайта

#SEO #Sitemap

Sitemap.xml (карта сайта) — специальный файл в формате XML, который содержит данные о том, как именно организована структура сайта. С помощью этой информации поисковые системы смогут максимально качественно и без ошибок проиндексировать ресурс.

Используя Sitemap, можно «показать» поисковику самые важные на ваш взгляд страницы или разделы, добавить информацию о дате их последнего обновления и т. д.

Также в Sitemap можно указывать важные данные насчет какой-либо мультимедийной информации, содержащейся на сайте, например, продолжительность видеоролика, тип графического файла, условия лицензии и т. д.

Обязателен ли Sitemap

Если ресурс имеет корректные ссылки на все свои разделы со страницами, то роботы поисковых систем и так беспроблемно их обнаружат. Но при помощи грамотно сформированного Sitemap, можно оптимизировать обработку сложных многостраничных сайтов.

Даже если на сайте присутствует файл Sitemap, это еще не дает никакой гарантии, что все страницы будут найдены и проиндексированы роботами, так как подобные операции выполняются согласно сложным алгоритмам. Но в 99% случаев создание Sitemap помогает упростить процесс индексации и оптимизировать его.

Когда Sitemap необходим

Создавать файл Sitemap обязательно нужно в следующих случаях:

  • Сайт слишком большой и содержит тысячи страниц. Без Sitemap возникнет риск, что роботы что-то пропустят или в процессе индексации возникнут ошибки.
  • На сайте имеется архив со страницами, которые не связаны друг с другом. Их стоит перечислить в Sitemap, чтобы робот успешно их просканировал.
  • Сайт очень молод и имеет мало внешних ссылок. Если ссылок слишком мало, то роботы Яндекса и Google попросту не найдут молодой сайт.
  • На сайте расположено очень много видео- или фотоконтента. С помощью Sitemap роботы «вытянут» из него данные по мультимедийному контенту.

Когда можно обойтись без Sitemap

Бывает и так, что файл Sitemap попросту не нужен сайту, если проект:

  • Очень маленький и состоит буквально из 5-10 страниц. Простыми словами, если вам нужно, чтобы в поиске было всего 5-10 страниц, Sitemap создавать необязательно.
  • Расположен на обычном хостинге. Как правило, современные хостинг-провайдеры, предоставляющие вебмастерам серверные мощности под свои проекты, позволяют автоматически создавать Sitemap-файлы. Единственное, что необходимо сделать — найти информацию на этот счет в FAQ своего хостинг-провайдера или обратиться в его службу поддержки.
  • Имеет четкую, продуманную структуру внутренних ссылок. То есть роботы поисковых систем без каких-либо проблем могут перейти по всем этим ссылкам с главной страницы и просканировать их.
  • Содержит небольшое количество медиаконтента (фильмов, картинок и т. д.). Если на вашем сайте немного подобных файлов, роботы поисковых систем смогут самостоятельно найти их и проиндексировать.

Зачем нужна карта сайта: используем файл sitemap XML с пользой | Rookee

Файл Sitemap XML, или карта сайта, – это мощный инструмент в сфере SEO-продвижения. Если говорить просто, то это служебный файл, который показывает систематизированный перечень страниц XML, рекомендованных для приоритетной поисковой индексации. 

Сразу нужно упомянуть, что Sitemap XML не стимулирует увеличение скорости и периодичности индексации страниц – это самое распространенное заблуждение в этой теме. Нужно смириться с тем, что поисковые машины Google и Яндекс индексируют все, до чего могут «дотянуться», а не исключительно те страницы, которые им разрешили проанализировать. 

Поисковые системы индексируют в следующих случаях: 

  • алгоритм смог найти и просканировать страницу;
  • роботы определили страницу как качественную. 

Следовательно, если вы специально укажете определенную страницу в Sitemap XML, то это совсем не значит, что у нее появится приоритет в ранжировании. Для эффективного использования этого файла его рекомендуют рассматривать в качестве подсказки, содержимое которой дает понять алгоритмам поисковой системы, какие страницы вы считаете наиболее качественными. Но это только подсказка, а не руководство к действию. 

Ошибки последовательности при расстановке приоритетов 

Многие допускают серьезную ошибку, когда организовывают передачу поисковым системам информации о странице. Обычно проблема заключается в нарушении последовательности. К примеру, страницу можно закрыть от индексации в файле robots.txt, но при этом ссылку на нее добавить в Sitemap XML. Таким образом, мы говорим поисковой системе: «нужно заглянуть сюда, ведь здесь качественная тематическая страница», но при этом запрещаем ее индексацию в другом служебном файле. 

Аналогично ситуация обстоит с метатегами robot noindex/follow. Если в коде страницы планируется использование этих тегов, то страницу нельзя включать в карту сайта, иначе она вообще не попадет в индекс.  

Чтобы избежать ошибок при использовании карты сайта, нужно условно выделить следующие категории его страниц: 

  • служебные. Страницы несут пользу для аудитории, но не являются целевыми с точки зрения конверсии;
  • посадочные. Высококачественные продающие страницы, адаптированные под прием трафика из поисковой выдачи. 

Все страницы, которые вошли в последнюю категорию, должны присутствовать в карте сайта, но их нельзя блокировать. И наоборот, служебные страницы нужно заблокировать, а также исключить их из использования в карте сайта. 

Sitemap XML и общее качество сайта 

Сегодня поисковые системы научились давать комплексную оценку сайта. Определение качества веб-ресурса является важнейшим фактором поискового ранжирования. 

Влияние карты сайта на восприятие его качества можно понять на следующем примере. 

Допустим, на ресурсе есть хорошие страницы, при оптимизации которых были учтены все возможные факторы ранжирования. Но при этом сайт имеет 3000 страниц, из которых только 5 соответствуют высоким стандартам. В такой ситуации ресурс не получит приоритета в ранжировании, так как очевиден слишком большой разрыв в соотношении хороших и плохих страниц. Поисковые системы не любят рисковать лояльностью пользователей, поэтому сайт с плохим содержимым не попадет в топ. 

С другой стороны, разработчики Яндекса и Google понимают, что для нормального функционирования сайта ему нужны служебные страницы, которые никак не связаны с целевым действием. К примеру, это может быть раздел с контактами или страница для заполнения регистрационной формы. Если в Sitemap XML включить все эти страницы, то таким образом мы сообщаем роботам, что просто отсутствуют подсказки относительно качественного контента и страниц с низким приоритетом. 

Рассмотрим еще одну гипотетическую ситуацию: 

К примеру, сайт состоит из 2000 страниц, при этом в карте ресурса отмечено 900 страниц. Это значит, что именно этот контент вы рекомендуете проиндексировать, а остальные советуете считать служебными. Но алгоритмы поисковиков не верят обещаниям и в любом случае проводят проверку. В результате оказывается, что по внутренним метрикам качественных страниц есть только 200 штук. Такую ситуацию поисковая система понимает однозначно: сайт неплохой, но приоритета не заслуживает, так как владелец не может отличить качественную страницу от плохого контента. 

Особенности «маскировки» ненужных страниц 

Как мы выяснили, алгоритмы ранжирования используют данные из карты сайта в качестве шпаргалки, в которой указываются приоритетные для индексации страницы высокого качества. Однако отсутствие страниц в этом файле совершенно не исключает того, что рано или поздно они будут проиндексированы. Чтобы просмотреть все страницы, которые прошли индексацию, достаточно воспользоваться командой «site:». 

Методом исключения можно получить доступ к перечню страниц, которые почему-то не должны были оказаться в карте сайта, но присутствуют там. Это можно сделать с помощью метатегов noindex/follow в файле robots. txt. 

Поисковый запрос, выполненный с помощью оператора «site:», ранжирует страницы по мере снижения их качества и потенциала. Соответственно, страницы из нижней части поисковой выдачи можно доработать или исключить из показа. 

Способы создания Sitemap XML 

Интегрирование в CMS. Многие современные системы управления сайтами уже имеют встроенные функции генерации карты веб-ресурса. Чтобы узнать о наличии подобной функции в определенном движке, придется внимательно изучить техническую документацию. Обычно соответствующая опция находится в настройках администратора. Также всегда можно уточнить детали в службе поддержки программного продукта. Еще можно попробовать с помощью браузера перейти по адресу https://вашсайт.com/sitemap.xml. Есть большая вероятность, что файл Sitemap XML не только уже сгенерирован, но и динамически обновляется. 

Отдельный скрипт. Если хорошо разобраться в протоколе XML-карты и технических спецификациях, то можно своими силами создавать код для генерации карты сайта. Это удобный и рациональный способ, но он подходит только для программистов. Если вы таковым не являетесь, то лучше пользоваться любыми другими методами. 

Внешние плагины. Если ваша CMS не умеет самостоятельно генерировать карту сайта, то это всегда можно сделать посредством стороннего плагина. С помощью все тех же поисковиков можно без проблем найти дополнения практически для любой системы администрирования сайтами. В самых специфических случаях можно привлечь программистов для создания уникального плагина для конкретной платформы. 

Компьютерные парсеры. Это специальное программное обеспечение, которое устанавливается на рабочем ПК. С помощью программы проводится глубокий технический аудит сайта. В том числе на основе его результатов можно получить доступ к файлу Sitemap XML, сформированному методом сканирования структуры проекта. 

Генераторы карты сайта. Сегодня в открытом доступе работают десятки автоматических генераторов карты сайта. Они сканируют ресурс, после чего формируют файл в заданном формате, который можно быстро скачать. Главным минусом такого сервиса является то, что уже после следующего обновления сайта приходится еще раз генерировать новый Sitemap. 

Если речь идет об оптимизации крупного проекта, то стоит отдать предпочтение автоматизированным методам создания карты сайта. Важно понять, что Sitemap XML должен не просто присутствовать, но и передавать поисковой системе актуальные данные. 

Ликвидация проблем с индексацией 

Некоторым оптимизаторам кажется, что Sitemap XML – это малозначительная часть продвижения, которой можно даже пренебречь. Но это не так, более того, в некоторых случаях карта сайта становится незаменимым инструментом. К примеру, Sitemap помогает в тех ситуациях, когда с проекта регулярно отправляются в Сеть подборки страниц, но далеко не все из них успешно проходят индексацию. Это может быть крупный e-commerce-проект с каталогом на 200 тыс. товаров, 10 тыс. страниц категорий и 40 тыс. страниц подкатегорий. Но отправка в Google карты сайта с 250 тыс. адресов показывает, что в индексе находится только 174 тыс.

из них. 

Как мы уже говорили, поисковые алгоритмы сканируют то, что им нравится, или то, до чего они «дотянулись», но с меньшим энтузиазмом. Поэтому нужно выяснить причину, почему в индексацию не попало значительное количество товаров. Для этого стоит разделить товары по разным категориям, создав для каждой собственный Sitemap XML. Внесение изменений в карту сайта поможет методом исключения определить, почему некоторые страницы не проходят индексацию. 

Для начала в качестве гипотез используем самые распространенные причины отказа поисковых систем от индексации. Итак, сканирование не проходит на страницах: 

  • без графического изображения товара или иллюстрации услуги;
  • если описание в карточке товара имеет низкую уникальность или объем до 200 слов;
  • отсутствуют отзывы, комментарии или другие факты пользовательской заинтересованности. 

В каждую карту сайта необязательно добавлять все ссылки категории. Главное – включить туда достаточно адресов для того, чтобы по итогам эксперимента можно было сделать однозначный вывод. Обычно для проверки гипотезы требуется 20–50 контрольных образцов для каждой подборки. 

Сама проверка гипотез на основе Sitemap XML проводится таким образом. К примеру, у вас возникло предположение, что страницы не индексируются из-за отсутствия картинок в карточках товара. В контрольную группу новой карты сайта нужно добавить ссылки на страницы, где графический контент был добавлен. Если страницы будут проиндексированы, то нужно будет внести соответствующие изменения по всему ресурсу. Если опыт не дал результата, то стоит проверить другие гипотезы, которые получится придумать. 

Подведем итоги 

Работая над оптимизацией карты сайта, нужно не забывать о логике и последовательности действий. Если страница будет заблокирована с помощью robots.txt или метатега noindex, то ее адреса не должно быть в Sitemap XML. 

Карта сайта – это не список приказов, а перечень рекомендаций для алгоритмов поисковых систем. Этот инструмент лучше применять в качестве средства для удобного выявления ошибок и проблем в индексации. 

При работе с большими проектами настоятельно рекомендуется использовать программные средства синхронизации для карты сайта, файла robots.txt и метатега robots. Ручная поддержка порядка займет слишком много времени, а автоматические инструменты позволят сохранять уверенность в том, что нужные страницы находятся в карте сайта и не противоречат общей логике работы алгоритмов ранжирования. 

Кстати, сервис Rookee автоматически анализирует файл Sitemap XML на ошибки и дает рекомендации по их исправлению. Достаточно зарегистрироваться и создать проект в сервисе – это бесплатно.

XML-карт сайта в WordPress 5.5 и Yoast SEO • Yoast

Начиная с версии 5.5, WordPress поставляется с собственными встроенными XML-картами сайта. Вместе с Google мы предложили добавить эту функцию на каждый сайт WordPress. XML-карты сайта предлагают поисковым системам дополнительный способ узнать о вашем контенте. Теперь, когда XML-карты сайта являются основной функцией WordPress, более 41% сайтов в Интернете будут иметь их по умолчанию. Краулеры будут рады наткнуться на весь этот свежий контент. Круто, правда? Но как насчет карт сайта XML в Yoast SEO?

Что делает функциональность XML-карты сайта Yoast SEO теперь, когда у WordPress есть собственная карта сайта?

Автоматическое создание полностью сформированной XML-карты сайта для каждой установки всегда было одной из самых важных функций Yoast SEO. Зачем нам это выбрасывать? Ну, мы не знаем!

Новая функция карты сайта XML в WordPress 5.5 очень проста. Тот, что в Yoast SEO, сложный, с рядом улучшений и улучшений производительности.

Итак, несмотря на то, что миллионы сайтов улучшают свои шансы на ранжирование благодаря картам сайта XML в WordPress 5.5 и более поздних версиях, мы уверены, что карты сайта XML в Yoast SEO богаче, лучше и мощнее.

Должен ли я отключить XML-карту сайта WordPress?

Поскольку каждый WordPress теперь поставляется со своей собственной картой сайта XML, вы можете подумать, что было бы неплохо отключить ее, если у вас уже есть карта сайта. Хотя это, вероятно, не приведет к проблемам с индексацией или тому подобному, это определенно поможет, если у вас работает только одна карта сайта. Не рискуйте запутать поисковые системы.

Начиная с Yoast SEO 14.5, мы автоматически отключаем XML-карту сайта по умолчанию (если вы используете наши XML-карты сайта) и убедитесь, что наша работает безупречно. Вам не нужно ничего делать.

Если по какой-то причине вы не используете Yoast SEO и вам не нужна карта сайта XML на вашем сайте WordPress, вы можете отключить ее. В документации по картам сайта WordPress XML вы можете найти дополнительную информацию о том, как это сделать. Вы также можете отключить его, изменив настройки на , чтобы поисковые системы не индексировали ваш сайт , но это также будет означать, что ваш сайт вообще не будет отображаться в результатах поиска. Будьте осторожны с этим!

В чем разница между основной XML-картой сайта в WordPress и Yoast SEO?

Текущая XML-карта сайта WordPress очень проста, в то время как XML-карты сайта в Yoast SEO используются уже много лет. В настоящее время мы продолжим советовать использовать наши XML-карты сайта.

Ваша карта сайта не только создается автоматически, но мы также предоставляем вам возможность определить, что входит в эту карту сайта. У нас уже есть список страниц по умолчанию, которые никогда не должны отображаться в карте сайта, но вы можете расширить его по своему усмотрению. Теперь, если вы не индексируете пост или страницу с помощью Yoast SEO, они немедленно удаляются из вашей карты сайта.

Кроме того, мы добавляем такие свойства, как дата последнего изменения, чтобы помочь поисковым роботам отличать новое от старого. Мы разбиваем большие карты сайта на более мелкие, чтобы все было быстро. И последнее, но не менее важное: мы включаем изображения в наши карты сайта, чтобы сканеры могли обнаружить их за один раз. Конечно, это всего лишь небольшая часть возможностей карт сайта Yoast SEO XML.

Что делает карта сайта XML в WordPress 5.5?

По своей сути XML-карта сайта представляет собой просто список URL-адресов в текстовом файле. Карта сайта в формате XML помогает сканерам поисковых систем обнаруживать ваш контент. Это помогает им находить и обновлять контент на вашем сайте, что помогает им поместить ваш контент в индексы для целей ранжирования. Текущая версия XML-карты сайта в WordPress очень проста и поддерживает лишь небольшой набор типов контента. Конечно, вы можете расширить его поддержку через API. Однако у вас нет возможности контролировать из самого WordPress, что входит в основную карту сайта, а что не должно отображаться.

Что произойдет, если я отключу настройку карты сайта Yoast XML?

Если вы отключите функциональность XML-карты сайта в Yoast SEO, мы не будем отключать основные XML-карты сайта WordPress. Вы все равно получите их в качестве «запасного варианта».

Поскольку XML-карты сайта ядра WordPress намного проще, чем у нас, их использование вместе с нашим SEO-плагином может привести к неожиданному поведению или даже ошибкам SEO . Например, посты или страницы, которые вы помечаете как « noindex (или иначе «непубличный») все равно будет включен в вашу карту сайта. Это посылает «смешанные сигналы» поисковым системам, которые могут вызывать ошибки и предупреждения в Google Search Console и других инструментах, как в примере ниже.

Подобные ошибки можно устранить или предотвратить следующими способами:
— Включение карт сайта Yoast SEO XML (что отключает основные карты сайта WordPress).
— Отключение карт сайта ядра WordPress или настройка их поведения в коде вашей темы/плагина (см. документацию).

Как настроить XML-карты сайта ядра WordPress?

Если вы предпочитаете использовать XML-карты сайта WordPress, а не наши, и хотите настроить или изменить выходные данные (например, включить или исключить определенные типы контента), вы можете узнать больше из документации.

Что такое карта сайта в формате XML? Как создать карту сайта (с примерами)

XML-карты сайта — одна из самых непонятных составляющих SEO-уравнения.

Я встречал оптимизаторов, которые не могли объяснить, зачем они нужны, не говоря уже о том, как их настроить «правильно».

Вот загвоздка:

Точно так же, как карта необходима для нахождения пункта назначения по дороге, карта сайта в формате XML имеет решающее значение для поисковых систем для определения URL-адресов вашего веб-сайта.

Если ваши URL-адреса не будут просканированы, они не будут проиндексированы, и ваши страницы (конечно) не будут ранжироваться без индексации.

Короче говоря, XML-карты сайта играют решающую роль в поисковой оптимизации.

В сегодняшней статье я покажу вам, как создать XML-карту сайта с нуля и шаг за шагом идеально оптимизировать ее для SEO. Я прикрываю:

  • Что такое XML-карта сайта
  • XML и карты сайта HTML
  • XML-теги карты сайта (и какие из них следует использовать)
  • Примеры XML-карты сайта
  • Зачем нужна карта сайта XML
  • Как создать XML-карту сайта
  • Шесть рекомендаций по созданию файла sitemap. xml

Без лишних слов, давайте перейдем к делу.

Что такое XML Sitemap? (И почему, черт возьми, это должно вас волновать)

Проще говоря:

XML-карта сайта — это дорожная карта для поисковых систем.

В нем перечислены важные материалы вашего веб-сайта в формате XML, чтобы поисковые системы могли легко найти и проиндексировать ваш контент и в конечном итоге отобразить его на страницах результатов поиска.

Вы должны указать в своей XML-карте сайта любую веб-страницу (или файл), которую вы хотите отображать в поисковых системах.

Почему?

Потому что карта сайта обеспечивает возможность обнаружения вашего контента.

Допустим, у вас есть веб-страницы, на которые нет ссылок ни на вашем сайте, ни в Интернете в целом. Если эти страницы не имеют гиперссылок, указывающих на них, поисковые роботы не смогут их найти.

XML-карта сайта (отправляемая поисковым системам) гарантирует, что поисковые системы смогут найти любые страницы, которые вы хотите включить в поисковую выдачу.

Но это еще не все.

Вы можете использовать XML-карту сайта для предоставления дополнительной информации поисковым системам, например, когда ваш контент последний раз обновлялся и какие страницы имеют более высокий приоритет. Подробнее об этом позже.

XML и HTML карты сайта — в чем разница?

Вы можете добавить на свой сайт два типа карты сайта; карта сайта в формате XML и карта сайта в формате HTML.

  • Карты сайта XML используют расширяемый язык разметки (XML)
  • Карты сайта HTML используют язык гипертекстовой разметки (HTML)

Но помимо кода, который они используют, они также выполняют различные функции:

Карта сайта XML 90 с примером XML-карты сайта:

Как видите, XML-карта сайта неудобна для человека.

Карты сайта в формате XML — это фиды, специально предназначенные для поисковых систем.

Они помогают поисковым системам, таким как Google, понять, какие URL сканировать и какие из них имеют приоритет.

Кроме того, как часто меняются эти URL-адреса и какие новые добавляются на сайт.

Эта информация помогает планировщикам поисковых систем лучше оценивать, когда и как часто следует повторно сканировать конкретный URL-адрес.

Карта сайта в формате HTML

Вот пример карты сайта в формате HTML:

Она сильно отличается от карты сайта в формате XML.

Это потому, что эта веб-страница предназначена как для людей, так и для роботов.

Карта сайта в формате HTML облегчает навигацию по веб-сайту.

С точки зрения поисковой системы, карта сайта в формате HTML является полезным инструментом для обнаружения URL-адресов (при условии, что карта сайта сканируется и ссылки, содержащиеся в карте сайта, переходят).

Но это не единственная их ценность для SEO:

HTML-карты сайта также распределяют PageRank по всему веб-сайту.

Поскольку карты сайта в формате HTML обычно связываются с каждой страницы сайта (через навигационную ссылку в нижнем колонтитуле), они имеют огромное значение PageRank.

Это означает, что они могут передать массу своего входящего PageRank другим страницам веб-сайта через внутренние ссылки.

Есть страница с плохим рейтингом?

Добавьте эту страницу в карту сайта HTML.

Это может быть быстрый и простой способ повысить рейтинг.

Как выглядит карта сайта в формате XML?

Как я уже говорил, XML-карты сайта предназначены для поисковых систем, а не для людей.

Они, безусловно, могут показаться запутанными, если вы никогда раньше с ними не сталкивались:

 
<ссылка> https://seosherpa.com/ 2022-01-26T19:12:36+09:00 Ежедневно <приоритет>1 <ссылка> https://seosherpa.com/services/ 2021-11-16T13:21:20+09:00 Ежедневно <приоритет>0,8

Однако, если вы знаете, что означает каждый из этих компонентов:

  • XML-декларация
  • Набор URL-адресов
  • URL-адрес
  • Последнее изменение
  • Приоритет
  • Частота изменений
  • 0 XML-карты сайта довольно просты.

    Давайте разберем каждый из них:

    Объявление XML

    Проще говоря, объявление XML сообщает поисковым системам, что они читают файл XML.

      

    В объявлении XML также указывается версия XML и используемая кодировка символов.

    • Версия должна быть 1.0
    • Кодировка должна быть UTF‑8.

    Поместите объявление XML в начало файла sitemap.xml.

    Набор URL-адресов

    Набор URL-адресов представляет собой контейнер для всех URL-адресов в карте сайта.

    Он начинается с указания стандарта протокола, который использует sitemap.xml:

      

    Вы заметите, что протокол, упомянутый в приведенном выше примере, является стандартом 0.9.

    Google, Yahoo и Microsoft поддерживают этот стандарт карты сайта — я рекомендую вам его использовать.

     закрывается в нижней части XML-документа:

      

    Этот короткий фрагмент кода сообщает поисковым системам, что набор URL закончился. в карте сайта XML:

     <ссылка>
    https://seosherpa.com/services/
     

    Между открывающим и закрывающим необходимо указать расположение URL во вложенном теге  .

    Здесь важно указать абсолютный URL-адрес, включая протокол HTTP:// или HTTPS://.

    Другими словами, укажите URL точно так, как он будет отображаться в веб-браузере.

    С другой стороны, относительные URL-адреса, такие как /services/, не будут распознаваться.

    Местоположение URL — единственный атрибут, который ДОЛЖЕН указываться между тегами URL.

    Но с учетом сказанного можно добавить еще три (необязательных) свойства:

    Последнее изменение

    Тег определяет, когда содержимое этого URL-адреса было изменено в последний раз.

     2022-01-26T19:12:36+09:00 

    Допустим, вы обновили сообщение в блоге 10 января 2022 года; атрибут будет читаться как 2022-01-10.

    Сообщает поисковым системам, когда содержимое этого URL-адреса было в последний раз изменено, что теоретически влияет на повторное сканирование этой страницы поисковой системой.

    Можно также указать время, но это необязательно.

    Независимо от того, включаете ли вы только дату или время, обязательно используйте формат «дата-время W3C».

    Это единственный формат, распознаваемый для тега в файле sitemap.xml.

    Приоритет

    Тег указывает приоритет URL-адреса по отношению ко всем другим URL-адресам на веб-сайте.

     0.8 

    Другими словами, он позволяет указать поисковым системам, какие URL-адреса должны иметь приоритет при распределении краулингового бюджета для вашего сайта.

    Значения приоритета могут быть установлены от 0,0 (наименьший приоритет) до 1,0 (максимальный).

    Проблема в том, что Google игнорирует в картах сайта XML, потому что, по словам Гэри Иллиса, «это мешок шума».

    мы их игнорируем. По сути, это мешок с шумом

    — Гэри 鯨理/경리 Illyes (@methode) 28 марта 2017 г.

    Так что вообще нет смысла устанавливать приоритет.

    Частота изменений

    Принимая во внимание, что тег определяет, когда содержимое этого URL-адреса было изменено в последний раз…

    Тег указывает, как часто содержимое вероятно изменяется.

     Ежедневно 

    Его цель — дать поисковым системам некоторое представление о том, как часто они могут повторно сканировать URL-адрес.

    Change frequency in an XML sitemap can be set to any of the following values:

    • always
    • hourly 
    • daily
    • weekly
    • monthly 
    • yearly
    • never

    If the tag was set to < changefreq>Еженедельно поисковая система может повторно сканировать этот URL-адрес каждые семь дней.

    Делать это чаще было бы расточительно, поскольку содержимое вряд ли изменится.

    Однако устарела с точки зрения Google:

    URL + дата последнего изменения — это то, что нам важно для веб-поиска.

    — 🐄 John 🐄 (@JohnMu) 17 августа 2017 г.

    Поскольку большинство генераторов карт сайта ужасно сопоставляют тег с фактической частотой изменений, легко понять почему.

    Вы можете опустить атрибут частоты изменений в файле sitemap.xml.

    Примеры файлов Sitemap в формате XML

    Теперь, когда мы знаем, что такое XML-карта сайта, давайте взглянем на некоторые примеры файлов sitemap.xml, как они выглядят в реальном мире.

    Вот XML-карта сайта для страниц Gymshark:

    Эту карту сайта можно улучшить, удалив , так как она игнорируется Google, и добавив объявление XML в начало XML-файла карты сайта.

    (Включение XML-декларации рекомендуется для всех карт сайта).

    Вот еще один пример XML-карты сайта, на этот раз от yasisland.ae

    Как и карту сайта Gym Shark, эту карту сайта можно улучшить, добавив объявление XML в начале.

    Кроме того, параметры «Частота изменения» и «Приоритет» могут быть удалены, поскольку в настоящее время они являются излишними.

    Помимо этого, эти XML-карты сайта настроены правильно.

    Итак, на этом этапе вы, вероятно, задаетесь вопросом:

    Как выглядит оптимальная XML-карта сайта?

    Примерно так:

     
    
    <ссылка>
    https://seosherpa.com/
    2022-01-26
            
    <ссылка>
    https://seosherpa.com/services/
    2021-11-16
    
     

    Он должен содержать:

    • Объявление XML (версия)
    • Набор URL-адресов
    • URL-адреса
    • Последнее изменение (только дата)

    И это действительно все.

    Зачем мне нужен файл Sitemap в формате XML?

    Как я объяснял ранее, поисковая система находит контент в Интернете, переходя с одной веб-страницы на другую с помощью ботов, которых часто называют «пауками»:

    Когда эти пауки обнаруживают новую страницу по внутренней или внешней ссылке, они добавляют эту страницу в свой индекс.

    А проблема с обходом?

    Поисковые системы не могут таким образом найти весь контент в Интернете.

    Если веб-страница не связана с другой известной страницей, поисковая система не найдет ее.

    Здесь на помощь приходит XML-карта сайта.

    XML-карты сайта действуют как страховка от сканирования, информируя поисковые системы о том, где найти наиболее важные страницы на вашем веб-сайте, чтобы облегчить обнаружение и индексацию контента.

    Это очень важно, потому что поисковые системы не могут ранжировать ваш контент без его предварительной индексации.

    Для каких типов веб-сайтов требуется XML-карта сайта?

    Если вы последуете совету Google, XML-карты сайта лучше всего подходят для:

    • Крупных веб-сайтов с тысячами страниц
    • Веб-сайты с обширными архивами
    • Веб-сайты с большим количеством мультимедийного контента
    • Веб-сайты без обратных ссылок или с очень небольшим количеством обратных ссылок

    Но вот в чем дело:

    Карта сайта в формате XML приносит пользу всем веб-сайтам.

    Когда вы добавляете XML-карту сайта, роботы поисковых систем могут лучше понять структуру вашего сайта, обнаружить ваш контент и узнать, когда он последний раз обновлялся.

    Даже если у вас одностраничный веб-сайт, включение XML-карты сайта, вероятно, того стоит.

    Какие страницы следует включить в XML-карту сайта?

    Краткий ответ:

    Включите любые страницы, которые вы хотите отображать в результатах поиска, в свою XML-карту сайта и исключите все остальное.

    Другими словами, ваша карта сайта должна включать только полезные страницы. Например:

    • Домашняя страница
    • О странице
    • Страницы продуктов
    • Страницы услуг
    • Страница контактов
    • Сообщения в блоге

    Вообще говоря, вы не должны включать такие страницы, как:

    • Страницы благодарности
    • Страницы тегов
    • Частные медиафайлы

    Это все примеры URL-адресов, которые вы не хотели бы показывать в результатах поиска.

    Но помните: то, что вы исключили страницу из карты сайта, не означает, что она не будет проиндексирована.

    Если на страницу есть ссылки, указывающие на нее, есть вероятность, что Google (и другие поисковые системы) просканирует, проиндексирует и отобразит эту страницу в результатах поиска.

    Чтобы гарантированно удалить страницу из результатов поиска, исключите ее из карты сайта XML и добавьте к ней тег no-index.

    И это подводит меня к следующему пункту:

    Каждая страница в вашей карте сайта XML должна быть индексируемой.

    Ваша карта сайта никогда не должна содержать страницы, которые возвращают следующие коды состояния:

    • 404 – Страница не найдена
    • 301 или 302 – Страница перемещена в другое место .

      И, если по этому URL-адресу нет страницы, она не индексируется.

      Кроме того:

      Каждая страница должна быть доступна для сканеров поисковых систем.

      Вкратце, robots. txt не блокирует страницу, и там нет директив (таких как мета-роботы, канонические ссылки или теги x-robots), говорящих поисковым системам не индексировать страницу.

      Теперь, когда вы знаете, что входит в XML-карту сайта, давайте обсудим, как ее создать.

      Как создать карту сайта в формате XML (2 методики)

      Если вы создали свой веб-сайт с помощью системы управления контентом, такой как Shopify или Wix, вам не нужно создавать карту сайта XML, потому что ваша CMS сгенерирует карту сайта для вас.

      XML-карта сайта на этих платформах (и им подобных) автоматически обновляется при добавлении или удалении страниц с сайта.

      Если ваша CMS этого не делает, то обычно есть плагин, который сделает это за вас.

      С другой стороны, если вы не используете CMS, вам нужно будет вручную создать XML-карту сайта.

      Давайте разберем процесс:

      Как создать XML-карту сайта вручную

      Если вы беспокоитесь, что вам придется кодировать XML-карту сайта вручную, не волнуйтесь!

      Этот процесс не выполняется вручную.

      Мы собираемся использовать Screaming Frog, чтобы сделать большую часть работы за вас.

      Первый шаг — установить Screaming Frog SEO Spider.

      Совет — вы можете использовать бесплатную версию, если ваш сайт меньше трехсот страниц.

      После установки перейдите в «Режим», затем в «Паук».

      Затем перетащите URL-адрес домашней страницы в поле с пометкой «Введите URL-адрес для паука».

      Затем нажмите «Пуск». сканировать ваш сайт.

      После завершения сканирования мы настраиваем некоторые параметры:

      Поскольку Google не использует и , я рекомендую исключить эти теги из файла карты сайта.

      Я также предлагаю исключить из вашей XML-карты сайта, если вы создаете XML-карту сайта вручную.

      Почему?

      Потому что перестраивать XML-карту сайта каждый раз, когда вы вносите незначительные изменения на страницу, — настоящая боль.

      Исключение из вашей XML-карты сайта означает, что вам не нужно этого делать.

      Прежде чем извлечь файл карты сайта, вы можете добавлять, редактировать или удалять URL-адреса в зависимости от того, что вы хотите, чтобы поисковые системы сканировали и индексировали.

      После того, как вы закончите точную настройку карты сайта, вы можете загрузить ее в корневую папку своего веб-сайта с «sitemap.xml» в качестве имени файла.

      Довольно просто, правда?

      Как создать XML-карту сайта в WordPress

      Это может показаться сюрпризом, но «стандартная» установка WordPress не поставляется с создателем XML-карты сайта.

      Для создания XML-карты сайта в WordPress вам понадобится плагин, например Yoast SEO.

      Вот как добавить Yoast на свой веб-сайт, если он еще не установлен:

      На панели управления WordPress перейдите в «Плагины», а затем «Добавить новый».

      Затем выполните поиск «Yoast SEO».

      Затем нажмите «Установить сейчас» в первом результате, затем «Активировать».

      После установки Yoast перейдите к настройкам Yoast и выберите «SEO», затем «XML Sitemaps», а затем «Общие». на этой вкладке убедитесь, что функция карты сайта XML включена.

      Если XML-карты сайта включены, вы должны увидеть индекс своей карты сайта по адресу yourdomain.com/sitemap_index.xml.

      К счастью, Yoast автоматически исключает неиндексируемые страницы (например, страницы с метатегом robots «без индекса») из карты сайта. При этом стандартная настройка в большинстве случаев должна подойти.

      Однако при желании вы можете исключить определенные типы сообщений и таксономии для дальнейшей оптимизации вашей карты сайта:

      Для сайта SEO Sherpa я исключил медиафайлы и теги из своей карты сайта, потому что, по крайней мере, в моем случае эти страницы имеют небольшую ценность для конечных пользователей.

      Как создать XML-карту сайта в Wix

      В отличие от WordPress, Wix имеет встроенную функцию XML-карты сайта.

      Проблема в том, что он довольно ограничен.

      Единственный вариант, который у вас есть, это исключить определенные страницы.

      Если вы хотите исключить страницу, перейдите на вкладку настроек «SEO (Google)» для страницы и выключите переключатель «Показывать эту страницу в результатах поиска».

      Добавляет на страницу метатег noindex И исключает ее из XML-карты сайта.

      Одна из проблем с жесткой функциональностью карты сайта Wix заключается в том, что она включает URL-адреса, которые были канонизированы для другой страницы.

      Это, по сути, говорит «оценивать эту страницу» и «не оценивать эту страницу» одновременно, что очень сбивает с толку поисковые системы.

      В результате на страницах результатов поиска может отображаться неправильная версия.

      Если у вас есть веб-сайт Wix, вы можете найти автоматически сгенерированную карту сайта по адресу  yourdomain.com/sitemap.xml.

      Как создать XML-карту сайта в Shopify

      Вам не нужно создавать XML-карту сайта, если ваш сайт создан с помощью Shopify, это делается автоматически.

      К сожалению, персонализация невозможна.

      С Shopify вы даже не можете исключить страницу из своей XML-карты сайта — все включено.

      Единственный способ контролировать то, что отображается в результатах поиска, — это добавить тег noindex непосредственно к файлам . liquid.

      Тем не менее, в Shopify неиндексированные страницы будут отображаться в карте сайта XML, что, как мы указывали ранее, не идеально.

      Найдите свою карту сайта на yourdomain.com/sitemap.xml.

      Как отправить карту сайта в Google

      К настоящему моменту у вас должна быть создана карта сайта.

      Последний (и, возможно, самый важный) шаг — отправить карту сайта в Google.

      Конечно, перед этим вам нужно знать, где находится ваша карта сайта.

      Если вы создали карту сайта вручную или используете Wix или Shopify, то карту сайта можно найти по следующему URL-адресу:

      yourdomain.com/sitemap.xml

      С другой стороны, если вы Если сайт находится на WordPress, и вы использовали Yoast для своего sitemap.xml, то вы найдете индекс карты сайта по этому URL-адресу:

      yourdomain.com/sitemap_index.xml

      Если вы используете какую-либо другую платформу или не можете найти свою карту сайта ни в одном из этих мест, вы можете проверить ее с помощью нашего инструмента оценки SEO:

      Когда вы узнаете, где находится ваша XML-карта сайта, перейдите в Google Search Console. затем «Карты сайта», которые вы найдете в меню «Индекс».

      Затем вставьте URL-адрес вашей карты сайта в поле карты сайта и нажмите «Отправить».

      Ваша карта сайта «должна» быть успешно отправлена:

      На этом все готово!

      7 «Основные» рекомендации по работе с XML-картой сайта

      Давайте закончим подборкой рекомендаций по работе с XML-картой сайта.

      Вы можете применить эти методы, чтобы убедиться, что ваша XML-карта сайта оптимизирована для эффективного сканирования и индексирования.

      Приступаем.

      (1). Используйте динамическую карту сайта, а не статическую карту сайта

      Представьте, что вам нужно вручную обновлять карту сайта XML каждый раз, когда вы вносите изменения на свой веб-сайт?!

      Это именно то, что вам нужно сделать со статической картой сайта.

      К счастью, большинство современных CMS имеют встроенную функцию динамической XML-карты сайта или доступную через плагин.

      Что означает:

      Ваша карта сайта будет автоматически обновляться всякий раз, когда вы добавляете, изменяете или удаляете существующие страницы.

      Ручное вмешательство не требуется.

      Использование динамической карты сайта особенно важно для больших веб-сайтов, где часто добавляются приоритетные страницы.

      Обязательно используйте его.

      (2). Используйте стандартное местоположение и имя карты сайта

      Если вы используете /my_website_sitemap.xml в качестве пути для своей XML-карты сайта, есть вероятность, что поисковые системы не найдут ее.

      Чтобы вашу карту сайта было легко обнаружить, придерживайтесь стандартных адресов:

      https://yourdomain.com/sitemap.xml для отдельных карт сайта

      ИЛИ

      https://yourdomain.com/sitemap_index.xml, если у вас есть несколько карт сайта в индексе.

      Это так просто.

      (3). Ссылка на XML-карту сайта в файле robots.txt

      Ваш файл robots.txt посещают роботы поисковых систем, когда они начинают сканирование вашего веб-сайта.

      Они используют robots.txt, чтобы понять, как сканировать сайт.

      Ссылаясь на XML-карту сайта в файле robots. txt, вы гарантируете, что поисковые роботы смогут ее найти.

      Чтобы добавить XML-карту сайта в robots.txt, откройте текстовый файл robots и вставьте в него эту строку:

       Карта сайта: https://www.yourdomain.com/sitemap.xml 

      Вы можете найти robots.txt файл в корневом каталоге вашего сервера по пути «/robots.txt».

      Если у вас есть несколько XML-карт сайта, просто перечислите их одну за другой, например:

       Карта сайта: https://www.yourdomain.com/page-sitemap.xml
      Карта сайта: https://www.yourdomain.com/post-sitemap.xml
      Карта сайта: https://www.yourdomain.com/product-sitemap.xml 

      Хотя теоретически вы можете разместить карту сайта в любом месте файла robots.txt, обычно лучше всего размещать ее в конце:

      (4). Исключить неиндексированные страницы из карты сайта

      Роль карты сайта в формате XML состоит в том, чтобы сообщить поисковым системам, что следует сканировать и индексировать.

      Это означает, что должны быть включены только предпочитаемые вами страницы, достойные рейтинга.

      Добавление неиндексируемых, неканонических страниц или страниц с переадресацией в вашу карту сайта запутает поисковые системы и может негативно сказаться на вашем краулинговом бюджете.

      (5). Не превышайте размер XML-карты сайта 50 МБ

      По данным Google, XML-карта сайта не должна превышать 50 МБ или 50 000 URL-адресов.

      Всякий раз, когда вы превышаете ограничение в 50 МБ или 50 000 URL-адресов, вы должны разделить один XML-файл Sitemap на несколько XML-файлов Sitemap.

      Превышение этих ограничений может привести к тому, что Google прекратит сканирование.

      Например, карту сайта можно разделить на «записи» и «страницы».

      А затем сгруппируйте их вместе в файл индекса Sitemap.

      (6). Игнорировать атрибуты Priority и Changefreq

      Как я указывал ранее, Google игнорирует оба этих тега:

      ваша карта сайта, что может привести к проблемам с краулинговым бюджетом и индексацией.

      Я рекомендую вообще не использовать теги или в карте сайта.

      (7). Мониторинг Google Search Console на предмет ошибок карты сайта XML

      Если Google не может просканировать вашу карту сайта XML, он сообщит вам через консоль поиска:

      Ошибки могут быть такими же простыми, как невозможность извлечения URL-адреса карты сайта XML, для отправленных URL-адресов, возвращающих статус 404 коды или без индекса.

      Наиболее частые проблемы:

      (a). Отправленный URL-адрес не найден (404)

      Это означает, что URL-адрес, указанный вами в карте сайта XML, не существует.

      Помните, если вы удаляете страницу со своего сайта, не забудьте удалить ее из карты сайта. Более того, используйте динамическую карту сайта в формате XML, и URL-адрес будет автоматически удален из вашей карты сайта.

      (б). Отправленный URL-адрес с пометкой «noindex»

      Это происходит, когда страница в карте сайта XML имеет метатег «noindex».

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *