подробное описание формата, примеры создания XML карты сайта
Комментарии: 0
19834
16.10.2018 | Время чтения: 12 минут
Автор: Симагин Андрей
Многие из вас слышали про необходимость наличия у сайта карты Sitemap (он же «сайтмап»), однако не все до конца понимают важность его присутствия на сайте. В данной статье мы проведем обзор файла формата Sitemap.xml, а также опишем варианты его генерации для различных типов сайтов.
Структура статьи:
- Для чего нужна карта сайта
- Описание формата Sitemap
- Маскирование символов
- Разбиение Sitemap на части
- Местоположение Sitemap.xml и его индексация
- Использование кириллических адресов
- Вопросы необходимости карты сайта
- Обзор вариантов генерации Sitemap.xml
Для чего нужна карта сайта Sitemap.xml
Карта сайта Sitemap – это файл XML либо текстового формата (TXT), содержащий в себе все URL сайта (ссылки на страницы либо изображения) и предназначенный для сообщения поисковым роботам информации о новых страницах на вашем ресурсе.
Конечно, поисковые системы проиндексируют ваш сайт и без сайтмапа, и зачастую сделают это не менее качественно, однако в некоторых случаях у поисковиков могут возникнуть сложности с индексацией страниц. Основными причинами неиндексации могут быть такие факторы, как:
- сайт имеет большую вложенность страниц (характерно для крупных веб-ресурсов)
- сайт имеет страницы без навигационных ссылок (на страницы невозможно перейти по внутренней навигации сайта)
- на сайте присутствуют динамические URL
Для подобных страниц из вышеописанных вариантов робот может не добраться никогда, так как в первом случае из-за глубокой вложенности он просто не дойдет до конечного URL, исчерпав краулинговые лимиты сайта, а во втором он физически их не увидит, так как не сможет на них перейти по ссылкам на сайте (например, это может быть вариант, когда ссылка есть, но проставлена при помощи JavaScript, CSS-стилем либо просто зашифрована, из-за чего в исходном коде страницы поисковый робот ее просто не увидит).
Однако, имея информацию о наличии файла Sitemap.xml, поисковый робот будет периодически его обходить и индексировать новые страницы сайта в нужном вам порядке, с необходимым приоритетом и именно по тем страницам, которые вам наиболее важны в данный момент.
Описание формата Sitemap
Sitemap может быть двух типов: текстового формата (TXT) и формата XML.
Текстовый формат представляет собой простой текстовый файл кодировки UTF-8 и содержащий в себе URL сайта в виде наборов строк (каждая ссылка с новой строки). Пример карты сайта текстового формата:
https://www.site.ru/page-1.html https://www.site.ru/page-2.html
Формат XML является расширенным форматом текстового варианта и позволяет передавать поисковым ботам дополнительную информацию. Пример файла Sitemap.xml:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www. site.ru/</loc> <lastmod>2018-10-03</lastmod> <changefreq>monthly</changefreq> <priority>1.0</priority> </url> <url> <loc>http://www.site.ru/page-1.html</loc> <lastmod>2018-10-03</lastmod> <changefreq>monthly</changefreq> <priority>0.9</priority> </url> <url> <loc>http://www.site.ru/page-2.html</loc> <lastmod>2018-10-03</lastmod> <changefreq>monthly</changefreq> <priority>0.9</priority> </url> ... <url> <loc>http://www.site.ru/page-N.html</loc> <lastmod>2018-10-03</lastmod> <changefreq>monthly</changefreq> <priority>0. 9</priority> </url> </urlset>
Описание элементов XML, на которые необходимо обратить внимание:
- url (обязательный параметр) – содержит все сведения о конкретном URL
- loc (обязательный параметр) – URL страницы. Для URL с параметрами необходимо маскирование
- lastmod – дата и время последнего изменения страницы в формате Datetime. При необходимости допускается опустить сегмент времени и использовать формат ГГГГ-ММ-ДД
- changefreq – указание рекомендательной частоты изменения страницы. Может принимать значения: always, hourly, daily, weekly, monthly, yearly, never
- priority – значимость страницы относительно других URL сайта. Допустимый диапазон значений 0.0 до 1.0. Чем страница важнее, тем приоритет больше. У главной страницы приоритет всегда равен 1, по умолчанию приоритет 0.5
Примечание: стоит упомянуть, что содержимое карты сайта является лишь рекомендацией поисковым роботам по обходу страниц (если установить периодичность обхода страниц раз в неделю, то робот может их обходить гораздо чаще, и наоборот, если установить частоту обхода ежечасно, то это не значит, что поисковики будут индексировать страницу каждый час).
Прочие форматы XML карты сайта:
- Файл Sitemap для изображений
- Отдельный сайтмап для изображений будет полезен, если изображения не доступны боту напрямую (например, если они загружаются с помощью JavaScript). Однако, зачастую, для этого можно использовать обычный Sitemap.xml и указывать в нем ссылки на изображения вместе с обычными URL. Подробнее о сайтмап для изображений в справке Google
- Файл Sitemap для новостей
- Используется для быстрой индексации новостных материалов вашего сайта, при этом ваш ресурс должен быть включен в каталог Google Новости. Требования к Sitemap: должен содержать не более 1000 URL, должен содержать URL новостей, опубликованных за последние два дня. Подробнее о сайтмап для новостей в справке Google
Маскирование
Маскирование в Sitemap.xml используется для URL-адресов и предназначено для интерпретации обычных символов в их псевдокоды в формате HTML:
- Амперсанд: & -> &
- Одинарные кавычки: ‘ -> '
- Двойные кавычки: » -> "
- Больше: > -> >
- Меньше: < -> <
Таким образом, всем привычный URL с параметрами и не маскированными спецсимволами по стандартам XML будет невалиден, пример:
Стандартный URL страницы (не валидный)
https://www. site.ru/index.php?page=news&date=22071981
Валидный URL в Sitemap с маскированием (символ «&» заменен на «&»)
<loc>https://www.site.ru/index.php?page=news&date=22071981</loc>
Для символов в URL, отличных от ASCI, помимо & также необходимо применять маскирование. Пример для URL-адреса:
http://www.site.ru/контакты.html
Тот же URL-адрес с использованием маскирования, для размещения в Sitemap:
http://www.site.ru/%D0%BA%D0%BE%D0%BD%D1%82%D0%B0%D0%BA%D1%82%D1%8B.html
Разбиение Sitemap на составные части
У файла Sitemap.xml есть ограничение как на объем содержащихся в нем URL, так и на сам размер файла. В каждом файле Sitemap.xml должно содержаться не более 50 000 URL, а его объем не должен превышать 50 Мб для Google и 10 Мб для Яндекса (при необходимости файл можно сжать в формат «gzip», но, тем не менее, в распакованном виде он также не должен превышать размер в 50 мегабайт), поэтому при необходимости указания более 50 000 URL-адресов, следует создать несколько файлов Sitemap.
Таким образом, за счет возможности разбиения Sitemap на части, можно обойти все эти ограничения и спокойно генерировать Sitemap для десятков и сотен тысяч страниц.
Разбиение происходит путем создания основного индексного файла Sitemap.xml, содержащего ссылки на дочерние файлы, которые в свою очередь являются стандартными файлами Sitemap.xml и содержат список конечных URL вашего сайта. В основном индексном файле для указания ссылок на дочерние сайтмап используется все тот же тег <loc>, обрамленный тегом <sitemap>, и содержащий ссылки на дочерние Sitemap.xml (названия дочерних сайтмап можно указывать произвольно).
Пример индексного файла XML Sitemap:
<?xml version="1.0" encoding="UTF-8"?> <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> <loc>http://www.site.ru/sitemap-1.xml</loc> <lastmod>2018-09-25T21:38:17+00:00</lastmod> </sitemap> <sitemap> <loc>http://www. site.ru/sitemap-2.xml</loc> <lastmod>2018-09-21</lastmod> </sitemap> </sitemapindex>
Формат дочерних файлов карт сайта XML-формата аналогичен стандартным Sitemap.xml.
Местоположение Sitemap.xml и его индексация
Стандартным вариантом размещения сайтмап является корень сайта, пример:
https://www.site.ru/sitemap.xml
При размещении «sitemap.xml» необходимо учитывать тот факт, что набор URL-адресов, которые можно включить в Sitemap определяется именно расположением на сайте, то есть при размещении карты сайта по адресу http://site.ru/news/sitemap.xml она может включать только URL-адреса, начинающиеся с http://site.ru/news/, но не должен включать адреса, начинающиеся с http://site.ru/pages/. Примеры допустимых URL для http://site.ru/news/sitemap.xml:
http://site.ru/news/25092018/ http://site.ru/news/news-all/
К недопустимым URL-адресам в файле http://site.ru/news/sitemap.xml относятся:
http://site. ru/pages/page-1/ http://site.ru/images/1x1.gif http://site.ru/contacts/
Таким образом, во избежание проблем с некорректной индексацией, настоятельно рекомендуется размещать Sitemap.xml в корне сайта.
Индексация Sitemap
Поисковые роботы по умолчанию сканируют корневую директорию сайта, поэтому со временем они найдут ваш сайтмап и перейдут по всем его ссылкам.
Однако, для ускорения посещения файла Sitemap поисковыми ботами необходимо выполнить несколько шагов:
- разместить ссылку на карту сайта в файле «robots.txt»
- добавить ссылку на «sitemap.xml» в панели вебмастера Яндекс и Google
Ссылка на сайтмап в «robots.txt»
User-agent: * ... Sitemap: https://site.ru/sitemap.xml
Добавление сайтмап в панели вебмастера Яндекс и Google
Использование кириллических адресов
Для корректной интерпретации URL различными поисковыми системами рекомендуется все кириллические URL кодировать в формат Punycode (бесплатный конвертер) и использовать маскирование для кириллических адресов страниц.
То есть, вместо адреса:
http://www.ёэлектроника.рф/каталог/лампы/
Необходимо использовать кодированный URL:
http://www.xn--80ajjhbcqhrt1jzb.xn--p1a/%D0%BA%D0%B0%D1%82%D0%B0%D0%BB%D0%BE%D0%B3/
Вопрос необходимости карты сайта
Бесспорно, что присутствие карты сайта желательно на любом сайте. Но, с одной стороны, в сайтмапе нет острой необходимости, так как со временем поисковый робот перейдет на ваш сайт и по ссылкам просканирует все доступные ему страницы. С другой стороны, для сайтов, у которых контент обновляется часто и которым важен порядок и приоритет обхода страниц (СМИ, новостные агентства, etc.), данный файл будет жизненно необходим, так как с помощью него они смогут указать поисковым роботам какие страницы индексировать в первую очередь, а какие после.
Поэтому, возникает справедливый вопрос: а так ли необходим Sitemap.xml конкретно для вашего сайта? Давайте разбираться.
Безусловно, данный файл будет актуален для сайтов объемом от 1000 страниц, а также для тех сайтов, объем страниц которых растет быстро и контент на которых нуждается в частой переиндексации, поэтому за счет данного файла поисковая система будет иметь под рукой всегда актуальный список страниц вашего сайта и с помощью него же будет своевременно индексировать все изменения. Таким образом, актуален данный файл для сайтов, контент на которых меняется часто и большими объемами (добавилось 50 страниц, удалилось 40, обновилось 175 и т.д.):
- СМИ, новостные порталы
- интернет-порталы
- каталоги товаров, агрегаторы
- интернет магазины
- форумы, отзовики, сайты вопросов-ответов
Для подобных сайтов данный файл необходимо иметь в первую очередь, так как от него зависит актуальность представляемой информации в выдаче поисковых систем.
Пример индексации через сайтмап при добавлении на сайт большого числа страниц:
Примечание: файлы Sitemap в таком случае необходимо генерировать на стороне сервера. Генерация карты сайта онлайн при помощи сервисов либо программ для ПК бессмысленна за счет низкой скорости и трудоемкости работ по выкладыванию данных файл на сервер (для крупных порталов, каталогов и интернет-магазинов подобные файлы должны обновляться чуть ли не каждый час (например, обновление цен в интернет-магазине)).
Вторая категория сайтов, для которых также необходим данный файл – это сайты от 100 до 1000 страниц и представляющие услуги бизнеса, а также просто информационные странички:
- сайты по продаже товаров и услуг
- сайты компаний и представительств
- блоги
На подобных сайтах обычно приток новых страниц происходит плавно, удаление страниц и разделов случается еще реже. Поэтому само собой подобные сайты должны иметь файлы Sitemap XML, однако в данном случае данный файл больше важен для первичной индексации сайта (чтобы за один обход файла поисковый робот узнал про все страницы сайта и оперативно их проиндексировал). Далее, новые страницы в виду их единичного добавления можно отсылать на переиндексацию даже через панель вебмастера Яндекса или Google и таким образом поддерживать актуальность страниц для поисковых систем. Файлы Sitemap для подобного рода сайтов можно генерировать специальными программами и сервисами, о которых будет написано ниже.
Третья категория сайтов – сайты с числом страниц до 100. К ним относятся:
- лендинги (одностраничные сайты для продажи конкретного товара либо услуги)
- промо-сайты (например, сайты коттеджных поселков)
- сайты-визитки
- домашние странички
Все эти сайты зачастую содержат небольшое число страниц о какой-то одной услуге, товаре, событии. Для подобного рода сайтов в наличии Sitemap нет какой-то жизненно важной необходимости. Так как контент на них обновляется достаточно редко и новые страницы добавляются с низкой интенсивностью, поисковые роботы такие сайты обходят не часто в виду малого числа страниц на них, поэтому для данных сайтов вполне подойдет как использование Sitemap.xml, так и его предшественника HTML карты сайта – это обычная HTML-страница стилизованная под дизайн сайта, на которой размещены все ссылки на внутренние страницы сайта в иерархическом виде (обычно в виде дерева). Таким образом, поисковый робот, посетив эту страницу, может обойти все страницы сайта и проиндексировать их либо обновить о них информацию. Пример такой страницы:
Примечание: на текущий момент создание подобных страниц перестало быть актуальным в виду перехода на формат XML, который не нужно создавать руками, а можно сгенерировать специальными программами либо сервисами (их примеры представлены ниже).
Таким образом, из всех вышеизложенных заключений можно сделать простой вывод, что чем больше объем страниц вашего сайта и чем чаще он обновляется, тем острее необходимость наличия на нем карты сайта Sitemap.xml, который в идеале должен генерироваться на сервере автоматически, без участия человека.
Важно!
Сайтмап должен включать в себя только актуальные страницы сайта необходимые для индексации и отдающие код ответа сервера 200. Все прочие служебные, технические либо страницы, запрещенные к индексации, не должны присутствовать в карте сайта.
Варианты генерации Sitemap.xml
Существует несколько методов генерации, перечислим их:
1. Генерация карты сайта при помощи онлайн-генератора (стоит учесть, что зачастую подобные генераторы платные)
В сети достаточно сервисов для генерации карты сайта, однако у них есть некоторые ограничения:
- обычно в подобных сервисах бесплатно можно сгенерировать не более 500 страниц
- для больших сайтов (от 5000 страниц) генерация может занять продолжительное время
- генерация сайтмап для крупных порталов может и вовсе произойти с ошибкой из-за нехватки ресурсов сервера, на котором расположен данный сервис
Пример онлайн-генератора MySitemapGenerator.com:
Примечание: Недостаток данного метода состоит в том, что при каждом обновлении сайта необходимо вручную генерировать сайтмап и заливать на сервер.
2. Автоматическая генерация Sitemap.xml средствами CMS (например в Bitrix, WordPress, Opencart и прочих системах управления сайтом доступна такая функция)
Наиболее приоритетный вариант, который позволяет настроить частоту обновления Sitemap средствами системы управления сайтом и избавляет вебмастера от ручного размещений сайтмап на сайте.
Пример модуля генерации Sitemap.xml для CMS Opencart:
3. Генерация карты сайта при помощи программы для ПК
Данный вариант подойдет для сайтов небольших и средних размеров, контент на которых обновляется периодически.
Недостатки подобного метода:
- после генерации сайтмап необходимо заливать его на сервер вручную
- большинство подобных программ-краулеров для ПК платные
Пример генерации Sitemap.xml при помощи бесплатной программы SiteAnalyzer:
- скачиваем дистрибутив программы
- после запуска программы вводим URL сайта и запускаем сканирование
- после сканирования в главном меню выбираем пункт Проекты -> Генерировать Sitemap
- в результате получаем карту сайта (одним файлом либо из нескольких файлов, если число страниц превышает 50 000)
- заливаем сайтмап в корень вашего сайта по FTP протоколу
4. Ручное создание сайтмап
Ручное создание возможно для сайтов с числом страниц до 10, однако для ускорения процесса проще воспользоваться любым онлайн-генератором либо программой для ПК.
Резюмируя все вышеописанное можно выделить основные моменты, на которые нужно обратить внимание при генерации карты сайта:
- для ресурсов с часто обновляемым контентом карта сайта должна генерироваться на стороне сервера
- sitemap.xml должен содержать только актуальные страницы сайта, отдающие код ответа сервера 200 и разрешенные к индексации
- для качественной индексации ресурса карта сайта должна обновляться каждый раз при обновлении контента на сайте
На этом все!
Благодарю за внимание и до новых встреч! 🙂
Полезное
Сервисы для проверки корректности карты сайта:
- Яндекс Вебмастер: https://webmaster.yandex.ru/tools/sitemap/
- Google Вебмастер: https://www. google.com/webmasters/ (Ваш сайт -> Сканирование -> Файлы Sitemap -> Добавление/проверка файла Sitemap)
Ссылки на описание Sitemap:
- Справка Яндекса: https://yandex.ru/support/webmaster/controlling-robot/sitemap.html
- Справка Google: https://support.google.com/webmasters/answer/183668
- Описание протокола на русском: https://www.sitemaps.org/ru/protocol.html
Оцените статью
4.6/5
10
Другие статьи:
- 18 этапов проверки сайта перед покупкой
- Актуальные способы продвижения сайтов ссылками в 2018 году
- Быстрый тест скорости загрузки страниц сайта
0 комментариев
Чтобы оставить комментарий необходимо авторизоваться.
<< Назад
Как создать и настроить карту сайта sitemap.xml
SEO сайта — строгая дисциплина, она требовательна к новичкам. Стоит только заглянуть немного вглубь, за деревья иерархии и ключевые слова, и в определениях терминов замелькают строки кода.
Эта статья для тех, кто решился на знакомство с картой сайта в формате XML, но пока не готов сидеть над расшифровкой сложных таблиц с тегами. Рассказываем, что такое файл sitemap, как самостоятельно его создать и с помощью каких операторов настроить.
Как работает карта сайта
Когда поисковая система считывает поисковый запрос, она обращается за помощью к базе, где описано краткое содержание знакомых сайтов. Приоритет выдачи зависит от таких факторов как соответствие содержимого введенной фразе, морфология и полнота индекса.
Индексация — это сбор информации о сайте в базу данных поисковой системы. Поисковый индекс напоминает шпаргалку на экзамене: помогает быстро сориентироваться в информации и извлечь релевантный результат. Страницы, которые не прошли индексацию, не участвуют в выдаче, а значит, не приводят трафик на сайт.
Чтобы ботам было проще анализировать сайт, программисты могут добавить карту, то есть sitemap в виде XML. Создать её под силу даже новичку, но следует помнить, что требования Яндекса и Google к карте в XML отличаются.
Определение sitemap
Файлы sitemap в XML содержат информацию о сайте. Карта предоставляет поисковым сканерам следующие данные:
- адреса страниц,
- момент последнего обновления,
- общая частота обновлений,
- наличие версий на других языках,
- приоритет элементов сайта и др.
Можно сказать, sitemap — посредник между поисковой машиной и сайтом. Карту создают в помощь ботам Яндекса, Google и других поисковиков, чтобы преобразовать и упорядочить данные. Так проще извлекать информацию и добавлять её в базу. Тем не менее, протокол sitemap в XML не гарантирует, что сайт проиндексируют грамотно.
Кому нужна карта сайта в XML
Sitemap файл в формате XML пригодится не всем. Изначально карту сайта создали в качестве костыля для ускорения индексации сайтов. Однако, сейчас скорость изучения страниц ботами выросла, и необходимость в повсеместном использовании sitemap в XML отпала.
Часть функций sitemap перешла в сервисы Яндекс.Вебмастер и Google Search Console, которые создали для упрощения диагностики и работы над SEO. Например, с их помощью можно контролировать, что индексировать в первую очередь.
Какие сайты нуждаются в sitemap в XML:
- Сайты с большим количеством страниц
Те же маркетплейсы или энциклопедические ресурсы. Карта поможет сканеру сориентироваться и отыскать все страницы. Крупными считаются сайты от 500 страниц.
- Сайты с объемными архивами не связанных друг с другом страниц
Sitemap в виде XML создают, когда иерархия сайта усложняется проблемами с навигацией, и программе требуется помощь. Тогда карту добавляют, чтобы бот не пропустил разрозненные части при индексации.
- Новые сайты, которые трудно найти по внешним ссылкам
Роботы сканируют сайты, переходя с одной страницы на другую. Если ресурс создали недавно, и у него мало внешних ссылок, его могут просто не найти. Следовательно, надо добавить его в карту XML.
- Сайты с большим объемом мультимедиа или новостного контента
В карте можно пояснять содержание картинок, аудио и видео. Тогда поисковая система сможет ссылаться на содержимое помимо текста, описанное в sitemap.xml.
- Сайты с глубокой вложенностью
Чем больше кликов нужно, чтобы дойти до определенной страницы с главной для сайта, тем выше её уровень. Дальние разделы боты посещают реже, а значит, могут не выводить в результатах поиска. Чтобы избежать ошибок, можно создать sitemap.xml и занести страницу туда.
Карта — это страховка, на случай, если вы не уверены в четкости иерархии. У сайтов с проработанной структурой разделов и развитой навигацией в ней нет необходимости.
Путаница с XML и HTML
Sitemap в XML создают для адаптации сайта к запросам из поисковых систем. А карта HTML нужна людям — рядовым посетителям. Она представляет из себя каталог с гиперссылками, организованными по разделам. Её основная задача — помощь в поиске страниц.
Ключевые особенности HTML карты сайта
- Четкая визуальная структура
- Минималистичное оформление
- Страницы в ней доступны для посещения всем пользователям
Пример карты сайта Microsoft, которую создали для помощи посетителям в навигации. Белый фон, ссылки на страницы в столбик по разделам, — ничего не отвлекает гостя от поиска.
Основная ошибка при работе с sitemap в HTML
Когда владельцы сайтов создают карту, нередко забывают о её предназначении: sitemap оказывает помощь в ориентировании на сайте.
Одни в попытках сэкономить время и силы ограничиваются вариантом «и так сойдет». Другие наоборот стремятся показать всё и сразу — загромождают карту ненужными дизайн-элементами и кучей ссылок. В итоге, sitemap только путает посетителей.
Создаем sitemap в XML
Код карты сайта в XML начинается с <urlset> и закрывается </urlset>. Затем требуется задать пространство имен в составе тега <urlset> посредством атрибута XMLns. Его значение должно быть представлено ссылкой URL.
Каждый URL-адрес в карте нужно выделять в раздел с помощью парных элементов кода <url> и </url>. Они будут для его описания родительскими тегами, которые обрамляют страницу наподобие скобок на один уровень выше.
Пример кода sitemap.xml с официального сайта.
Список доступных тегов для XML
Обязательных для карты всего три. Последний нужен для обозначения местонахождения страницы, чтобы поисковый бот нашел её на сайте.
- <urlset>
Нужен для указания стандарта протокола в sitemap формата XML. Кроме того, инкапсулирует отрезок кода, то есть, обозначает информацию внутри себя как целую условную единицу и исключает ошибки при использовании данных.
- <url>
Парный родительский тег. Параметры внутри опускаются в карте на уровень ниже, иными словами, превращаются в дочерние. К каждому URL-адресу надо добавлять отдельную метку <url> и </url>.
- <loc>
С его помощью обозначают URL страницы. Обязательно должен включать префикс протокола, http или https в зависимости от наличия или отсутствия надстройки безопасности. С учетом требований веб сервера может заканчиваться косой чертой. Длина значения не должна превышать 2048 символов.
Значение — изменяемый параметр, в коде записывается после тега. Для главной страницы Яндекса тег будет выглядеть так <loc>https://www.yandex.ru/</loc>, а значение составит 22 знака.
Следующие данные добавляют по необходимости, некоторые из них не учитываются вовсе. Например, сканеры Google, в отличие от Яндекса, игнорируют параметр <priority> при обработке карты сайта в XML.
- <lastmod>
Дата последнего изменения страницы по стандартам W3C Datetime, международного формата для обозначения даты и времени. Его создали, чтобы унифицировать вид данных и стабилизировать программы. Он позволяет, если это потребуется, преобразовать данные в вид ГГ-ММ-ДД.
Наиболее общей величиной является год, самая точная граница — десятичная доля секунды. Если обозначение учитывает помимо даты время, во избежание путаницы положено указывать часовой пояс.
Пример с сайта https://www.w3.org/TR/NOTE-datetime: 1997-07-16T19:20:30.45+01:00 — 16 июля 1997 года, 19 часов, 20 минут, 30 секунд 45 десятичных долей по часовому поясу +1 UTC.
- <changefreq>
Частота изменений в странице. Субъективный показатель, его переменная принимает значения: always — постоянно и never — никогда, hourly — ежечасно, daily — ежедневно и т.п. Если «никогда» описывает архивные разделы сайта, то «всегда» означает, что изменения в страницу вносятся с каждым визитом.
Поскольку параметр не объективен, сканеры Яндекса и Google не полагаются на эти обозначения карты при индексации. Например, они могут периодически оценивать архивные страницы в поисках изменений и игнорировать разделы, которые только недавно создали.
- <priority>
В помощью карты вы можете расставить приоритет страниц на сайте, чтобы боты обращали внимание на конкретные разделы и меньше уделяли другим. Функция принимает значения от 0,0 до 1,0. Если параметр не определен, странице по умолчанию присваивают коэффициент 0,5.
Задавать всем страницам карты высокий приоритет бесполезно, это никак не скажется ни на сравнении вашего сайта с другими, ни на ранжировании в поисковой выдаче. Параметр отразится только на порядке обработки данных из sitemap в XML.
Что не нужно вносить в карту сайта
Оттолкнемся от назначения sitemap в XML. Создание и настройка карты сказывается на анализе сайта, следовательно, влияет на список страниц, которые пользователи поисковых систем увидят в результатах.
- Неактуальные страницы
Если информация в статье устарела, акция с лендинга закончилась или набор на курс давно закрыт — нет смысла индексировать эти разделы сайта. Значит, вообще не надо добавлять их в sitemap и сообщать о них сканеру Яндекса, Google или других поисковиков.
- Технические страницы
Не все части сайта доступны обывателям, некоторые создают для внутреннего пользования. Ситуация выходит похожая: гость открывает ссылку и не получает желаемого. Создать карту с такими наименованиями значит не просто потратить время на индексацию, но и рискнуть вызвать негатив у посетителя.
- Турбо-страницы
Яндекс создал концепт легких страниц, которые хранятся на его серверах. Их фишка в упрощенном дизайне и коде, который не нагружает сеть при прогрузке. Как и в случае с Дзеном, Яндекс занимается индексацией внутренних ресурсов самостоятельно.
Правила работы с sitemap в XML
Кодировать знаки по международному стандарту
Формат карты XML воспринимает ограниченный набор символов. Однако, некоторые URL-адреса включают специфические знаки. В таких случаях используют кодировку UTF-8, то есть, восьмибитный формат преобразования Юникода.
Кроме того, иногда символы из URL страницы могут сливаться с символами кода из карты в XML и мешать боту выполнить команды. Тогда требуется экранировать, отделить их. Для этого создали систему шифрования. Так, в системе Честный Знак, нижнее подчеркивание «_» превратится в %5F, а знак равенства «=» примет вид %3D.
Делить большие файлы
Одна карта XML может включать до 50 000 URL-адресов, при этом имеет ограничение в 50 Мб по размеру. Её можно сжать до архива gzip, но это никак не повлияет на требования Яндекс.Вебмастера и Google Search Console к изначальным параметрам. Иными словами, иногда полный список приходится разбивать на несколько документов.
Чтобы все части карты засчитали при индексации, для них создали общий индекс: это файл, где указаны все составляющие sitemap. Его открывает родительский тег <sitemapindex>, затем следуют дочерние <sitemap>. Для каждого из них уровнем ниже требуется указать адрес файла с sitemap с помощью <loc>.
Размер индексов sitemap ограничен теми же параметрами: до 50 000 наименований на одну карту и 50 Мб в несжатом виде.
Сообщать о копиях на других языках
Google рекомендует указывать на альтернативы, чтобы избежать случайного исключения страниц из выдачи в поиске. Настройка sitemap в формате XML позволяет обозначить локализованные варианты с помощью атрибута hreflang. При этом важно создать систему перекрестных ссылок, чтобы страницы были связаны вне карты, иначе их могут счесть дубликатами.
Добавлять в sitemap только канонические URL-адреса
Если у сайта или страницы две версии — в карту заносят только основную, которая появится в выдаче по запросу. Для таких случаев создали атрибут rel=canonical. В качестве альтернативы можно организовать переадресацию с альтернативных вариантов на базовый.
Хотите тоже написать статью для читателей Yagla? Если вам есть что рассказать про маркетинг, аналитику, бизнес, управление, карьеру для новичков, маркетологов и предпринимателей. Тогда заведите себе блог на Yagla прямо сейчас и пишите статьи. Это бесплатно и просто
Создание файлов Sitemap с использованием Simple XML Sitemap в Drupal
4 мая 2022 г. / Авторы Редакционная коллегия /4 минуты чтения/ 2 комментария
Simple XML Sitemap автоматически создает XML-карту сайта для вашего веб-сайта Drupal в соответствии с последними рекомендациями и рекомендациями Google. Этот модуль позволяет выполнять различные настройки, все из которых более подробно перечислены на странице модуля.
В этом руководстве показано, как установить этот модуль и настроить его для типов содержимого, ссылок, меню и страниц просмотра.
Содержание
Начало работы
Вы можете установить этот модуль с помощью Composer следующим образом:
composer require drupal/simple_sitemap
Основной модуль поставляется с 3 подмодулями:
90 020Для этого руководства мы включим Simple XML Sitemap (основной модуль), а также Simple XML Sitemap (представления). Вы можете сделать это через пользовательский интерфейс администратора или с помощью Drush следующим образом:
drush en simple_sitemap simple_sitemap_views -y
Конфигурация модуля
После того, как модуль будет включен в первый раз, он создаст для вас одну карту сайта, но это не так. не включать какие-либо объекты Drupal по умолчанию.
Мы пройдемся по каждой странице конфигурации модуля.
Перейдите в «Конфигурация» -> «Простая карта сайта XML» (/admin/config/search/simplesitemap).
spНа этой странице перечислены уже созданные карты сайта. При необходимости вы можете создать более одной карты сайта. Кнопку «Перестроить очередь и создать» можно использовать для быстрого перестроения карты сайта, если вы внесли какие-либо изменения в конфигурацию.
Перейдите на вкладку «Типы» (/admin/config/search/simplesitemap/types).
Рисунок 3На странице «Типы» перечислены все типы карт сайта, которые вы можете создать. Здесь следует нажать кнопку «Изменить», чтобы включить генератор URL-адресов просмотров, чтобы карта сайта могла включать страницы просмотров, как показано на рис. 4.
/настройки). Рисунок 5Эта страница настроек содержит различные различные настройки, которые говорят сами за себя.
Нажмите «Включение» (/admin/config/search/simplesitemap/entities).
Рисунок 6На странице «Включение» можно быстро просмотреть, какие объекты включены.
Тип содержимого в карте сайта
Перейдите в раздел «Конфигурация» -> «Простая карта сайта XML» -> «Включение» (/admin/config/search/simplesitemap/entities).
На вкладке «Включение» вы указываете, какой объект Drupal вы хотите включить в карту сайта. Давайте включим Content Entity. Нажмите «Настроить», как показано на рисунке 7.
Рисунок 7 Рисунок 8Затем нажмите на тип контента, который вы хотите включить, в левом столбце и выберите переключатель, как показано на рисунке 8. Затем нажмите «Сохранить конфигурацию».
Затем перейдите в /admin/config/search/simplesitemap (см. рис. 2) и нажмите «Перестроить очередь и создать».
Карта сайта будет перестроена, и теперь будет включен весь контент типа «Статьи».
Если вам нужно включить настраиваемые ссылки, вы можете сделать это вручную, выбрав «Конфигурация» -> «Простая XML-карта сайта» -> «Включение» -> «Пользовательские ссылки» (/admin/config/search/simplesitemap/custom).
Затем вручную добавьте ссылки, как показано на рис. 9.
рис. 9На рис. 9 мы добавили «/my-custom-link 1.0 daily».
/ my-custom-link – это ссылка на любую пользовательскую внутреннюю страницу 02 Любое из ваших меню Drupal можно добавить в карту сайта, выбрав «Конфигурация» -> «Простая карта сайта XML» -> «Включение» (/admin/config/search/simplesitemap/entities).
Затем нажмите «Настроить», как показано на рисунке 10.
Рисунок 10Затем нажмите на нужное меню в левой колонке и выберите переключатель, как показано на рисунке 11. Нажмите «Сохранить конфигурацию».
Рисунок 11Страница пользовательских представлений в карте сайта
Сначала необходимо включить генератор URL-адресов представлений, как показано на рисунке 4.
Затем перейдите в: /admin/structure/views и отредактируйте представление, которое хотите включить .
На экране редактирования просмотра нажмите «Исключить из всех карт сайта».
Рисунок 12Затем во всплывающем модальном окне «Просмотр» установите флажок, как показано на рисунке 13.
Рисунок 13Чтобы просмотреть окончательную карту сайта, в любой момент вы можете перейти [ВАШ САЙТ]/карта сайта. xml
Резюме
Модуль Simple XML Sitemap — это аккуратный небольшой модуль, который может автоматически генерировать XML-карту сайта для вашего сайта Drupal. Вы можете включать/исключать и настраивать объекты в карту сайта, такие как типы контента, настраиваемые меню и страницы просмотра. Если вы глубоко заботитесь об улучшении SEO вашего сайта на Drupal, этот модуль определенно следует использовать.
Simple XML Sitemap Generator — Плагин WordPress
- Детали
- Отзывы
- Монтаж
- Развитие
Опора
XML Sitemap создает XML для использования с Google и Yahoo (а также с Yes! Bing)
Просто установите его в свою установку wordpress и дайте плагину сделать свою работу.
Для начала: создайте или обновите любую публикацию или страницу, и ваш WordPress сразу создаст файл sitemap.xml
Функции
Вы можете исключить определенные посты или страницы или продукты woocommerce из карты сайта xml.
Вы можете установить собственное значение карты сайта для каждой публикации, страницы или страницы продукта.
Языки
- Английский
- немецкий
В этом разделе описывается, как установить плагин и заставить его работать.
напр.
- Разархивируйте сжатый файл.
- Загрузить
автоматическая карта сайта
в каталог/wp-content/plugins/
- Активируйте плагин через меню «Плагины» в Dashboard.
- если вы хотите исключить определенные сообщения или страницы или продукты woocommerce из карты сайта xml, прочитайте руководство в настройках администрирования
Как установить этот плагин?
Просто выполните следующие действия.
1. Разархивируйте сжатый файл.
2. Загрузитеавтоматическую карту сайта
на/wp-content/plugins/
каталог
3. Активируйте плагин через меню «Плагины» на панели инструментов.Как мне получить доступ к моей карте сайта?
После установки плагина просто создайте (или обновите его), и WordPress сразу же создаст файл sitemap.xml. Затем вы сможете получить доступ к своей карте сайта в http://yoursitelink.com/sitemap.xml
.
Этот плагин отлично справляется с автоматической генерацией XML-карты сайта. Он делает то, что должен делать, без ошибок или тупых сложностей, таких как плагины SEO «Big Name».
Привет на главной странице можно добавить контент для прессы? ‘post_type’ => массив(‘сообщение’,’страница’,’продукт’),
Хороший плагин карты сайта!
Спасибо за этот плагин. Работает очень хорошо. Я сравнил его с внешним генератором карты сайта, и он точно совпал. Отличная экономия времени. Версия 5.3.2
При вводе ww.mywebsite.com/sitemap.xml возникает ошибка 404
Лучший плагин xml карты сайта, который я когда-либо видел! Подскажите, пожалуйста, как добавить ссылки на категории и таксономии? Но и без этого плагин все равно лучший, спасибо!
Прочитать все 8 отзывов
“Simple XML Sitemap Generator” – это программа с открытым исходным кодом. Следующие люди внесли свой вклад в этот плагин.
Авторы
- Эмахлер
2.2.4
- Незначительное обновление
2.2.3
- Обновление версии для WP 6.0
2.2.2
- Обновление версии для WP 5.9
2.2
- теперь вы можете добавить собственное значение приоритета карты сайта к сообщениям, страницам или продуктам.
2.1
- теперь вы можете исключить определенные посты или страницы или продукты woocommerce из карты сайта xml.
2.0
- многоязычный (английский и немецкий) – если вам нужен другой язык – свяжитесь со мной
1.9.1
- После обновления WordPress 5.5 — деактивируйте внутренний генератор карты сайта xml из wordpress.
1.9
- добавить категорию сообщений на карту сайта
- добавить страницу конфигурации в плагин
1.8.1
- Из-за ошибки я был вынужден откатиться до версии 1.7 – извините за неудобства
- тип сообщения деактивирован
1.8
- добавить тип сообщения в карту сайта
1,7
- Небольшое обновление
1.6
- Обновление для новой версии WordPress 4.9
1.5
- Обновление для новой версии WordPress 4.8.2