Файл сайтмап: XML Sitemaps Feature Project Proposal – Make WordPress Core

Содержание

Полезные статьи. Как загрузить sitemap.xml на сайт. LTD Beget.

В этой статье мы расскажем, что необходимо сделать после того, как вы сгенерировали файл sitemap.xml для вашего сайта с помощью нашего сервиса.

Так как вы уже сгенерировали и скачали карту сайта по ссылке из письма или по кнопке «Скачать» в разделе Sitemap, то теперь вам осталось только:

  • Отключить плагин в CMS, который может перегенерировать карту сайта
  • Загрузить файл на сайт
  • Сообщить поисковым системам, где найти карту сайта

Отключение плагинов, которые могут перегенерировать карту сайта

Во многих CMS используются специальные плагины, которые могут перегенерировать карту сайта. Поэтому, чтобы сохранить и использовать именно наш файл sitemap.xml, их необходимо будет отключить.

Мы расскажем про то, какие плагины используются в различных CMS для автогенерации карты сайта, а так же о том, как их отключить.

WordPress

Joomla

OpenCart

DLE

PrestaShop

ModX Revo

ModX Evo

Drupal

1С-Битрикс

WordPress

Начиная с версии 5. 5, в WordPress по умолчанию встроен механизм генерации файла sitemap.xml, поэтому нам необходимо его отключить.

Для этого необходимо выполнить ряд действий:

  1. В админ-панели перейти в раздел Настройки
  2. Затем перейти в подраздел Чтение
  3. Поставить галочку в пункте Попросить поисковые системы не индексировать сайт

Также в WordPress есть несколько очень популярных плагинов, которые могут перегенерировать карту сайта:

  1. google-sitemap-generator
  2. Google XML Sitemaps
  3. Yoast SEO
  4. All in One SEO

Отключить плагин можно следующим образом:

  1. Откройте раздел Плагины
  2. Напротив нужного плагина нажмите Деактивировать

Если плагин, который вы используете, отвечает не только за генерацию карты сайта, но и за другой функционал (такими плагинами являются Yoast SEO и All in One SEO), можно не отключать их целиком, а выключить только их работу с sitemap.

xml.

Для Yoast SEO необходимо выполнить следующие действия:

  1. Откройте раздел Yoast SEO
  2. В подразделе Общие перейдите на вкладку Возможности
  3. В списке найдите пункт XML-карта сайта и переключите его в положение Выкл
  4. Нажмите на кнопку Сохранить изменения внизу страницы

Для All in One SEO работа с картой сайта отключается так:

  1. Откройте раздел All in One SEO
  2. Перейдите в подраздел Карты сайта
  3. В блоке Общая карта сайта нажмите на переключатель Включить карту сайта
  4. Нажмите на кнопку Сохранить изменения
Joomla

В Joomla нет встроенного инструмента для генерации карты сайта, но есть специальные плагины, которые можно установить дополнительно. Из самых популярных плагинов можно назвать:

  1. JLSitemap
  2. jSitemap
  3. Xmap
  4. mapX
  5. OSMap

Если у вас используется на сайте один из этих плагинов, то его необходимо отключить. Для этого необходимо выполнить ряд действий:

  1. Перейдите в раздел Система
  2. В блоке Управления выберите раздел Расширения
  3. Поставьте галочки слева от нужных плагинов
  4. Нажмите кнопку Отключить
OpenCart

В OpenCart 2.x и 3.x для генерации карты сайта установлен модуль Google Sitemap, который по умолчанию выключен. Если он у вас включен, то его необходимо отключить. Для этого необходимо выполнить ряд действий:

  1. Откройте раздел Модули/Расширения
  2. Затем откройте подраздел Модули/Расширения
  3. Выберите тип расширения Каналы продвижения
  4. Напротив модуля
    Google Sitemap
    нажмите на красную иконку, чтобы деактивировать плагин

Если вы устанавливали модуль Yandex Sitemap Module, его также нужно отключить.

После отключения необходимо в файле .htaccess в папке вашего сайта найти следующую строку:

RewriteRule ^sitemap. sitemap.xml$ uploads/sitemap.xml [L]
PrestaShop

В PrestaShop для генерации карты сайта используется официальный модуль Google sitemap.

В версии PrestaShop 1.7 данный модуль предустановлен. Чтобы его отключить, вам необходимо выполнить ряд действий:

  1. Перейдите в раздел Модули
  2. Перейдите в подраздел Module Manager
  3. В поисковой строке введите Google sitemap и нажмите на иконку лупы
  4. Напротив найденного модуля нажмите на иконку со стрелкой вниз
  5. Затем нажмите кнопку Отключить

В версиях PrestaShop 1.6 данный модуль не предустановлен. Если вы его установили самостоятельно, чтобы его удалить, вам нужно сделать следующее:

  1. Перейдите в раздел Модули
  2. Перейдите в подраздел Модули и Сервисы
  3. В поисковой строке введите Google sitemap и нажмите на иконку лупы
  4. Напротив найденного модуля нажмите на иконку со стрелкой вниз
  5. Выберите самый последний пункт Удалить
ModX Revolution

В ModX Revolution по умолчанию не установлены плагины и не настроена генерация карты сайта, но если вы производили настройку самостоятельно, генерацию карты необходимо будет отключить.

Для генерации карты сайта могут использоваться следующие дополнения:

  1. Сниппет pdoSitemap из модуля pdoTools
  2. Модуль GoogleSiteMap
  3. Модуль getResources

Чтобы отключить их использование на сайте, мы можем отключить публикацию ресурса (документа), отвечающего за генерацию карты сайта. Для этого необходимо выполнить ряд действий:

  1. Нажмите на иконку со стрелкой, направленной вправо
  2. Во вкладке Ресурсы найдите нужный нам ресурс и выберите его
  3. В открывшемся окне редактирования ресурса найдите справа блок Публикация
  4. Отключите пункт Опубликован в этом блоке и нажмите Сохранить

Так как ресурс добавляется вручную пользователем, то и название у него может быть произвольным. Это значит, что только вы знаете, как называется ресурс, ответственный за генерацию карты сайта.

ModX Evolution

В ModX Evolution для генерации карты сайта используется специальный сниппет Sitemap. Он не является встроенным, поэтому будет установлен на сайте, только если вы самостоятельно установили и настроили его. Чтобы его отключить, вам необходимо выполнить ряд действий:

  1. В списке ресурсов в левой части панели администратора сайта откройте ресурс с картой сайта
  2. Перейдите на вкладку Настройка страницы
  3. Снимите галочку с пункта Публиковать
  4. Нажмите кнопку Сохранить + продолжить

Так как ресурс добавляется вручную пользователем, то и название у него может быть произвольным. Это значит, что только вы знаете, как называется ресурс, ответственный за генерацию карты сайта.

Drupal

Для генерации карты сайта в CMS Drupal используется модуль XML sitemap. Он не установлен по умолчанию, но если вы его использовали, то его нужно будет отключить. Для этого необходимо выполнить ряд действий.

В версиях Drupal 8 и более новых:

  1. Перейдите в раздел Расширения
  2. Затем откройте подраздел Удалить
  3. Поставьте галочки напротив плагинов XML Sitemap Custom и XML Sitemap Engines
  4. Нажмите Удалить и подтвердите удаление
  5. Вновь введите в поле поиска sitemap
  6. Точно так же удалите плагин XML Sitemap

В Drupal 7:

Здесь нам нужно будет сначала отключить модуль, если он включен:

  1. Перейдите в раздел Модули
  2. Найдите на странице блок XML sitemap
  3. Снимите галочки со всех модулей, кроме XML sitemap
  4. Нажмите Сохранить конфигурацию
  5. Вновь найдите блок XML sitemap
  6. Снимите галочку для XML sitemap
  7. Вновь нажмите Сохранить конфигурацию

После отключения модуля его необходимо удалить. Для этого:

  1. На странице раздела Модули перейдите в подраздел Удалить
  2. Поставьте галочки напротив всех модулей, кроме XML sitemap
  3. Нажмите Удалить и подтвердите удаление
  4. Теперь поставьте галочку для XML sitemap
  5. Вновь нажмите Удалить и подтвердите удаление
1С-Битрикс

В Bitrix есть встроенный модуль для генерации карты, который также поддерживает автогенерацию. Нам нужно ее отключить. Для этого необходимо выполнить ряд действий:

  1. Перейдите в раздел Маркетинг
  2. Затем перейдите в подраздел Поисковая оптимизация
  3. Выберите пункт Настройка sitemap.xml
  4. Выберите ваш сайт
  5. Снимите все галочки в пунктах Автогенерация в разделах Инфоблоки и Форумы

Загрузка файла на сайт

Существует два простых способа загрузить файлы на удаленный сервер:

  • С помощью нашего файлового менеджера
  • С помощью FTP

Загрузка через файловый менеджер

Для загрузки карты сайта на сервер мы воспользуемся нашим файловым менеджером Sprut. io. Для нашей задачи удобнее всего перейти в него через раздел Сайты:

  • Перейдите в раздел Сайты
  • Напротив нужного нам сайта найдите иконку
  • Кликните на нее — откроется файловый менеджер Sprut.io, и вы окажетесь в директории сайта
  • Перейдите в директорию public_html
Загружаем архив

Теперь, когда вы открыли с помощью файлового менеджера директорию вашего сайта, мы можем приступить к загрузке архива с файлом sitemap.xml.

Для этого вам необходимо:

  • Нажать на кнопку Загрузить файлы в верхней части файлового менеджера
  • В открывшемся окне нажать Browse… и выбрать архив
  • Нажать кнопку Загрузить

Как только в поле Статус отобразится иконка , а индикатор загрузки покажет 100%, архив будет загружен на сервер.

Распаковываем архив

После загрузки вы сможете сразу же его разархивировать и получить сам файл sitemap. xml. Для этого нужно:

  • Кликнуть правой кнопкой по загруженному архиву
  • Выбрать пункт меню Распаковать архив
  • Нажать Ок
  • Дождаться завершения операции

Если архив вам больше не потребуется, то вы можете удалить его.

Загрузка через FTP

Для загрузки по FTP мы будем использовать FTP-клиент Filezilla. В данной статье мы разберем именно процесс загрузки, так как подключение к серверу уже описано в нашей статье.

Вам необходимо:

  • Выполнить подключение к серверу виртуального хостинга
  • Перейти в директорию сайта в правом окне программы
  • В левом окне найти файл карты сайта, расположенный на вашем компьютере
  • Нажать на него правой кнопкой мыши и выбрать Закачать на сервер

Уведомление поисковых систем о новой карте сайта

Чтобы поисковые системы Яндекс и Google узнали о том, что на вашем сайте появилась карта сайта и проиндексировали ее, нужно им об этом сообщить. О том как это сделать вы можете узнать в инструкциях этих сервисов:

  • Инструкция для Яндекса
  • Инструкция для Google

Теперь вам осталось только дождаться, когда роботы поисковых систем проиндексируют содержимое карты вашего сайта!

Удачной работы! Если возникнут вопросы — напишите нам, пожалуйста, тикет из Панели управления, раздел «Помощь и поддержка».

файл Sitemap является страницей HTML

Сообщения об ошибках в WordPress, как правило, сбивают с толку и их сложно решить, но, к счастью, ошибка «файл Sitemap является страницей HTML» (или «Your Sitemap Appears to Be An HTML Page» на английском) не входит в их число.

Если вы столкнулись с этой проблемой, то будет полезно знать, что означает эта ошибка, что не так с вашей картой сайта в формате HTML и как именно вы можете исправить эту проблему. А что, если ваша карта сайта уже имеет правильный формат, но вы все еще видите эту ошибку?

В этой статье вы узнаете, как работает карта сайта, в каком формате она должна быть, и о нескольких различных способах решения этой проблемы.

Что такое карта сайта?

Вы знаете, как поисковые системы находят ваш вебсайт? С помощью небольшого удобного бота, называемого веб-сканером – автоматизированного инструмента, рассылаемого поисковыми системами для индексации страниц вашего сайта.

С миллионами страниц в сети сбор информации о каждом сайте был бы невозможен. Поэтому в Интернете работают поисковые роботы, кэшируя информацию на каждой странице и на всех носителях.

Это кажется достаточно простым, но Google не знает, когда вы добавляете новую страницу на свой вебсайт, например, когда вы публикуете пост в блоге или выпускаете новый продукт в своем магазине. Они периодически отправляют поискового робота посетить ваш сайт и посмотреть, не изменилось ли что-нибудь, но этот процесс не происходит мгновенно.

Когда у вас огромный веб-сайт, поисковому роботу легко пропустить ключевые страницы даже после нескольких посещений. В первую очередь вызывает беспокойство то, что на такие страницы нечасто ссылаются.

Вот где на помощь сканерам приходят карты сайта. Эти XML-файлы отличаются от обычных страниц; они обычно не читаются людьми и не предназначены для просмотра посетителями. Но поисковые роботы могут использовать их, чтобы все проиндексировать.

Они работают, просто перечисляя все страницы вашего сайта вместе с их иерархией ссылок, а также другие файлы на вашем сайте, такие как изображения и видео. Это гарантирует, что Google видит все на вашем проекте и соответственно улучшит SEO.

Если вы использовали такой инструмент, как Google Analytics или Google Search Console, возможно, видели возможность ссылки на свою карту сайта. Google будет ссылаться на это в первую очередь, когда отправит поисковые роботы на вебсайт.

Различия между файлами Sitemap в формате HTML и XML

Итак, ваша карта сайта – это HTML-страница, но в чем именно проблема? Почему Google хочет, чтобы вы его изменили?

Файлы Sitemap должны быть написаны в определенном формате, чтобы поисковые роботы поняли их. В большинстве случаев это должен быть файл XML. Они также могут читать RSS, Atom, KML или текстовый файл, но XML – наиболее распространенный выбор.

XML означает «расширяемый язык разметки». Это веб-язык, очень похожий на HTML. Разница заключается в его использовании: хотя он удобочитаем, его основная функция – помогать машинам кодировать документы и читать данные.

В этом случае это помогает поисковому роботу понять, где находятся страницы и другие носители на вашем сайте и как они взаимодействуют друг с другом.

Но вы, возможно, видели термин «карта сайта», который раньше использовался в совершенно другом контексте. Карты сайта в формате HTML существуют, но разница в том, что они созданы для людей, а не для поисковых роботов.

Если вы когда-либо щелкали ссылку на навигацию сайта и находили удобочитаемый и приятно оформленный список страниц на сайте, это карта сайта. Она может быть полезна вашим посетителям, но это не то, что ищет Google.

Карта сайта XML для большинства пользователей будет выглядеть как беспорядок из нечитаемого кода или огромная стена ссылок. Поэтому, если вы хотите добавить полезную страницу навигации на свой сайт, то можете создавать карту сайта HTML, но вы должны создать XML карту сайта также.

Другие типы файлов Sitemap

Когда вы думаете о карте сайта, на ум приходит простой список страниц вашего сайта. Но Google использует несколько различных типов карт сайта для каталогизации различной информации:

  • Видео: видео на вашем сайте можно специально проиндексировать, чтобы они появлялись в результатах Google Video.
  • Изображения: То же самое и с изображениями. Некоторые изображения, например, встроенные в код Javascript, могут не индексироваться обычным образом. Карта сайта с изображениями может помочь обеспечить отображение вашего сайта в Картинках Google.
  • Новости: Пишете колонку? Google имеет специальный раздел новостей Google в своем поиске, и карта сайта новостей может гарантировать, что вы правильно появляетесь там и получаете больше трафика.
  • Код: Google индексирует фрагменты кода, чтобы помочь программистам искать код и файлы.
  • Географические данные. Вы можете использовать специальную карту сайта KML, чтобы предоставить Google более точные данные о том, где находится ваша компания.

Обычно часть этой информации содержится в вашей основной карте сайта. Для других – должна быть специальная карта сайта. И, в конце концов, все они должны соответствующим образом быть отформатированы в XML или в другом поддерживаемом формате, а не в HTML.

Смотрите также:

Плагин Rank Math SEO – поисковая оптимизация для WordPress, аналог Yoast SEO

Как создать XML-карту сайта

Если вы намеренно отправили ссылку на карту сайта в формате HTML, вам необходимо заменить ее XML-файлом. Если вы не знаете, как его создать, есть несколько разных способов создать его с помощью плагинов и генераторов WordPress.

Даже если у вас есть карта сайта XML, которая просто не работает, восстановление или отправка другой карты сайта сможет решить проблему.

Есть два простых способа получить карту сайта: использовать плагин или создать его с помощью карты сайта.

Создайте карту сайта с помощью плагина

С WordPress самый простой способ получить динамически обновляемую карту сайта на вашем сайте – это загрузить плагин. Таким образом, не нужно загружать файлы на сервер вручную.

Есть довольно много плагинов, которые генерируют карту сайта:

  • Yoast SEO: самый популярный плагин для SEO в репозитории, который также поддерживает создание карты сайта. Вы можете найти настройки в разделе SEO > Общие > Функции и XML-файлы Sitemap.
  • RankMath: помимо обычной карты сайта, этот плагин SEO может создавать карту сайта WooCommerce и карту сайта геоданных KML. Перейдите в RankMath > Настройки карты сайта.
  • XML-файлы Sitemap: как следует из названия, плагин создает карту сайта. Он бесплатный и с открытым исходным кодом, поэтому скрытых комиссий нет.
  • XML Sitemap и Google News: этот плагин генерирует XML-карту сайта и карту сайта Google News. Его легко установить и настроить.
  • Companion Sitemap Generator – HTML & XML: если вы хотите сгенерировать карту сайта в формате HTML вместе с картой сайта в формате XML, этот плагин для вас. Оба обновляются автоматически, поэтому вам не нужно выполнять какую-либо ручную работу.

Сайты-генераторы файлов Sitemap

Вместо плагина можно использовать генератор карты сайта, такой как XML-Sitemaps или XML Sitemap Generator. Затем вы можете загрузить его на свой сайт.

Шаг 1. Создайте карту сайта, используя один из указанных выше сайтов или любой генератор по вашему выбору. Загрузите XML-документ.

Шаг 2: Загрузите FileZilla или используйте свой веб-хостинг для подключения к вашему сайту через FTP.

Шаг 3: Поместите XML-файл в корневую папку вашего сайта. Корневой каталог – это самый верхний каталог вашего сайта – тот же каталог, с которого вы начинаете при первом подключении.

В отличие от карт сайта на основе плагинов, карты сайта, созданные с помощью веб-сайта, не являются динамическими. Статические карты сайта не будут обновляться по мере публикации новых записей и страниц на сайте. Вам нужно каждый раз создавать новый файл. Так что для блогов и других сайтов, которые часто обновляются, это не идеально.

Как исправить ошибку Sitemap

Ошибка карты сайта часто вызвана случайной отправкой HTML-страницы, а не правильно отформатированного XML-файла. Но если ваша XML-карта сайта по-прежнему претендует на роль HTML-страницы, у вас может быть более серьезная проблема.

Проблема обычно заключается в легко решаемом конфликте в ваших плагинах WordPress. Вот несколько советов, как заставить вашу карту сайта снова работать правильно.

Проверить на ошибки и перенаправления

Намного проще диагностировать проблему, если у вас есть явный код ошибки для поиска. Первое, что вам нужно сделать, это посетить страницу карты сайта и посмотреть, нет ли там каких-либо странных кодов ошибок.

Если вы заметили ошибку при посещении карты сайта, это заставит Google подумать, что он видит HTML-страницу.

Что делать, если вы периодически замечаете ошибку карты сайта – иногда она есть, а иногда нет? Это может произойти, если вы динамически создаете карту сайта.

Незначительные сообщения и тайм-ауты сервера будут считываться в Google, как если бы ваша карта сайта внезапно стала HTML-страницей, поскольку она показывает сообщение об ошибке, а не XML-файл. Если ошибка возникает редко и не является постоянной или частой, это не повод для беспокойства.

Еще одна вещь, на которую следует обратить внимание, – это перенаправления. Если вы посетите свою страницу карты сайта и внезапно окажетесь на главной странице или в бесконечном цикле перенаправления, это также приведет к ошибке.

Если вы обнаружите какие-либо ошибки или перенаправления, которые не исчезают, проблема обычно заключается в конфликте плагинов. Плагины, которые генерируют карты сайта, такие как Yoast, могут вызывать конфликт, или источником проблемы может стать плагин кеширования.

Но иногда даже кажущиеся случайными плагины могут вызывать конфликты.  Используйте плагин проверки работоспособности и устранения неполадок (Health Check & Troubleshooting) чтобы идентифицировать их.

Установите плагин, если его еще нет, затем перейдите в Инструменты > Работоспособность сайта > Режим устранения неполадок. Он временно отключит все плагины, не затронув ваших посетителей.

Посмотрите, исчезла ли ошибка или перенаправление на вашем сайте. Если это так, повторно активируйте плагины один за другим, пока сайт снова не сломается. Ищите конфликты между несколькими плагинами.

Теперь вы можете связаться с авторами плагинов, чтобы сообщить об ошибке и попросить о помощи.

Отключить кеширование

Одна из основных причин конфликтов – это плагины кеширования. Когда карта сайта кэшируется, это может иногда вызывать проблемы с тем, что Google читает ее как HTML-страницу, так как вам не следует кэшировать XML-файлы таким образом. Из-за этого большинство плагинов кэширования избегают кеширования страницы карты сайта, но они все равно могут делать это ошибочно, особенно если вы используете уникальный URL-адрес для своей карты сайта.

К счастью, вам не нужно отключать весь плагин кеширования. Вы можете добавить исключение, и проблема должна исчезнуть автоматически.

Это должно быть описано в документации вашего плагина. Пример, как это можно сделать в WP Super Cache и W3 Total Cache, читайте ниже.

Для WP Super Cache перейдите в Настройки > WP Super Cache. На вкладке «Дополнительно» прокрутите до пункта «Добавить сюда строки (не имя файла)», что заставляет страницу не кэшироваться.

В этом разделе введите частичный URL-адрес вашей карты сайта. Например, если ваша карта сайта находится по адресу «example-site.com/sitemap.xml», введите «/sitemap.xml».

Для W3 Total Cache перейдите в «Производительность» > «Кэш страниц», затем найдите «Дополнительно»> «Никогда не кэшировать следующие страницы». Как и в случае с WP Super Cache, введите URL-адрес карты сайта.

Проверьте URL вашего файла Sitemap

Хотя это небольшое предположение, всегда стоит перепроверить: вы отправили правильную ссылку? Это элементарная ошибка, и даже один неверный символ укажет не на то место.

Проверьте ссылку, которую вы отправили, как через Google, так и в любых плагинах SEO или Sitemap.

Некоторые плагины могут добавлять косую черту в конце страницы карты сайта («example-site.com/sitemap/» вместо «example-site.com/sitemap»). Этот единственный символ может привести к серьезным проблемам, особенно если он вызывает цикл перенаправления.

Снова включите режим устранения неполадок в плагине проверки работоспособности и попытайтесь найти, какой плагин вызывает эту проблему.

Удалить лишние файлы Sitemap

Хотя обычно это не вызывает проблем, пока вы ссылаетесь на правильную страницу, наличие дополнительных активных карт сайта может иногда вызывать проблемы или путаницу для вас. Кроме того, ваш сервер тратит дополнительные ресурсы на обновление нескольких ненужных карт сайта.

Плагины могут добавлять разные карты сайта, и вы даже не догадываетесь, что WordPress создает для вас свои собственные. Поэтому нужно проверить и удалить все, кроме того, который хотите использовать. Вот несколько URL-адресов, которые можете проверить на своем сайте:

  • /sitemap.xml – стандартный выбор для сгенерированных карт сайта в большинстве плагинов для карт сайта.
  • /wp-sitemap.xml – это карта сайта по умолчанию, созданная WordPress начиная с версии 5.5.
  • /sitemap_index.xml – URL-адрес карты сайта, созданной Yoast.

А если вы загрузили другие плагины для SEO или карты сайта, они могут использовать совершенно другие URL. Проверьте документацию и убедитесь, что вы отключили все функции карты сайта, которые не нужны.

Вам действительно нужен файл Sitemap?

Иногда карты сайта могут необъяснимо быть источником постоянного потока проблем. И простого исправления может быть недостаточно, чтобы они исчезли. Если вы постоянно сталкиваетесь с трудно решаемыми проблемами, то начнете сомневаться в том, важна ли для вас карта сайта.

Обычно рекомендуется создавать карту сайта, но Google заявляет, что никогда не будет наказывать ваше SEO за отсутствие карты сайта. Карта сайта может только помочь улучшить ваше SEO и ускорить индексацию вашего сайта.

Но не обязательно, чтобы он был у вас в определенных ситуациях, и сам Google предлагает не использовать их на некоторых сайтах.

Предположим, на вашем сайте меньше 500 страниц, и вряд ли когда-либо будет больше. В этом случае, если сайт имеет внутренние ссылки (что вам все равно следует делать) и не имеет большого количества мультимедийных файлов, которые вы хотите отображать в Google Images и Google Video, вам может вообще не понадобиться карта сайта.

С другой стороны, наличие карты сайта действительно поможет вашему оптимизатору поисковых систем, и в ее наличии нет ничего плохого, поэтому продвижение и устранение проблемы не принесет ничего, кроме пользы. Ваш сайт сейчас может быть небольшим, но, вероятно, так будет не всегда.

Ошибка «Карта сайта выглядит как HTML-страница» может раздражать, но обычно это просто результат неправильно отформатированной страницы или легко решаемого конфликта кеширования. После того, как вы выяснили проблему, ее решение – это всего лишь несколько дополнительных шагов.

Источник: kinsta.com

Смотрите также:

Изучает сайтостроение с 2008 года. Практикующий вебмастер, специализирующий на создание сайтов на WordPress. Задать вопрос Алексею можно на https://profiles.wordpress.org/wpthemeus/

Index XML Метаданные карты сайта

Index XML Метаданные карты сайта

Содержание индекса Облако релевантности Coveo Разработчик Системный администратор Документация по продукту

В этой статье

  • Сторонние расширения
  • Пользовательские метаданные для Coveo
  • Индексирование источника карты сайта по ссылке
  • Метатеги перечисленных веб-страниц
  • Настройка полей и сопоставлений

Источник Sitemap поддерживает индексацию дополнительных метаданных, включенных в XML-файл карты сайта. Эти метаданные могут поступать из:

  • Сторонние расширения карты сайта, такие как расширение изображений Google, которые предоставляют Google и другим поисковым роботам карты сайта дополнительную информацию об изображениях, содержащихся на вашем сайте (см. Расширение протокола Sitemaps, Карта сайта для изображений и Сторонние расширения).

  • Пространство имен Coveo ( coveo:metadata ) и метаданные, добавленные в вашу карту сайта, чтобы предоставить Coveo дополнительную информацию об элементах (см. Специальные пользовательские метаданные Coveo).

Кроме того, источник Sitemap также может индексировать метаданные, полученные из метатегов в заголовке веб-страниц, перечисленных в вашей карте сайта.

В любом случае шаги по настройке того, как Coveo хранит эту информацию, одинаковы.

Сторонние расширения

Некоторые сайты, такие как Google, предлагают расширения, добавляющие дополнительные метаданные в вашу карту сайта (см. Карту сайта для изображений). Кроме того, вы можете создать собственное расширение, расширяющее протокол Sitemaps. В любом случае данные, добавленные в вашу карту сайта, могут быть извлечены и доступны для поиска с помощью Coveo. См. Настройка полей и сопоставлений, чтобы правильно настроить Coveo.

См. также карты сайта для видео и альтернативные карты сайта для видео в качестве другого примера.

Пользовательские метаданные, специфичные для Coveo

Разработчик может включать пользовательские метаданные в XML-файл карты сайта специально для целей индексации Coveo. Когда они могут создавать или изменять файл XML карты сайта репозитория для индексации, они также могут включать пространство имен Coveo ( coveo:metadata ) и метаданные для предоставления информации об элементах, которые не найдены в полях по умолчанию (т.е. исходные поля и поля Coveo по умолчанию).

Пример

Поскольку у вас есть контроль над файлом карты сайта (он не создается третьей стороной), вы решаете создать XML-файл карты сайта динамически и добавить все необходимые настраиваемые метаданные.

Хотя добавленные метаданные Coveo будут считываться только поисковым роботом и соединителем Coveo и игнорироваться всеми другими процессами, они по-прежнему соблюдают протокол Sitemap (см. XML-формат файлов Sitemap).

Для следующей процедуры требуется пользователь с разрешениями и навыками для изменения или создания XML-файла карты сайта, а также необходимые права в административной консоли Coveo.

Чтобы добавить пользовательские метаданные Coveo в XML-карту сайта

Для изменения или создания XML-файла карты сайта необходимо запрограммировать сторонний процесс следующим образом:

  1. В начальном теге XML-элемента urlset ( ) расширьте протокол Sitemap, используя пространство имен Coveo, добавив следующую строку:

    xmlns:coveo="https://www.coveo.com/en/company/about-us"

    Примечание

    С точки зрения Coveo значение атрибута xmlns:coveo (т. е. URI) не имеет значения. Сканер карты сайта Coveo игнорирует это значение. Однако другим службам индексации поисковых систем может потребоваться проверка этого URI.

    Имя атрибута (т. е. xmlns:coveo ) важно, поскольку XML-файл карты сайта будет содержать элементы в области пространства имен coveo .

    Пример

     
    <набор URL-адресов
      xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-экземпляр"
      xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd"
      xmlns:coveo="https://www.coveo.com/en/company/about-us"> 
  2. Для каждого элемента URL ( ) в карте сайта создайте новый элемент XML с именем coveo:metadata ( ).

    Пример

     
      http://example. com/about/
      2015-02-10T13:47:23+00:00
      еженедельно
      <приоритет>1,00
      
      
     
  3. В элементах coveo:metadata добавьте свои пользовательские метаданные (имя и значение).

    Примечания

    • Для индексации специальных символов необходимо использовать тег CDATA ( ![CDATA[ ) в начале узла (см. Данные символов и разметка). Затем источник игнорирует тег CDATA и индексирует остальное содержимое узла, такое как специальные символы (например, и , % , 9).0029 $ , ~ и теги ) в виде текста.

      Пример:

      Метаданные companyname в следующем содержимом файла карты сайта

       
        18467
        <название компании>
            <США>
          ]]>
        
       

      индексируется в вашем индексе Coveo следующим образом:

    • Вложенные метаданные внутри Элемент не поддерживается.

    Пример

    Вы хотите добавить имя автора, дату последней модификации и теги документа (если есть), поэтому вы добавляете следующие элементы XML:

     
      <дата модификации>2015-02-10T13:47:23+00:00
      Джон Смит
      <теги />
     

После этого карта сайта может выглядеть следующим образом:

 
<набор URL-адресов
  xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  xmlns:xsi="http://www.w3.org/2001/XMLSchema-экземпляр"
  xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap. xsd"
  xmlns:coveo="https://www.example.com/schemas">
  <ссылка>
    http://example.com/about/
    2015-02-10T13:47:23+00:00
    еженедельно
    <приоритет>1,00
    
      <дата модификации>2015-02-10T13:47:23+00:00
      Джон Смит
      <теги />
    
  
 

Примечание

Для получения дополнительной информации обращайтесь в Coveo Professional Services.

Индексирование источника карты сайта по ссылке

Если у вас есть вся информация, которую вы хотите индексировать, в метаданных файла карты сайта, вы можете игнорировать индексирование содержимого документов, на которые есть ссылки в карте сайта, тем самым повышая производительность индексирования (см. процесс индексации).

Индексирование по ссылке не означает, что означает, что ваша конфигурация парсинга веб-страниц игнорируется. Сканер карты сайта Coveo по-прежнему будет очищать содержимое документов, соответствующих вашей конфигурации фильтра адресов. Чтобы предотвратить непредвиденные значения полей, избегайте использования тех же имен метаданных в конфигурации парсинга веб-страниц, что и в файле карты сайта.

Для индексации источника Sitemap по ссылке

  1. На странице Sources (platform-eu | platform-au) консоли администрирования Coveo добавьте источник Sitemap.

  2. Доступ к панели Редактировать исходную конфигурацию JSON источника, который вы только что создали.

  3. В разделе documentConfig исходной конфигурации JSON найдите раздел extensionSettings .

  4. В разделе extensionSettings удалите разделы ByExtensions и ByContentTypes .

  5. Найти noExtension и других секций .

    • В разделе noExtension измените значение action с Retrieve на Reference .

    • В разделе other измените значение action с Retrieve на Reference .

  6. Щелкните Сохранить и перестроить исходный код .

Метатеги перечисленных веб-страниц

По умолчанию сканер источника Sitemap не индексирует содержимое метатегов в заголовке веб-страниц, перечисленных в карте сайта. Эта операция требует значительных ресурсов и поэтому может повлиять на производительность индексирования.

Если вы хотите, чтобы сканер источника Sitemap индексировал содержимое метатегов в качестве метаданных исходного элемента, добавьте в исходную конфигурацию JSON следующее:

 "IndexHtmlMetadata": {
  "чувствительный": ложь,
  "значение": "истина"
} 

IndexHtmlMetadata — это параметр искателя . После того как сканер обработает HTML-страницу, документ передается диспетчеру обработки документов, где конвертер HTML также извлекает метаданные страницы. По умолчанию значения метаданных, извлеченные менеджером обработки документов, переопределяют значения, проиндексированные сканером.

Упрощенный рабочий процесс индексации исходных метаданных Sitemap (см. Конвейер индексации Coveo).

Например, если вы индексируете метаданные документа, указанные в XML-файле карты сайта, а сами ваши HTML-файлы содержат метатегов для одного и того же ключа, ваши документы будут индексироваться со значениями метатегов HTML по умолчанию, независимо от того, установлено ли для IndexHtmlMetadata значение true или false. Чтобы заставить Coveo индексировать значения, установленные на этапе сканирования, установите для аргумента origin значение искатель в правиле сопоставления.

При включенном IndexHtmlMetadata сканер Sitemap будет индексировать атрибут content со значением метатеги , когда этот тег имеет один из следующих атрибутов: name , property , itemprop или http-equiv .

Пример

Учитывая тег , сканер Sitemap индексирует следующие метаданные: "viewport": "width = ширина устройства, начальный масштаб = 1,0 дюйма .

Настройка полей и сопоставлений

Независимо от того, как дополнительные метаданные были добавлены в вашу карту сайта, вы должны настроить Coveo, чтобы он адекватно индексировал эту информацию.

  1. В консоли администрирования Coveo убедитесь, что у вас есть необходимые права.

  2. На странице Поля (platform-eu | platform-au) для всех метаданных, которые вы хотите видеть в сведениях об элементе, добавьте соответствующее настраиваемое поле.

  3. На странице Sources (platform-eu | platform-au) добавьте правило сопоставления для каждого добавленного вами поля.

    Примечания

    • Coveo поддерживает один уровень метаданных в элементе .

      Например:

       
        WW1
        Inspiron XPS; XPS Dimension
       
    • Coveo поддерживает расширения стандарта Sitemap (например, Google Video Sitemap). В этом сценарии Coveo сглаживает метаданные, т. е. ключ каждой части данных является результатом пути к соответствующему значению.

      Например, приведенный ниже фрагмент карты сайта приводит к следующим сглаженным метаданным: "video.thumbnail_loc": "http://img.youtube.com/vi/wejYF7l0kKQ/2.jpg" .

       <ссылка>
          http://www.example.com/videos/some_video_landing_page.html
          <видео:видео>
            <видео:thumbnail_loc>
              http://img.youtube.com/vi/wejYF7l0kKQ/2.jpg
            
          
         

    Пример

    Вы хотите, чтобы миниатюра видео была в метаданных результатов, поэтому вы добавляете поле videothumbnail и используете следующее правило сопоставления: %[video. thumbnail_loc] .

  4. Сохраните и перестройте исходный файл Sitemap.

  5. На странице Content Browser (platform-eu | platform-au) на вкладке Поля , расположенной на панели Свойства исходных элементов Sitemap, убедитесь, что новые метаданные доступны (см. «Вкладка»).

Была ли эта статья полезной?

Очень полезно Не совсем

Что такое карта сайта? Обновленное введение в карты сайта XML [2022]

Карта сайта — это список информации обо всех страницах, видео, изображениях и других файлах на веб-сайте. Эта информация используется поисковыми роботами и поисковыми системами для понимания структуры веб-сайта и связи между файлами и страницами на нем.

Существует два основных типа карт сайта — карты сайта в формате HTML и карты сайта в формате XML.

XML-карты сайта в первую очередь предназначены для поисковых систем, их ботов и поисковых роботов, чтобы дать им лучший обзор структуры вашего веб-сайта. Это позволяет поисковым роботам легко получать доступ ко всем страницам вашего веб-сайта, а также ко всей соответствующей информации о нем. Обычно это URL-адрес страницы, дата последнего обновления и любые языковые варианты страницы. Зная структуру вашего веб-сайта, он позволяет поисковым системам разумно сканировать ваш веб-сайт и гарантирует, что все страницы вашего веб-сайта находятся в их поисковом индексе. Наличие XML-карты сайта для вашего веб-сайта считается лучшей практикой SEO.

HTML-карты сайта обычно создаются в удобном для чтения формате и структуре и используются, чтобы помочь пользователям найти то, что они ищут. Карта сайта в формате HTML не обязательно должна включать все ваши URL-адреса/страницы. Она должна быть сделана так, чтобы помочь пользователю найти то, что он ищет, если он потеряется на вашем веб-сайте. Многие создают HTML-шаблон, чтобы помочь пользователю найти наиболее важные страницы на своем веб-сайте.

Содержание

  • Что такое XML-карта сайта?
  • Нужна ли мне XML-карта сайта?
  • Как выглядит XML-карта сайта?
  • Как создать XML-карту сайта
  • Зачем отправлять XML-карту сайта в Google?
  • Как отправить XML-карту сайта в Google?
  • Как найти карту любого веб-сайта?
  • Что такое карта сайта HTML?
  • Как выглядит карта сайта в формате HTML?
  • XML и карты сайта HTML
  • Создание карты сайта в Umbraco

 

Что такое XML-карта сайта?

Протокол Sitemaps был представлен Google, но поддерживается большинством основных поисковых систем, таких как Bing и Yahoo. В XML-карте сайта можно добавить дополнительную информацию к URL-адресу, что поможет поисковым роботам оптимизировать то, как они просматривают ваш сайт.

Обычно включает время и дату последнего изменения страницы, но может также включать дополнительную информацию, такую ​​как частота изменений и относительный приоритет страницы по сравнению с другими страницами. Дополнительная информация о частоте и приоритете изменений Google больше не используется. Включить их не помешает, но Google полностью их игнорирует. Вместо этого Google полагается исключительно на дату последнего изменения.

Наличие XML-карты сайта и отправка ее в основные поисковые системы отлично подходит для поисковой оптимизации и является общепринятой передовой практикой среди маркетологов. Наличие карты сайта и отправка ее в Google — это практика, которая может принести пользу вашему сайту и никогда не будет чем-то, за что вы будете наказаны (подтверждено Google).

Если вы используете много изображений и видео, вы также можете создать и отправить специальные карты сайта для них. Это может помочь улучшить видимость при поиске изображений и видео, а также открыть возможность отправки дополнительной информации об этих файлах. Карта сайта для видео может включать время воспроизведения видео, категорию и рейтинг соответствия возрасту, а карта сайта для изображений может включать тему, тип и лицензию.

Нужен ли файл Sitemap в формате XML?

Если все ваши страницы правильно связаны, сканеры поисковых систем обычно смогут обнаружить все ваши страницы без карты сайта. Но, добавляя дополнительную информацию в карту сайта, вы помогаете поисковым роботам повысить эффективность их работы и, таким образом, помогаете им обнаруживать изменения быстрее, чем в противном случае. Сканеры поисковых систем не сканируют каждую страницу вашего сайта каждый раз, когда они посещают ваш сайт. Если вы не предоставите информацию о том, какие страницы являются наиболее важными для сканирования, для обнаружения изменений часто требуется время.

Если вы хотите узнать больше о том, как оптимизировать свой веб-сайт для сканирования и индексации поисковыми системами, мы написали об этом официальный документ.

Несмотря на то, что все веб-сайты должны иметь карту сайта, веб-сайты, соответствующие одному из следующих 4 критериев, получат наиболее значительные улучшения:

 

Действительно большие веб-сайты

означает, что может пройти много времени, прежде чем сканер получит обновленные или созданные URL-адреса. Указав дату последнего изменения в карте сайта, вы можете гарантировать, что сканеры не пропустят недавно обновленные страницы. Если ваша карта сайта больше 50 МБ или содержит более 50 000 URL-адресов, Google не примет ее. В этом случае вам придется разделить карту сайта на несколько карт сайта и загрузить их по отдельности. Кроме того, вы можете создать индексный файл карты сайта со ссылками на отдельные карты сайта.

 

На вашем веб-сайте много страниц, которые изолированы или плохо связаны между собой

Если на вашем веб-сайте есть части, на которые нет надлежащих ссылок, существует вероятность того, что поисковые системы пропустят эти страницы, а не поместите их в свой индекс. Это может быть в том случае, если на вашем веб-сайте есть старые архивы контента или страницы-сироты.

Эта проблема также может возникнуть, если вы полагаетесь на JavaScript для обслуживания своего контента, например, на веб-сайте JAMstack. Сканеры поисковых систем могут сканировать контент из JavaScript, просто это занимает больше времени, потому что им нужно выполнить дополнительный шаг рендеринга. В этом случае он может не получить ссылки на определенные страницы, потому что он еще не отобразил их и не поместил в свой индекс.

 

Ваш веб-сайт новый и/или имеет мало внешних обратных ссылок

Сканеры поисковых систем обнаруживают контент в Интернете, переходя по ссылкам с одной страницы на другую. Если на вашем веб-сайте мало внешних обратных ссылок с других веб-сайтов, ваш веб-сайт может вообще не быть обнаружен поисковыми системами. Отправляя карту сайта, вы даете поисковым системам, таким как Google, план вашего веб-сайта и значительно облегчаете их поисковым роботам поиск ваших страниц.

 

Ваш веб-сайт использует мультимедийный контент в поисковых системах

Если на вашем веб-сайте используются новости Google или другой мультимедийный контент в поисковых системах, дополнительная информация в карте сайта может быть использована для улучшения вашего контента.

Как выглядит XML-карта сайта?

Карта сайта XML должна иметь строгую структуру, если вы хотите, чтобы поисковые системы, такие как Google, использовали ее. Если ваша карта сайта не соответствует правилам, она не будет использоваться и не принесет никакой пользы вашему веб-сайту.

Существует 3 формата, которые вы можете использовать для создания XML-карты сайта, и все они поддерживаются Google:

  1. XML
  2. RSS, mRSS и Atom 1.0
  3. Текст

Чтобы найти полную информацию обо всех трех форматах и ​​о том, как вам нужно их структурировать, вы должны следовать официальному протоколу на сайте sitemaps.org.

Ниже приведено описание различных тегов карты сайта XML и того, как выглядит карта сайта XML.

 

 http://www.example.com/  2005-01-01ежемесячно0,8   

Это пример структуры XML-файла карты сайта. Если вы хотите увидеть, как выглядит реальная карта сайта, взгляните на карту сайта Umbraco.

 

Этот тег является необязательным.

Сообщает поисковым системам, какая версия XML используется и какая кодировка используется.

 

Этот тег является обязательным.

Отмечает начало и конец файла и ссылается на стандарт протокола, которому следует. Это всегда будет одинаковым для всех веб-сайтов и карт сайта. Как видно из примера выше, тег необходимо закрыть в самом конце документа, добавив .

 

Этот тег является обязательным.

Это родительский тег каждой записи URL, и все теги, расположенные под ним, являются его дочерними элементами. Для каждого URL-адреса в карте сайта вам потребуется один тег , содержащий необходимую информацию об URL-адресе. Для URL можно добавить следующие 4 тега (1 обязательный, 1 рекомендуемый и 2 необязательный):

 

Этот тег является обязательным.

Это URL-адрес страницы, и он должен быть записан точно так, как сервер возвращает URL-адрес. Есть несколько элементов, о которых нужно знать, и вы должны убедиться, что они правильно реализованы:

  1. Протокол:  URL-адрес должен начинаться с протокола: https:// или http://.
  2. www. или без www. : Вы должны использовать именно ту версию, которую использует ваш веб-сайт.
  3. Косая черта в конце : Если ваш сервер возвращает URL-адреса с завершающей косой чертой в конце URL-адреса, вы также должны включить это. В приведенном выше примере в конце используется завершающая косая черта, но на вашем веб-сайте может и не быть.
  4. Длина : URL-адрес должен быть меньше 2,048 символов. Если он длиннее, он не будет обработан.

 

Этот тег является необязательным (но настоятельно рекомендуется).

Этот тег используется для обозначения времени последнего изменения/обновления. Дата должна быть в формате W3C Datetime. Включив его в свою карту сайта, Google и другим поисковым системам будет проще определить, не устарела ли версия, которая находится в их индексе. Google хранит метку времени последнего сканирования URL-адреса, и если она старше даты последнего изменения, указанной в карте сайта, это повысит вероятность того, что Google просканирует эту страницу, чтобы получить последние изменения и добавить их в свой индекс. .

Раньше вы могли повлиять на это, используя два следующих тега, но  Google игнорирует оба из них (согласно их рекомендациям).

 

Этот тег является необязательным.

Используется, чтобы дать поисковым системам указание на то, как часто меняется содержимое и, следовательно, как часто они должны сканировать URL-адрес. Допустимые значения для него:

  • всегда
  • почасовая
  • ежедневно
  • еженедельно
  • ежемесячно
  • ежегодно
  • никогда

Google больше не использует этот тег и полностью его игнорирует. Это может различаться в разных поисковых системах, но если вы планируете только отправить карту сайта в Google, вам не следует тратить время на этот тег.

 

<приоритет>

Этот тег является необязательным.

Этот тег используется для определения относительного приоритета по сравнению с другими URL-адресами на вашем веб-сайте. Допустимые значения варьируются от 0,0 (самый низкий) до 1,0 (самый высокий). Приоритет по умолчанию равен 0,5.

Еще раз важно подчеркнуть, что Google больше не использует этот тег, и это не повлияет на то, как они сканируют ваш сайт.

 

Как насчет многоязычных веб-сайтов?

Если ваш контент существует на нескольких языках, вы также можете включить тег с соответствующей информацией в карту сайта для каждого из ваших URL-адресов. Это альтернативный способ сделать это вместо того, чтобы включать его в виде тегов HTML на самих страницах.

Дополнительную информацию об этом можно найти в официальной документации Google по локализованным версиям.

Как создать XML-карту сайта

Создание XML-карты сайта возможно с любой системой управления контентом, оптимизированной для SEO, которую вы можете использовать. Точные шаги по созданию карты сайта зависят от используемой вами системы. Наиболее распространенным решением для создания XML-карты сайта для вашего веб-сайта является использование расширения для вашей CMS.

Если вы не используете CMS для своего веб-сайта или не хотите использовать расширение, вы также можете разработать собственное расширение.

Независимо от того, какое решение вы выберете, создание карты сайта часто считается разовой задачей. После создания карты сайта важно, чтобы она автоматически обновлялась, чтобы все изменения, которые вы вносите в существующие страницы, и любая новая страница, которую вы создаете, отражались в карте сайта. Это стандартная функциональность расширений для создания карт сайта, и она часто работает без дополнительной настройки.

Если вы хотите понять, как это работает, ознакомьтесь с этим пошаговым руководством по созданию XML-карты сайта в Umbraco.

Где разместить карту сайта?

Простой ответ — всегда помещать его в корень вашего веб-сайта (например, http://www.example.com/sitemap.xml). Расположение файла имеет значение, потому что отправленные URL-адреса должны начинаться с того же пути, что и карта сайта.

Другими словами, если ваша карта сайта отправлена ​​во вложенную папку (например, http://www.example.com/subfolder/sitemap.xml), вы можете добавлять только те URL-адреса, которые являются частью http://www.example .com /подпапка/ путь. Если вы отправляете URL-адреса, которые находятся в другой папке (http://www.example.com /other-folder/ ), субдомене (http:// субдомен .example.com/subfolder/) или другой протокол ( https ://www.example.com/subfolder/) не сработает.

Нет никаких требований к имени файла или расширению файла (.xml), поэтому не стесняйтесь называть его как хотите, если он доступен и может быть отправлен поисковым системам.

Зачем мне отправлять карту сайта в формате XML в Google?

Отправка карты сайта в Google не является строго обязательной для того, чтобы ваш веб-сайт можно было найти, поскольку поисковые роботы Google обычно довольно хорошо обнаруживают новые страницы, изображения и видео. Но зачем оставлять это исключительно в руках Google и надеяться, что они найдут ваш новый контент, если вместо этого вы можете помочь?

Отправив карту сайта в формате XML в Google, поисковым роботам Google будет намного проще находить все содержимое вашего веб-сайта. Помимо помощи Google в поиске всего вашего контента, это также хороший способ получать уведомления о любых ошибках на вашей странице, которые могут быть обнаружены Google. После того, как вы отправите карту сайта в Google Search Console, вы сможете получить доступ к Отчет об охвате карты сайта , в котором показаны ошибки и предупреждения для вашей карты сайта. Это могут быть URL-адреса, которые приводят к ошибке сервера (5xx), не найдено (404) или программному коду состояния 404 HTTP. Получая эти отчеты, вы сможете избежать этих проблем, которые повлияют на вашу производительность в результатах обычного поиска.

Как отправить карту сайта в формате XML в Google?

Если вы хотите отправить карту сайта в формате XML в Google, вы можете сделать это тремя различными способами. Рекомендуемым методом является первый — отправка через Google Search Console — но если это не работает для вас, вы можете выбрать один из двух других.

 

Отправьте XML-карту сайта через Google Search Console

Если вы уже подтвердили свой веб-сайт через Google Search Console, отправить свой веб-сайт очень просто. После того, как вы вошли в свою учетную запись Search Console и выбрали свой веб-сайт, вам нужно будет перейти к «Картам сайта», который находится в левом меню в разделе «Индекс».

Оказавшись на странице, вам нужно ввести URL-адрес карты сайта и нажать «Отправить». Вот и все — ваша карта сайта теперь будет проверена, и, если формат правильный, она получит статус «Успешно».

Отправьте карту сайта XML с помощью файла robots.txt

Если вы не хотите использовать Google Search Console, вы также можете отправить карту сайта, добавив ее в файл robots.txt. Для этого вам нужно указать путь к вашей карте сайта, добавив следующую строку в любом месте файла robots.txt:

Карта сайта: https://yourwebsite.com/sitemaplocation.xml

Если вы хотите посмотреть, как это выглядит на действующем веб-сайте вы можете посмотреть umbraco.com/robots.txt.

 

Отправьте HTTP-запрос GET в «ping» Google

Последний вариант — «пинговать» Google и попросить их поисковых роботов просканировать ваш сайт. Это делается путем отправки запроса HTTP GET:

https://www.google.com/ping?sitemap=https://yourwebsite.com/sitemaplocation.xml

Как найти карту сайта любого веб-сайта?

Вы только что устроились на новую работу и хотите проверить, нормально ли выглядит ваша карта сайта? Или, может быть, вы работаете в агентстве и только что получили нового клиента?

Какой бы ни была причина, есть разные способы найти карту сайта. Поскольку карта сайта не имеет фиксированного положения, как файл robots.txt, нет никаких гарантий, что вы сможете найти ее, используя приведенные ниже советы.

Тем не менее, карты сайта довольно стандартизированы, поэтому обычно их можно найти одним из 6 способов, показанных ниже. Некоторые веб-сайты могут скрывать их, чтобы конкуренты не могли просматривать их карту сайта, но, поскольку в карте сайта нет неотъемлемых угроз безопасности, владельцы веб-сайтов редко тратят на это время и ресурсы.

Давайте рассмотрим 6 способов найти карту сайта. Первые 2 способа требуют, чтобы у вас был доступ к веб-сайту, а последние 4 — это более общие способы найти карту сайта любого веб-сайта.

Проверить, была ли она отправлена ​​в Google Search Console

Если у вас есть доступ к веб-сайту, первый способ найти карту сайта — это проверить, была ли она уже отправлена ​​в Google Search Console.

Обратите внимание, что у вас должен быть доступ к свойству Google Search Console, для чего может потребоваться его предварительная проверка. Это можно сделать несколькими способами, но если у вас есть доступ к веб-сайту, это обычно довольно просто (вы можете прочитать о вариантах здесь).

Получив доступ, вы можете перейти в раздел «Карты сайта», который находится в разделе «Индекс» в левом меню. Если вы видите что-либо в «Отправленных картах сайта», вы можете щелкнуть по нему, после чего в правом верхнем углу появится ссылка «Открыть карту сайта». Это приведет вас к URL-адресу карты сайта.

Проверка в бэкенде CMS

Если карта сайта не была отправлена ​​в Google Search Console, следующим шагом будет проверка бэкенда системы управления контентом веб-сайта.

Где именно его найти, во многом зависит от вашей CMS и от того, как она устроена. На скриншоте вы видите пример того, как это выглядит при поиске в установке Umbraco.

Если вы не можете найти его с помощью поиска, взгляните на различные настройки и плагины/расширения, которые вы используете. Поскольку он обычно используется для улучшения SEO, вы обычно найдете его среди других настроек, связанных с SEO.

Проверьте наиболее распространенные местоположения карты сайта

В то время как первые два способа требуют, чтобы у вас был доступ к веб-сайту, следующие несколько советов этого не требуют.

Поскольку карты сайта обычно стандартизированы, этот способ найти их — просто попробовать некоторые из наиболее распространенных местоположений. Хотя нет никакой гарантии, что карта сайта будет найдена там, это быстрый способ проверить, найдена ли она в некоторых из наиболее часто используемых мест.

Вот список наиболее распространенных местоположений карты сайта:

Распространенные местоположения карты сайта

  • /sitemap/
  • /карта сайта
  • /sitemap. xml
  • /sitemap1.xml
  • /sitemap_index.xml
  • /sitemap-index.xml
  • /sitemapindex.xml

Проверьте файл robots.txt

Часто рекомендуется включать ссылку на карту сайта в файл robots.txt для вашего веб-сайта.

И, к счастью, существуют строгие правила размещения этого файла, поэтому вы всегда сможете найти его на любом сайте, где он есть (не на всех сайтах).

Чтобы найти файл robots.txt для любого веб-сайта, все, что вам нужно сделать, это перейти по пути /robots.txt, и вы сможете увидеть, есть ли в нем ссылка на карту сайта. Это касается нашего веб-сайта, где вы можете найти ссылку на нашу карту сайта, перейдя по ссылке https://umbraco.com/robots.txt.

 

Используйте операторы поиска Google

Если вам еще не удалось найти карту сайта, пришло время использовать ее в поиске Google и использовать некоторые операторы поиска, чтобы узнать, сможете ли вы ее найти.

Здесь важно отметить, что карта сайта будет отображаться только в том случае, если она индексируется Google и добавлена ​​в их поисковый индекс. Как правило, это не так, так как большинство файлов Sitemap будут иметь статус noindex, follow или просто не будут найдены Google. Примером может служить наша карта сайта, которую вы не сможете найти с помощью операторов поиска, указанных выше.

Вот список различных поисковых операторов, которые вы можете попробовать использовать в разных комбинациях (например, site:example.com filetype:xml в одном комбинированном поиске):

Поисковые операторы Google

  • site:example.com
  • тип файла:xml или тип файла:txt
  • доб:xml или доб:txt
  • адрес: карта сайта

Поиск других типов карты сайта (RSS, mRSS, Atom 1.0 или Text)

Все еще не удалось найти карту сайта? Затем вы можете дать ему последний шанс, просмотрев различные типы карт сайта.

Помните, что XML-карта сайта — не единственный формат, и веб-сайт может использовать другой формат. Если это так, просмотрите список общих местоположений карты сайта и объедините его с различными расширениями.

Вот список возможных путей, которые вы можете посмотреть:

Другие типы карт сайта

  • /sitemap.txt
  • /sitemap1.txt
  • /sitemap_index.txt
  • /sitemap-index.txt
  • /sitemapindex.txt
  • /rss/
  • /rss.xml
  • /атом.xml

Что такое карта сайта HTML?

Карта сайта в формате HTML — это просто еще один элемент навигации, с помощью которого вы можете помочь пользователю найти то, что он ищет.

Карта сайта представлена ​​в формате HTML, чтобы пользователю было проще ее использовать и перемещаться по ней. Это следует рассматривать не как замену функции поиска или элементов навигации, а как дополнительную помощь пользователю, если он потеряется на вашем веб-сайте.

Карты сайта в формате HTML не следует отправлять поисковым системам, но их следует включать в элементы навигации вашего веб-сайта. Обычно карта сайта в формате HTML находится в нижнем колонтитуле веб-сайта. Карта сайта в формате HTML может помочь выявить ваши самые важные страницы и особенно полезна, если у вас есть глубокая структура URL-адресов, где часть вашего наиболее важного контента находится глубоко в естественной навигации по веб-сайту.

Как выглядит карта сайта в формате HTML?

Карта сайта в формате HTML выглядит так же, как карта сайта в формате XML с точки зрения содержания, но в более удобочитаемом формате. Вместо того, чтобы представлять URL-адреса веб-сайта в формате XML, это делается в HTML, чтобы сделать его более удобным для пользователя и читабельным.

Карта сайта в формате HTML имеет ту же цель, что и карта сайта в формате XML, — создание обзора URL-адресов на веб-сайте, — но предназначена для реальных пользователей, а не для сканеров поисковых систем. Эта разница очевидна в том, как она отформатирована, поскольку карта сайта HTML намного чище и легче читается пользователем, чем формат XML.

Карта сайта в формате HTML предназначена для того, чтобы помочь пользователям найти страницы, которые в противном случае им было бы трудно найти.

Сегодня сайты не используют HTML-карту сайта. Вместо этого большинство веб-сайтов используют обширные элементы навигации, такие как главное меню навигации, подменю навигации, нижние колонтитулы и внутренние поисковые системы. Самое близкое к HTML-карте сайта на современных веб-сайтах — это обзорные страницы в различных разделах веб-сайтов.

Примером может служить обзорная страница, которую мы создали для нашей базы знаний. Это перечислено в алфавитном порядке и дает вам ссылки на все темы, которые мы освещаем, в простом формате HTML.

Карты сайта XML и HTML — что мне следует использовать?

К счастью, вам не нужно выбирать между ними, так как у них разные цели. Когда дело доходит до выбора карты сайта, вполне приемлемо выбрать оба варианта. В то время как карта сайта в формате XML настоятельно рекомендуется, карта сайта в формате HTML не является обязательной, но все же рекомендуется иметь ее.

Как объяснялось выше, основное различие заключается в том, на кого нацелены карты сайта и кто должен понимать/читать информацию.

В XML-карте сайта вам не нужно думать о пользователе, удобочитаемости и полезности информации для пользователя. Вас беспокоит только поисковые роботы и какая информация им нужна, чтобы лучше понять ваш сайт. Это означает, что информация, которая в противном случае не имеет значения для пользователя, например, частота изменений, очень важна в XML-карте сайта.

У вас всегда должна быть карта сайта в формате XML, и вы должны отправлять ее в основные поисковые системы. Обычно это основная функция вашей CMS, и ее нужно настроить только один раз.

С другой стороны, HTML-карта сайта предназначена для пользователя, пытающегося найти что-то на вашем веб-сайте. Так помогает ли приоритет найти то, что им нужно? Возможно нет.

Вместо этого карта сайта в формате HTML должна быть более простой версией вашей карты сайта в формате XML, которая красивее и удобнее для пользователя, чем длинный список страниц в формате XML. Это означает замену необработанного URL-адреса более описательным заголовком (также называемым анкорным текстом) и, возможно, даже добавление описания или хлебных крошек к ссылкам.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *