Компания Яндекс — Технологии — Семантическая разметка
Поисковым системам известны десятки миллиардов веб-страниц. Эти страницы содержат самые разные данные: тексты, картинки, видеоролики, карты, ссылки на другие страницы. Когда вам нужно что-то отыскать в Сети, вы обращаетесь к поисковой системе, и она находит веб-страницы с нужной информацией, ориентируясь на ключевые слова из запроса.
Поисковики достаточно умны, чтобы понимать, на каком языке задан запрос; они умеют учитывать морфологию языка и подбирать словам из запроса синонимы. Однако в полной мере осознать, о чём именно идет речь на найденной веб-странице, машины не в состоянии.
Представьте, к примеру, сайт поликлиники с возможностью записи на приём к врачу через интернет. Среди всех страниц сайта поисковый робот без труда найдёт нужную — ту, где выполняется запись, — но дальше возникнут трудности. Человек легко догадается, что «Иванов», «Петров» и «Сидоров» — это фамилии врачей, «окулист», «невролог» и «терапевт» — их специализации, а «9:00», «9:30» и «10:00» — возможное время начала приёма. Компьютер же самостоятельно такие выводы сделать не может.
А если бы машина могла «читать» страницы так же, как это делает человек, она бы могла помочь в решении гораздо более сложных задач. Скажем, не просто «Записаться к врачу в поликлинику №2», а «Записаться к окулисту, о котором хорошо отзываются, в поликлинику не дальше чем в пяти километрах от моей работы, на 12-13 сентября, на утро, но не позже 11:00».
Впрочем, объяснить компьютеру, о чем идёт речь на веб-странице, вполне возможно. Для этого нужно дать ему подсказку.Такой подсказкой служит семантическая разметка или микроразметка. По сути, микроразметка — это отдельный язык с собственными словарём и синтаксисом, задача которого — помочь машинам (в частности, поисковым роботам) понять концепции, используемые людьми.
Микроразметка добавляется в HTML-код веб-страницы. В глазах человека размеченная и неразмеченная страницы выглядят абсолютно одинаково, но для поисковой системы разница очень велика.
Чтобы понять, как работает микроразметка, рассмотрим простую фразу: «У Петра есть сын Иван». Несмотря на простоту человек может сделать из неё множество выводов: Пётр — отец (а также родитель) Ивана, отчество Ивана — Петрович, Пётр и Иван — мужчины и родственники, Пётр старше Ивана. Все эти факты очевидны, поскольку нам их подсказывает жизненный опыт. У машины такого опыта нет, поэтому она может воспринимать фразу только в её текущей формулировке
Это — та же самая фраза, но с микроразметкой. Теперь компьютер понимает, что Иван и Пётр — это имена людей, между которыми существует родственная связь (Иван — ребёнок, Пётр — родитель), и ему не составит труда отвечать на вопросы вида «Кто родитель Ивана?». Кроме того, если добавить в разметку уникальные идентификаторы (например, ссылки на страницы в соцсетях), машина сможет отличать конкретных Ивана и Петра от их тёзок.
Микроразметка используется не только в случаях, когда речь идёт о людях. Аналогичным образом можно разметить и музыку, и видеозаписи, и события, и товары, и многое другое.
Единого стандарта микроразметки пока нет. Существуют разные синтаксисы и разные словари. Например, социальные сети собирают данные о сайтах с помощью словаря Open Graph, разработанного в Facebook, а поисковики, включая Яндекс, чаще ориентируются на словарь Schema.org. Подробнее о том, как устроены словари и синтаксисы, можно прочитать в техноблоге Яндекса на «Хабрахабре».
В том или ином виде микроразметку используют около 30% веб-страниц, известных Яндексу. Отсутствие микроразметки не влияет ни на способность страницы попадать в результаты поиска, ни на её позицию в результатах поисковой выдачи. Однако в ряде случаев разметка способна значительно упростить жизнь — как сайтам, так и пользователям.
Сделать наглядный сниппет
Одно из главных достоинств микроразметки состоит в том, что она даёт поисковику возможность строить красивые «сниппеты» — короткие описания сайтов. Например, вы играете на гитаре и ищете в Яндексе [аккорды группа крови]. Если вебмастер сайта, публикующего аккорды, добавил к себе на ресурс семантическую разметку, то вы сможете просмотреть текст песни с аккордами прямо на странице с результатами поиска.
Узнать подробности
Партнёры Яндекс.Видео используют семантическую разметку для того, чтобы сообщить сервису подробности о своих видеозаписях: например, кто играет в том или ином фильме, когда он был снят, каков его жанр и для какой аудитории он предназначен. С помощью этой информации сервис может точней отвечать на запросы пользователей, которые ищут, например [кино с Джеки Чаном], [мультики для самых маленьких] или [комедии шестидесятых].
Аналогичным способом пополняются базы и некоторых других сервисов Яндекса – например, Справочника.
0"}}»>Построить Веб 3.0В 2001 году Тим Бернерс-Ли, автор концепции Всемирной паутины, предложил идею «семантического веба». Это своего рода надстройка над «обычным» вебом, цель которой — с помощью семантической разметки объяснить машинам, о чём идёт речь на любой странице в интернете. Обладая таким знанием, машины смогут решать куда более сложные задачи, чем сейчас, и лучше понимать людей. Правда, удастся ли воплотить эту идею в жизнь, пока никто не знает.
Вопросы о семантической разметке — Вебмастер. Справка
- Будет ли мой сайт ранжироваться лучше, если я использую разметку?
- Я прочитал про стандарт Schema.org. Как настроить его на своем сайте?
- Schema.org описывает много разных типов данных, все ли они поддерживаются Яндексом?
- Я настроил у себя на сайте Schema.org. Как убедиться, что все заработало?
- Почему сниппеты не показываются, хотя моя разметка успешно распознается вашим валидатором?
- Я использовал микроформат hProduct, но не вижу товарные сниппеты в поиске, почему?
- Что лучше использовать — микроформаты или Schema.
org? Как робот будет обрабатывать сайт, если я использую и то, и другое?
Разметка может сделать ваш сайт более заметным в Поиске Яндекса и таким образом привлечь больше посетителей, принадлежащих целевой аудитории. Однако, напрямую семантическая разметка не влияет на ранжирование.
Ознакомьтесь с разделами нашей помощи и воспользуйтесь инструментами для работы с разметкой. Если стандартные способы внедрения вам не подходят (например, из-за сложной верстки), поищите ответы в блоге Яндекса для вебмастеров. Скорее всего, вам понадобится помощь программиста.
Нет, на данный момент мы поддерживаем не все типы данных Schema.org. Полный список обрабатываемых типов приведен в разделе Какие данные можно передать.
Сначала убедитесь, что размеченные данные правильно и без ошибок распознаются нашим валидатором. Если разметка верна и размеченные данные используются сервисами Яндекса, то через некоторое время (обычно — две недели) эти данные появятся на соответствующих страницах.
Если разметка верна, но данные не проходят ручную модерацию, вы получите сообщение от модератора в интерфейсе Я.Вебмастера. Модератор расскажет, почему предоставленные данные не могут быть использованы, и предложит внести коррективы.
Убедитесь, что Яндекс может использовать ваши данные в сниппетах. Все сниппеты, которые могут составляться из ваших данных, описаны в разделе Какие данные можно передать.
Прежде, чем появиться в сниппетах, данные должны быть:
Если все требования Яндекса выполнены, то модератор одобряет использование данных с вашего сайта. Через некоторые время (около двух недель) сниппеты с вашими данными появятся в Поиске.
К сожалению, сейчас формат hProduct используется только для разметки отзывов и статей об автомобилях. Чтобы Яндекс распознавал описания всех товаров на вашем сайте, подключите сайт к партнерской программе для магазинов (для этого нужно составить специальный YML-файл и отправить заявку с помощью Вебмастера).
Наши алгоритмы не отдают предпочтение какому-либо одному типу разметки. Это означает, что вы можете использовать тот формат, который вам кажется более удобным. Тем не менее, мы рекомендуем использовать Schema.org как более современный, полный и активно развивающийся стандарт.
Чтобы ваш вопрос быстрее попал к нужному специалисту, уточните тему:
Разметка формируется в течение двух недель. Если Яндекс не поддерживает какой-то из видов разметки на странице или в разметке ошибки, то просто пропускает ее.
Робот Яндекса сможет проиндексировать информацию с сайта и без разметки, на показ страниц в поиске это не повлияет. Чтобы задать желаемое описание страницы в результатах поиска, используйте метатег description.
Подробное описание возможных ошибок см. в разделе Валидатор микроразметки.
Не удалось исправить ошибку
Данная форма обратной связи предназначена для вопросов о партнерских программах Яндекса и разметке. Если вы сомневаетесь, стоит ли использовать ту или иную партнерскую программу, которую предоставляют другие сервисы (не Яндекс), то мы никак не можем прокомментировать ее возможное влияние на состояние вашего сайта в поиске.
Архивы Яндекса — DATAVERSITY
Реклама
А.Р. Угадай
Анджела Гесс В новом пресс-релизе сообщается: «Усиление градиента — это форма машинного обучения, которая анализирует широкий спектр входных данных. Он работает путем постепенного обучения более сложных моделей, чтобы максимизировать точность прогнозов. CatBoost был разработан для поддержки широкого спектра форматов данных. Он особенно эффективен для […]
Дженнифер Зайно
Дженнифер Зайно Яндекс выходит за рамки веб-поиска и работает на предприятиях. На этой неделе компания объявила о создании нового предприятия, фабрики данных Яндекса, которая будет применять свои продукты и алгоритмы машинного обучения, на которых основано более 70% ее собственных продуктов и приложений, для решения проблем больших данных в бизнесе.
Дженнифер Зайно
Дженнифер Зайно Хотели бы вы принять участие в проекте schema.org? Мы более чем приветствуем ваш вклад в совместную работу Bing, Google, Yahoo и Yandex по созданию общего словаря разметки для веб-страниц. Как отметил Дэн Брикли, защитник разработчиков в Google, во время своей презентации о прогрессе schema.org до […]
А.Р. Угадай
Марк Альбертсон из Examiner недавно написал: «Конечно, это было необычное зрелище. На сцене конференц-центра вместе стояли компьютерные инженеры из четырех крупнейших поисковых провайдеров в мире (Google, Yahoo, Microsoft Bing и Яндекс)».
Дженнифер Зайно
Дженнифер Зайно Последние несколько месяцев были свидетелями украинского кризиса, антиправительственных демонстраций, последовавших за укреплением связей бывшего президента Виктора Януковича с Кремлем, его бегством из страны после восстания против него и аннексией Крыма Россией. . Продолжается напряженность между Украиной, которая планирует новые президентские выборы […]
Дженнифер Зайно
Дженнифер Зайно Связанные данные: структурированные данные в Интернете теперь доступны в мягкой обложке. Книга, написанная Дэвидом Вудом, Маршей Зайдман, Люком Рутом и Майклом Хаузенбласом, а также Тимом Бернерсом-Ли, направлена на то, чтобы дать основным разработчикам, не имевшим предыдущего опыта работы со связанными данными, практические методы их интеграции в реальный мир [… ]
Дженнифер Зайно
Дженнифер Зайно Интересуетесь, как изменился сайт schema.org за последние пару лет с момента его рождения? Если вы были на конференции The International Semantic Web Conference в Сиднее пару недель назад, вы, возможно, застали сотрудника Google Раманатана В. Гуха — автора schema.org — с программным докладом о […]
Дженнифер ЗайноПоисковая система Яндекс заявила сегодня, что она повышает точность таргетинга на рекламную аудиторию и что существует потенциал для увеличения рейтинга кликов по баннерной рекламе на сотни процентов. Чтобы добиться этого, производитель поисковой системы усовершенствовал свою технологию поведенческой аналитики Crypta, основанную на методе машинного обучения MatrixNet и чей самый ранний […]
Дженнифер Зайно
Яндекс, ведущий российский поисковый интернет-сервис, лишился сооснователя и технического директора Ильи Сегаловича. Как сообщает компания, у Сегаловича была диагностирована излечимая форма рака, и он хорошо реагировал на лечение, прежде чем неожиданно скончался от осложнений. DBpedia уже отчиталась об этой новости, как и Freebase. Портфель Яндекса […]
Дженнифер Зайно
Электронная почта становится умнее. Gmail может использовать JSON-LD и schema.org для разметки информации в электронных письмах для поддержки взаимодействия с получателями: действие RSVP для событий, действие проверки для ресторанов, фильмов, продуктов и услуг; действие в один клик для всего, что можно выполнить одним щелчком мыши; действие перехода для более сложных взаимодействий […]
3 инструмента для создания и проверки разметки схемы
20 октября 2022 г.

Поисковые системы давно хотели единого метода для понимания веб-сайтов. Необходимость в этом возникает потому, что поисковые роботы не всегда могут распознать смысл сайта, просканировав его код. Это магазин или блог? Сайт рецептов или садоводство?
Это назначение структурированных данных. Это концепция 1990-х годов по организации информации сайта, чтобы помочь поисковым системам понять ее. Но рост Интернета породил множество типов структурированных данных, а не единообразие, желаемое поисковыми системами.
Введите Schema.org. Это тип структурированных данных — «словарь», основанный на коде JSON-LD, — основанный в 2011 году и одобренный основными поисковыми системами: Google, Yahoo, Microsoft и Яндекс. Он управляется и организуется некоммерческим совместным сообществом, состоящим в основном из разработчиков и инженеров. Примерно к 2022 году структурированные данные от Schema.org станут отраслевым стандартом де-факто.
Следовательно, термин «схема» теперь является синонимом «Schema. org».
Beyond Rich Snippets
Google требует разметки схемы, чтобы претендовать на расширенные фрагменты в результатах обычного поиска. Но преимущества выходят за рамки фрагментов. Хотя он поддерживает только ограниченное количество типов схем, правила поиска Google поощряют владельцев веб-сайтов широко использовать эти разметки, например, для идентификации статей, навигационных цепочек, авторов, связанных социальных сайтов, «сущностей» и т. д.
Основы реализации схемы включают:
- Убедитесь, что вся информация в разметке схемы видна людям. Например, не включайте часто задаваемые вопросы только в формате схемы. Включите этот раздел в видимый HTML, чтобы люди могли его видеть.
- Сохраняйте фокус и конкретику. Избегайте использования только общесайтовых или избыточных типов схемы. Сосредоточьтесь на каждой странице, где это возможно. И главное, убедитесь, что поисковые системы могут его понять. Вот где в игру вступают валидаторы схемы.
Schema Builders, Validators
1. Schema Builder — это бесплатное расширение Chrome для создания разметки схемы. Хотя существует множество генераторов схем, Schema Builder упрощает копирование существующей разметки с любого сайта , а не только вашего собственного.
Например, вы можете скопировать со страницы конкурента схему, создающую расширенный фрагмент. Просто откройте эту страницу в Chrome и активируйте расширение. Затем отредактируйте, скопируйте и добавьте схему на свою страницу.
Опять же, разметка автоматически видна поисковым ботам. Убедитесь, что люди тоже могут прочитать информацию.
Schema Builder позволяет легко копировать существующую разметку с любого сайта, а не только с вашего собственного.
—
2. Валидатор Schema.org упорядоченно загружает схему страницы в правую панель. Пользователи могут выделить любое свойство или проект, чтобы инструмент отобразил код, стоящий за ним.
Инструмент также выделяет ошибки схемы красным цветом и перечисляет рекомендуемые (но не обязательные) свойства для добавления.
Валидатор Schema.org загружает схему страницы на правой боковой панели и выделяет ошибки красным цветом с рекомендуемыми свойствами для добавления. Щелкните изображение, чтобы увеличить его.
3. Помощник по структурированным данным Ryte мгновенно проверяет разметку схемы на любой странице. Расширение Ryte для Chrome работает быстрее, чем его веб-версия, поскольку нет необходимости копировать и вставлять URL-адрес.
Помощник по структурированным данным Ryte мгновенно проверяет разметку схемы на любой странице.
Другие опции
Инструментов для реализации схемы становится все больше, особенно для таких популярных платформ, как WordPress, Shopify, Wix и многих других.
- WordPress и WooCommerce. Список обзорных плагинов Colorbib, поддерживающих схему, полезен. Список включает в себя плагины для обзора продуктов, книг, рецептов и многого другого.