Что такое семантическое ядро?
Содержание
- 1 Семантическое ядро — что это?
- 2 Ключевые слова
- 3 Семантический анализатор Адвего
- 4 Зачем же нужно семантическое ядро?
- 5 Как же правильно собрать семантическое ядро для сайта?
- 6 Чистка семантического ядра.
- 7 Кластеризация
- 7.1 Типы поисковых запросов
- 8 Вывод
Семантическое ядро — что это?
Семантическое ядро — это все ключевые фразы, по которым пользователь сможет найти интересующую его информацию в статье или на целом сайте, разбитые на смысловые группы.
А теперь подробнее!
Все мы вбиваем в поисковые строки Яндекса или Гугла какие-либо фразы, в зависимости от того, что нас интересует. Например: “как пересадить шиповник осенью”. И поисковая система выдает нам соответствующие (на взгляд разработчиков поисковых алгоритмов) сайты и страницы, где мы можем найти информацию о пересадке шиповника. Фразы, которые вводит пользователь:“как пересадить шиповник осенью” — называют поисковыми запросами, а аналогичные фразы на странице сайта: “Пересадить шиповник осенью очень просто!” – ключевыми фразами.
Если упростить, поисковик сопоставляет ваш поисковый запрос и ключевыми фразами из текста страницы. Если страница удовлетворяет требованиям алгоритма, и система “понимает”, что текст соответствует потребности пользователя, мы видим этот сайт в поисковой выдаче на первых позициях.
Все ключевые слова, благодаря которым пользователь находит то, что ему нужно на сайте составляют семантическое ядро сайта.
Ключевые слова
Ключевые слова, которые отражают основной смысл текста – семантическое ядро статьи.
Кроме того, в семантическом ядре все фразы разбиты на группы, которые более четко отражают смысл конкретного раздела.
Приведем пример, проанализируем статью о семантике на сайте ядерщик.рф http://ядерщик.рф/semantika/chto-takoe-semantika.html
В этой статье дается ответ на вопрос, что такое семантика сайта. В заголовках и подзаголовках мы тоже встречаем слово “семантика”, кроме этого встречаются слова из области СЕО: продвижение, реклама, интернет, SEO, Яндекс, Гугл, пользователь, поисковая строка, поиск, тексты, рекламные объявления, рекламная компания, товар, услуга, тексты, поисковая система, проработка семантики, сбор поисковых фраз, тематика, группы и т.
д. Из этого можно сделать вывод, что в статье говорится о поисковой семантике.Семантический анализатор Адвего
Посмотрим, что нам покажет автоматический сервис для определения семантического ядра
Адвего.
Для этого скопируем текст статьи и поместим в его в поле сервиса.
Получаем результат.
Здесь мы видим, на сколько часто встречается то или иное слово в тексте. Те фразы которые встречаются чаще и составляют основу семантического ядра статьи.
С сайтом все обстоит примерно так же, только веб ресурс состоит из множества таких страниц, поэтому семантическое ядро сайта составят все ключевые слова встречающиеся на его страницах.
Можно сказать, что семантическое ядро сайта состоит из семантических ядер отдельных страниц.
Зачем же нужно семантическое ядро?
Почему ему уделяется такое большое внимание?
Все дело в алгоритмах поисковых систем, и желании обладателя сайта как можно раньше донести свою информацию до пользователя и заработать денег, например: оказать услугу, продать товар, создать сообщество.
Если проанализировать страницы, которые находятся в ТОП 10 поисковой выдачи, выяснить на сколько актуальна и полна информация, оценить их параметры: объем, семантическое ядро, количество входящих и исходящих ссылок, количество сайтов-конкурентов. То свои тексты можно написать в соответствии с этими параметрами, и это поможет быстрее оказаться на первых позициях.
Рекламные кампании также можно сделать более эффективными с помощью семантического ядра. Составив рекламные объявления в соответствии с запросами пользователя, вы сделаете рекламную кампанию дешевле и эффективнее, она не будет показываться по запросам пользователей, которых не интересует ваш товар или услуга, а будет видна именно тем, кто заинтересован в вашей информации.
Как же правильно собрать семантическое ядро для сайта?
Собрать семантическое ядро для сайта можно автоматически, с помощью различных сервисов, вручную, или комбинируя, ручной или автоматический способы.
Но какой бы способ вы не выбрали, нужно знать, что разработка семантического ядра сайта состоит из четырех крупных этапов.
- Подбор “затравок”
- Сбор статистики (Яндекс, Гугл, Базы слов)
- Удаление (не по теме, нолей, дублей)
- Кластеризация
Затравки
Затем предстоит сбор cемантики:
- подсказок Яндекс,
- фраз Яндекс word stat,
- фраз Google Adwords,
- Фраз из баз слов например таких как Букварикс.
Для сбора (парсинга) удобно с помощью сервиса, например, Rush Analytics, и программы Key Collector. Сервисы для сбора поисковой семантики позволяют собрать максимум слов за короткое время.
Затем произвести чистку ядра и кластеризацию, воспользовавшись одним из сервисов, либо самостоятельно, с помощью Key Collector.
Чистка семантического ядра.
Сперва удаляем фразы, у которых частотность равна 0, и то, что не относится к вашей тематике. Например, по слову “докторская”, сервис соберет и “докторская диссертация”, и “докторская колбаса”, и “докторская степень”, если ваша тема – все о диссертациях, то отбросьте “колбасу”!
Теперь удаляем дубли, это слова, которые поисковая система воспринимает как одно и тоже, часто это бывают фразы с переставленными местами словами: “что такое семантическое ядро” и “cемантическое ядро что такое”.
Теперь, когда мы освободились от мусора. Приступим к кластеризации.
Кластеризация очень пригодится нам, при разработке структуры сайта и последующих статей. Мы разобьем наши запросы на группы таким образом, чтобы сформировать логичные разделы и даже наметить план каждой статьи.
Кластеризация
По какому принципу разбивать? С чего начать кластеризацию?
Для этого нам понадобятся первоначальные знания типов поисковых запросов.
Типы поисковых запросов
- Коммерческие и не коммерческие
- Информационные
- Геозависимые
- Геонезависимые
- Транзакционные
- Навигационные
- Общие
Общие запросы — это те, которые не несут в себе конкретной идеи.
. Дерево
. Мотоцикл
. Аптека
Навигационные запросы – указывают конкретный адрес сайта, например
. ядерщик.рф семантические ядра
. Группа Ария официальный сайт
Транзакционные — указывают на то, что пользователь собирается совершить действие:
. macbook купить
. keycollector скачать
. заказать семантическое ядро
Геозависимые и геонезависимые – те запросы, выдача по которым меняется в зависимости от вашего местоположения, например если вы во Владимире и введете в поисковик “заказать пиццу” – то вам будут показаны пиццерии Владимира, а если в Москве, то московские.
То есть “заказать пиццу” – это геозависимый запрос, хотя прямого указания в запросе на это нет. Геонезависимые – все запросы, выдача по которым не меняется в зависимости от выбора региона.Коммерческие запросы – если пользователь собирается что-то преобрести, иногда в запросах фигурируют слова “купить” или “заказать”, а иногда нет. Отличить такие запросы поможет поисковая выдача, если в ТОП 10 преобладают сайты предлагающие товары или услуги, то поисковая система считает запрос коммерческим, если присутствуют в большинстве информационные сайты с большим количеством статей, то запрос отнесен системой к информационным.
При кластеризации семантического ядра запросы нужно разделить сначала на коммерческие и информационные для того, чтобы оба вида запросов не попали на одну страницу. Это будет мешать появлению вашего материала на первых позициях поисковой выдачи.
Затем разделить геозависимые и геонезависимые – с этой задачей превосходно справляются автоматические сервисы, такие как Semparser.
Либо вы сами можете посмотреть к какому типу относится запрос, напечатав его в поисковой строке и проверив выдачу.
Теперь стоит разделить собранные ключевые фразы на смысловые группы. Это можно сделать с помощью функции Key Collector “анализ групп” – при этом программа собирает похожие фразы, а вам остается их разбить по смыслу. Если ключевых фраз получилось много, придется повторить процедуру несколько раз, пока структура семантического ядра не станет понятной.
Таким образом получается семантическое ядро с древовидной структурой, в которой есть крупные кластеры слов, содержащие в себе более мелкие группы, отвечающие на более конкретные запросы пользователя.
С помощью кластеризованного семантического ядра уже можно проработать структуру сайта, увидеть сколько на нем будет разделов, подразделов, сколько примерно понадобится страниц, чтобы более полно охватить тему и ответить на возможные вопросы посетителей.
Вывод
- Семантическое ядро сайта – структурированный набор ключевых фраз, отвечающих тематике сайта.
- Собирать семантическое ядро нужно для того, чтобы разработать четкую структуру сайта, для привлечения максимального количества посетителей на сайт, чтобы он был полезным и удобным.
Семантическое ядро и структура | Apromo
Содержание:1. Что такое семантическое ядро (СЯ) и зачем оно нужно для продвижения сайта
2. Зачем собирать семантическое ядро
3. Способы и инструменты для быстрого сбора и обработки СЯ
3.1. Web-интерфейс Serpstat
3.2. KeyCollector + Serpstat API
3.3. Google Spreadsheet API Serpstat
4. Автоматизации сбора СЯ
5. Что такое кластеризация ключевых слов
5.1. Автоматическая кластеризация на основании семантической схожести фраз
5.2. Ручная кластеризация на основании логической релевантность фраз
5.3. Автоматическая кластеризация на основании ТОПа поисковых систем
6. Инструменты для кластеризации ключевых слов
1. Что такое семантическое ядро (СЯ) и зачем оно нужно для продвижения сайта
Семантическое ядро — это список ключевых слов, словоформ, по которым планируется продвижения сайта. Проще говоря это те запросы, по которым ваш сайт будет показываться потенциальным клиентам, но с учетом спроса структуры сайта и требований поисковых систем.
То есть ключевые слова подбираются не только по ощущениям владельца бизнеса, а на основании статистики поисковых систем и бизнес-целей. Ниже будет описан детальный процесс сбора СЯ.
2. Зачем собирать семантическое ядро
СЯ позволяет:
- Понять потенциал трафика, по статистике частотности ключевых слов. Понимая какая частотность можно примерно спрогнозировать процент перехода, по ключевым словам, что даст понимание сколько трафика можно получить при достижении ТОП.
- Сделать максимально полную и правильную структуру сайта или дополнить текущую, поскольку в процессе выявляются новые запросы (потребности).
- Правильно расставить приоритеты продвижения основываясь на данных по частотности и конкуренции в отдельных группах запросов.
- Сделать правильное ТЗ по текстам.
- Измерять динамику позиций
Таким образом, СЯ это важный шаг в продвижении сайта, поскольку от него зависит как правильный старт, так и в целом развитие и анализ динамики по проекту.
3. Способы и инструменты для быстрого сбора и обработки СЯ
Ниже будет описано несколько способов сбора СЯ, которые используем мы, хотя главное — это понять общую логику, но также важно увеличить скорость сбора и обработки поэтому ниже будут некоторые инсайты как можно ускорить процесс.
Для начала нужно определиться для какой поисковой системы и страны будет продвижение. Предположим, что задача продвижение интернет-магазина спортивного питания. Для начала нам нужно ознакомиться с ассортиментом, кол-вом категорий и т. д.
Допустим есть следующая структура:
- Главная
- Гейнеры
- Жиросжигатели
- Протеины
Для Главной страницы подходят общие запросы типа: интернет-магазин спортивного питания, купить спортивное питание и т. д. Определив по вводные данные для группы “Главная” нужно собрать максимальное число релевантных запросов с частотностью, по ключевым словам, для этого есть несколько способов сбора:
3.
1 Web-интерфейс SerpstatЗаходим в Serpstat.com выбираем Google.com.ua и ищем запросы
Экспортируем в эксель, ищем дальше интернет-магазин спортивного питания, экспортируем в эксель и т. д. Останется потом объединить и почистить собранную информацию в экселе.
3.2 KeyCollector + Serpstat API
Предыдущий способ неплохой, но занимает много времени на поиск нужных ключевых для вводных данных и объединения выгруженных таблиц. Поэтому сразу на этом этапе желательно использовать автоматизацию, например, KeyCollector.
Для этого также понадобится Serpstat API, заходим в настройки указываем доступ к API
Далее нажимаем на название группы и добавляем ключевые для парсинга
Вставляем нужные ключевые для парсинга
Получаем 105 запросов
Далее чистим запросы, у кейколлектора это делается достаточно быстро и уже описано в разных статьях какие они есть поэтому не буду останавливаться. Для тех, кто не в курсе просто покажу скрин как можно использовать фильтры и регулярные выражения в KC
3.
3 Google Spreadsheet API SerpstatДля тех, у кого нет такого инструмента как keycollector также есть решение от наших коллег и конкурентов Netpeak
https://docs.google.com/spreadsheets/d/1-uZkbL7PM43PjebxpmygXNO9CUb1acqV31_VMmoVr8I/edit#gid=1120839304
Тут можно получить ключи в Google Spreadsheet по API serpstat не обращаясь в интерфейс и не скачивая файлы по одному ключевому.
Чтобы использовать файл скопируйте себе на диск файл и укажите API key Serpstat и другие необходимые настройки и работать будет быстрее и удобнее чем в веб-интерфейсе.
Как вы уже наверняка заметили, везде нужен доступ к сервису Serpstat, почему в большинстве случаев не используем планировщик Adwords и Yandex Wordstat?
Потому, что:
- Релевантность запросов намного выше тем который задаются как исходные, а значит экономится время при чистке.
- Скорость получения данных в разы выше, опять же, экономия времени
- Нет заморочек с множеством аккаунтов и ограничений, ограничения только на кол-во строк API сервиса.
В целом эти методы позволяют достаточно быстро и качественно собрать СЯ, но так получается сбор по каждой группе запросов самостоятельно и достаточно долго, поэтому мы разработали для себя автоматизацию, которая позволяет собирать и сразу кластеризовать запросы на основании ТОПа.
4. Автоматизации сбора СЯ
Перед описанием технических моментов опишу алгоритм и логику, а техническую реализацию такого метода сделать можно разными способами, у нас это шаблон zennoposter у вас может быть веб-скрипт или Google Spreadsheet.
Итак, логика процесса:
Как быстро получить ключевые слова по конкурентной группе запросов с помощью одного ключевого? Самый простой способ найти конкурента, который хорошо ранжируется, и его страница очень похожа на вашу и получить данные из Serpstat.
Чтобы найти такого конкурента идем в поиск нужного нам поисковика и ищем по нужному запросу, например, “купить спортивное питание”. Получаем такую выдачу:
Далее получаем все запросы, по которым ранжируется ТОП-1 конкурент, но не все ключи, а только ТОП 1-5, так как по этим ключевым страница наиболее релевантная
Таким образом мы получили все самые релевантные запросы одного конкурента. У такого метода есть недостаток так как попадает много брендовых запросов и т.д. Но их можно фильтровать уже после сбора. Но если мы возьмем одного конкурента, то не получим полных данных, так как один сайт в ТОПе по одним запросам, другой по другим и т. д. то есть нужно выгрузить ключи ТОП 1-5 для всех урлов из ТОП-10, тогда мы получим полную семантику лучших, по мнению поисковика сайтов. Убираем брендовые запросы и дубли по группе и вуаля, СЯ с кластеризацией запросов по ТОПу
И сразу же есть все страницы конкурентов, которые мы можем дальше использовать для анализа контента и ссылок.
Аналогично делаем для других групп. То есть на входе нам нужно собрать по одному ключевому слову для каждой группы, например:
- Интернет-магазин спортивного питания
- Купить протеины
- Купить креатин
А на выходе мы получаем СЯ, которое остается загрузить в KeyCollector, очистить от брендовых запросов и дублей и все.
Идею и алгоритм я описал, а техническая реализация за вами. Скажу лишь, что в зеннопостере реализовать такую автоматизацию с отправкой данных в Google Spreadsheet не составит большого труда даже без опыта программирования.
5. Что такое кластеризация ключевых слов
Кластеризация — это распределение ключевых слов по кластерам (группам) на основании семантического или логического сходства ключевых слов в кластере. Кластеризация бывает нескольких видов:
5.1. Автоматическая кластеризация на основании семантической схожести фраз
Например, есть ключевые:
- Спортивное питание
- Купить спортивное питание Киев
Общая часть этих запросов “спортивное питание” и объединяются они именно по семантической схожести. Этот метод позволяет ускорить процесс группировки, но у него много неточностей и потом тратится время на их исправление, а также запросы типа “интернет-магазин спортивного питания” уже не попадут в группу, хотя логично, что “интернет-магазин спортивного питания” и “купить спортивное питание” желательно продвигать на главную страницу, то есть в одном кластере.
5.2. Ручная кластеризация на основании логической релевантность фраз
Например:
- Интернет-магазин спортивного питания
- Купить спортивное питание
Логически эти запросы соответствуют одной группе, поскольку продвижение главной страницы интернет-магазина спортпита целесообразно как по запросам, содержащим интернет-магазин, так и по общим коммерческим. Такой метод предполагает большие затраты времени, а также хорошего понимания ниши иначе возможны ошибки.
5.3. Автоматическая кластеризация на основании ТОПа поисковых систем
Автоматическая кластеризация подразумевает использование специальных сервисов, у которых есть статистика по ТОПу поисковых систем, какие запросы преимущественно используются у конкурентов, находящихся в ТОПе в рамках одной группы. Чтобы было более понятно приведу пример, например, есть запросы “закрытые женские купальники” и “сдельные женские купальники”, если делать кластеризацию по семантической схожести, то это будут разные группы, а если на основании ТОПа, то видим, что Google отлично понимает, что это одна группа запросов, то есть не нужно делать несколько групп.
Этот метод самый быстрый и прогрессивный на данный момент, единственный минус, что ТОП меняется и семантика, собранная несколько месяцем назад может отличаться от новой в ТОПе, но по сравнению с предыдущими он намного лучше. Теперь давайте разберемся какими способами можем сделать кластеризацию на основании ТОПа и что для этого нужно.
6. Инструменты для кластеризации ключевых слов
Для всех сервисов нужен список ключевых слов для дальнейшей их кластеризации. Как быстро собрать мы уже понимаем, поэтому перейдем сразу к инструментам. Как вы, наверное, уже догадались будем использовать Serpstat. Берем список ключевых заходим в раздел кластеризация, создаем проект добавляем ключи.
Далее указываем регион:
Указываем силу связи по фразе и по ТОПу, то есть семантическое совпадение:
- Weak — слабая связь между фразами.
- Strong — сильная связь между фразами.
Совпадение по урлам:
- Soft — запросы объединяются в группу, если есть общий набор URL хотя бы для одной пары.
- Hard — запросы объединяются в группу, только если есть общий для всех набор URL.
В результате получаем сгруппированное СЯ, которое легко выгрузить, очистить лишнее и заняться каким-то более интересным делом чем группировка запросов.
Также, есть возможность кластеризации в программе KeyCollector, но там группы нужно создавать вручную, что не очень прикольно, но работает. Для этого нужно зайти в раздел Данные/Анализ групп и настроить правила группировки:
Основные моменты, которые используются для качественного и быстрого сбора СЯ описаны, надеюсь, что информация поможет в продвижении вашего проекта. Если самостоятельно делать СЯ нет времени, желания или опыта, обращайтесь у нас есть время, желание и опыт.
Semantic Scholar Academic Graph API
Semantic Scholar Academic Graph — это способ представления мировых научных публикаций.
Научные статьи и их авторы связаны цитированием одной статьи другой. Наш новый сервис позволяет найти и изучить эти отношения.
Вы можете использовать конечную точку API до 100 запросов в 5 минут для проверки идеи вашего приложения. Чтобы получить доступ к более высокому лимиту скорости, заполните форму, чтобы запросить аутентификацию для вашего проекта. Аутентифицированные партнеры имеют доступ к более высоким лимитам ставок, персонализированной поддержке и возможностям совместного маркетинга.
Конечная точка /paper/search будет выполнять поиск статей по ключевым словам с использованием нашего специализированного ранжировщика.
http://api.semanticscholar.org/graph/v1/paper/search?query=literature+graph
Будет возвращено 10 наиболее подходящих статей с их названиями. Мы можем запросить дополнительные результаты и дополнительную информацию по телефону:
http://api.semanticscholar.org/graph/v1/paper/search?query=literature+graph&offset=10&limit=50&fields=title,authors
Который вернет следующие 50 совпадающих статей с названиями и авторами.
Вы можете найти сводку наборов данных, которые мы делаем доступными для массовой загрузки: скачать образцы файлов. Чтобы загрузить полные файлы набора данных, заполните форму для запроса ключа API. Массовая загрузка наборов данных доступна только для аутентифицированных пользователей.
Доступные наборы данных включают:
Метаданные S2AG:
- Атрибуты статьи (название, авторы и т. д.)
- Атрибуты автора (имя, количество статей, h-индекс и т. д.) Цитирование (цитирование/идентификаторы цитируемых статей, контекст, цель)
Содержание статьи:
- Тезисы
- S2ORC – полные тексты PDF-файлов с открытым доступом
Модели:
- SciTLDR)
Документация полных наборов данных
Мы можем получить подробную и точную информацию об отдельной бумаге с конечной точкой /paper.
https://api.semanticscholar.org/graph/v1/paper/649def34f8be52c8b66281af98ae884c09aef38b?fields=title,embedding
Вернет название статьи и ее вложение SPECTER.
https://api.semanticscholar.org/graph/v1/paper/649def34f8be52c8b66281af98ae884c09aef38b?fields=title,citations.authors
Возвращает имена всех авторов, которые цитировали эту статью graph/v1/paper/0796f6cd7f0403a854d67d525e9b32af3b277331
/arxiv:1705.10311
Идентификатор ACL https://api.semanticscholar.org/graph/v1/paper/ACL:W12-3903
Идентификатор PubMed https://api.semanticscholar.org/graph/v1/paper/PMID:19872477
Идентификатор корпуса https://api.semanticscholar.org/graph/v1/paper/CorpusID:37220927
Примечание: Конечная точка graph/v1/paper заменяет существующую конечную точку /v1/paper, которая остается в
Full Paper Documentation
Мы можем получить подробную и точную информацию об отдельной статье с помощью конечной точки /author.
https://api.semanticscholar.org/graph/v1/author/145612610?fields=papers.authors
Вернемся авторам всех статей, написанных этим автором.
Примечание: Конечная точка graph/v1/author заменяет существующую конечную точку /v1/author, которая остается в эксплуатации, но будет объявлена устаревшей в 2022 году. призывы найти, например, все документы, цитируемые автором. Но новая служба может вернуть эту информацию за один вызов, используя:
https://api.semanticscholar.org/graph/v1/author/145612610/papers?fields=references
, который будет разбивать на страницы статьи автора, возвращая список ссылок для каждой из них. Приведенная выше ссылка покажет заголовок каждой ссылки, а:
https://api.semanticscholar.org/graph/v1/author/145612610/papers?fields=references.title,references.authors
даст название и список авторов каждой ссылки. Аналогично,
https://api.semanticscholar. org/graph/v1/paper/dac91333674c45b4ab5f3b27c6d2aa6fae8ac229/authors?fields=name,papers.title
Пролистывает авторов статьи, возвращая список опубликованных статей каждого автора
3 Вы также можете разбивать на страницы цитаты и ссылки статьи, возвращая подробную информацию о цитируемых/цитируемых статьях.
https://api.semanticscholar.org/graph/v1/paper/cb13b1b6a37e4080d8c13c5f33694b5aae90abcf/citations?fields=title,authors
https://api.semanticscholar.org/graph/v1/paper/cb13b1b6a37e4080d8c13c5f33694b5aae90abcf/references?fields=title,authors ) бумага с данным идентификатором.
Full Literature Graph Documentation
Мы предлагаем услугу, помогающую председателям конференций сопоставлять материалы для конференций с потенциальными рецензентами.
Полная документация экспертной оценки
https://api.semanticscholar.org/[Paper Identifier]
Вы можете легко ссылаться на страницы Semantic Scholar, не вызывая API. Просто создайте ссылку с имеющимся у вас идентификатором, и мы перенаправим браузер пользователя на соответствующую страницу.
Доступные идентификаторы бумаги и примеры
S2 Идентификатор бумаги https://api.semanticscholar.org/0796f6cd7f0403a854d67d525e9b32af3b277331
525E9B32AF3B277331
9B32AF3B277331
925E9B32AF3B277331
9.GISISMALS3.0009
Идентификатор ArXiv https://api.semanticscholar.org/arXiv:1705.10311
Идентификатор ACL https://api.semanticscholar.org/ACL:W12-3903
Идентификатор PubMed https://api.semanticsch .org/PMID:19872477
Идентификатор корпуса https://api.semanticscholar.org/CorpusID:37220927
Что такое семантическое SEO и почему это важно?
Чуть более десяти лет назад вы могли зайти на Google.com и ввести «масса земли в тоннах» (да, включая опечатку) и получить такой результат:
«Земная масса в тонах» 2007 г. — источникВерно: результат №1 — это веб-сайт с рингтонами (кто их помнит?), потому что Google заметил слово «тоны» в вашем запросе (и в этом результате, вероятно, «тон» взорвал все над его содержанием и обратными ссылками).
Но вы действительно хотели ввести «тонны».
То же, что и «масса земли в тоннах». Жаль, , что у Google тогда не было возможности понять значение ваших слов.
Вот как сегодня выглядит запрос «масса земли в тоннах» (включая опечатку):
«Масса Земли в тоннах» (2021)Замечательно, правда?
Google не только объясняет опечатку, но и выдает ответ непосредственно в результатах поиска вместе с дополнительной информацией, связанной с массой Земли.
Как? Семантический поиск.
Сегодня поисковые системы, такие как Google, Yahoo, Bing и Яндекс, думают и учатся, как настоящие люди. Они могут обрабатывать естественный язык, понимать отношения между словами и давать ответ на ваш запрос, даже если ключевые слова, которые вы используете, не существуют нигде на странице.
И есть только один способ преуспеть в семантическом поиске: семантическое SEO.
В этой статье мы собираемся изучить основы семантического поиска, как Google и другие поисковые системы эволюционировали, чтобы понять смысл, и что вы можете сделать, чтобы оптимизировать свою стратегию SEO для семантической сети.
Перейти к:
- Что такое семантика?
- Что такое семантический поиск?
- Почему важен семантический поиск?
- История семантического поиска
- Примеры семантического поиска
- Что такое семантическое SEO?
- Почему важно семантическое SEO?
- Как оптимизировать семантическое SEO
- Завершение семантического SEO
Чтобы понять семантический SEO, вам нужно понять семантический поиск. Но чтобы понять семантический поиск, вам нужно сначала понять основы семантики.
Семантика относится к изучению значения языка — источникСемантика относится к изучению языка.
Более конкретно, изучение тонких оттенков значения в языке.
Семантика анализирует контекст, структуру предложения, иерархию слов и отношения между словами, чтобы определить предполагаемое значение слова, фразы, предложения или текста. Он исследует нюансы языка, чтобы прийти к вернейшему смыслу того, что говорится.
Я знаю — захватывающе, да?
Но семантика является краеугольным камнем семантического поиска и, соответственно, семантического SEO.
Что такое семантический поиск?Семантический поиск следует тем же принципам, что и семантика, только выполняется поисковыми системами, а не людьми.
Семантический поиск относится к способности поисковой системы анализировать и интерпретировать нюансы поискового запроса (от контекста до целей поиска и отношений между словами), чтобы они могли выдавать наиболее релевантные и точные возможные результаты поиска.
Почему важен семантический поиск?Семантический поиск стал эволюционным скачком для поисковых систем.
Почему?
Потому что слова и фразы, которые люди используют для поиска информации в Интернете, часто нетрадиционны и двусмысленны, а естественный язык очень сложен. Не говоря уже о том, что наиболее релевантные результаты поиска также должны отражать личные предпочтения.
До появления семантического поиска поисковые системы не могли интерпретировать растущую сложность поисковых запросов. Результаты пострадали. Обычно требовалось 3-4 поиска, чтобы найти то, что вы искали.
Больше нет.
Возьмем ключевое слово «как зовут плохого парня в Дюне?»
Google знает, что вы имеете в видуЭтот запрос ищет конкретный ответ (Владимир Харконнен), но, поскольку поисковик не знает имени злодея, они заменяют его имя на «плохой парень». Достаточно близко, верно?
Правильно.
До семантического поиска у алгоритмов не было возможности интерпретировать этот запрос. Вам потребовалось бы несколько поисков, чтобы найти правильный ответ, а может и больше.
Сегодня, благодаря технологии семантического поиска, Google не только знает, о ком вы говорите, когда говорите «плохой парень в Дюне», но и предоставляет ответ непосредственно в поиске.
Весьма примечательно, правда?
В отличие от традиционного поиска прошлого, семантический поиск способен предоставить ответы, которые вы намеревались найти, независимо от того, какие ключевые слова вы вводили в Google.
История семантического поискаЧтобы полностью понять, как поисковые системы эволюционировали от паутины строк (ключевых слов) к паутине вещей (связанных тем и понимания значения), полезно взглянуть на технологические разработки, которые привели к этому .
Точнее, обновления алгоритма Google.
Путь к семантической поисковой оптимизации, вымощенный обновлениями алгоритма — источник 2000-е (предсемантический поиск)Вплоть до 2011 года поисковые системы, такие как Google, в значительной степени полагались на ключевые слова для ранжирования страниц. Например, буквальные цепочки несвязанных слов, независимо от значения или намерения этих строк ключевых слов, объединенных в форму.
Например, если вы хотите ранжироваться по «размерам голени», вам нужно будет использовать «размер голени» в разных местах на странице, независимо от того, предоставили ли вы на самом деле подробный список размеров голени. Тем не менее, был хороший шанс, что вы также получите голень Neslté 9.0259 мороженое .
Это потому, что Google было трудно понять цель вашего поиска; они просто обрабатывали ключевые слова как свои собственные несвязанные строки символов. Для них «размеры барабанных палочек» не означали: «Я ищу таблицу, описывающую различные доступные размеры барабанных палочек, чтобы я мог выбрать наилучший размер для своих рук».
Это создало две проблемы:
- Ранжирование в результатах поиска было легко обмануть. Просто вставьте ключевое слово на страницу и вуаля: ранжирование на первой странице.
- Результаты поиска часто были нерелевантными. Поисковые системы не смогли определить контекст или намерение, поэтому, если вы набрали «Рио» (и думали о городе в Бразилии), они могут выдать результаты для «Рио» — казино или «Рио» — фильма. Видите проблему?
Задача: Google действительно нужно было понимать мир больше, чем люди, а не компьютеры.
Алгоритмы должны были знать, что поисковый запрос — это не просто набор случайных слов, а то, что эти слова говорят о реальных вещах с реальным значением и отличием от других вещей.
В 2012 году Google впервые начал собирать данные о «сущностях» (лицах, местах, вещах или объектах) из баз данных с открытым исходным кодом (например, Freebase.com, Wikipedia.com, CIA World Factbook), лицензированных баз данных, и специальное кодирование, называемое «структурированными данными» (например, Schema.org), а затем организация этих данных в их собственную структурированную базу данных, называемую Графиком знаний.
Знакомство со схемой знаний
Ключевое слово: структурированный .
Намерение Google состояло в том, чтобы создать организованную базу данных информации и фактов, которые являются проверенными и окончательными. Затем, используя машинное обучение (технология, которая учится самостоятельно на основе входных данных), он может использовать эту базу данных, чтобы узнать, как связаны разные концепции и сущности, и, как следствие, лучше понять смысл ваших запросов.
Им удалось.
Сегодня в базе данных Google Knowledge Graph собрано более 500 миллиардов фактов о 5 миллиардах объектов.
Для запросов, по которым они собрали окончательную информацию, они используют данные сети знаний, чтобы повлиять на результаты поиска. В частности, в форме панели знаний.
Панель знаний Google Обновление Hummingbird (2013 г.)Граф знаний сделал первый семантический шаг вперед.
Но с появлением мобильного поиска, диалогового поиска (голосовой поиск) и запросов на естественном языке, а, следовательно, и более сложных запросов, Google понадобился лучший способ понять цель поиска (то есть, что люди на самом деле имеют в виду, независимо от того, как они говорят) Это).
Таким образом, Google применил ту же технологию машинного обучения, которую они применяли к данным сети знаний, только к миллиардам страниц в Интернете, с выраженным намерением понять значение и контекст сложных запросов.
Они назвали это обновление основного алгоритма « Hummingbird » из-за его способности давать «более быстрые и точные» ответы.
Hummingbird Update c.2012 — источникДумайте о Hummingbird как о полной замене поисковой системы Google, созданной для семантического поиска: более умной, быстрой и более способной различать истинное значение слов.
В частности, Hummingbird ознаменовал монументальный сдвиг от ключевых слов и плотности ключевых слов (строки) к темам и целям поиска (вещам).
Дело не в том, что после «Колибри» ключевые слова не имели значения; дело в том, что неестественное размещение ключевых слов для ранжирования стало неактуальным. Теперь гораздо выгоднее писать как человек и давать лучший ответ на запрос.
RankBrain (2016)В 2016 году Google сделал семантический поиск еще на один шаг вперед.
В то время как Hummingbird был капитальным ремонтом основного алгоритма, на котором работает Google (как новый движок), RankBrain был усовершенствованием, которое сделало его лучше (как новая часть в движке).
Изначально RankBrain обрабатывал только 15% запросов. Сегодня все запросы проходят через RankBrain.
Как и Hummingbird, RankBrain использует машинное обучение и искусственный интеллект, чтобы лучше понимать семантику поискового запроса и предоставлять наиболее релевантные результаты. Это еще один шаг вперед к анализу тем, предмета и целей поиска, стоящих за запросом, а не просто буквальных строк слов и фраз.
RankBrain включает в себя такие вещи, как исторические данные поиска, данные о местоположении, свежесть контента и другие персонализированные данные, а не связанные с целевой страницей, чтобы понять намерение и предоставить сверхрелевантные результаты.
Обновление Google RankBrain — источникПомните наш пример с барабанной палочкой?
С помощью RankBrain Google теперь может легко выдавать потрясающие результаты при поиске по запросу «размеры барабанных палочек», даже если ни на одной странице нет этой точной фразы.
№1 в рейтинге по размеру голениНа этой странице нет ни одного экземпляра «размеров барабанных палочек». В этом нет необходимости.
Благодаря Hummingbird и RankBrain Google знает, что когда кто-то ищет «размеры барабанных палочек», он ищет информацию о том, как правильно выбрать голень, независимо от того, какие ключевые слова он вводит в поле поиска.
Эта страница лучше других удовлетворяет намерения пользователя, поэтому Google вознаграждает их — источник BERT (2019)Последнее достижение Google в области семантического поиска представлено в форме BERT (представления двунаправленного кодировщика от преобразователей). BERT — это обновление алгоритма, которое анализирует поисковые запросы, а не веб-страницы.
Из Google:
Взлом ваших запросов
Итак, это много технических подробностей, но что все это значит для вас? Что ж, применяя модели BERT как к ранжированию, так и к избранным фрагментам в Поиске, мы можем значительно улучшить работу , помогая вам находить полезную информацию. На самом деле, когда дело доходит до результатов ранжирования, BERT поможет Поиску лучше понимать один из 10 поисковых запросов в США на английском языке, и со временем мы перенесем это на большее количество языков и регионов.
В частности, для более длинных, разговорных запросов или запросов, в которых предлоги, такие как «для» и «к», имеют большое значение для значения, Поиск сможет понять контекст слов в вашем запросе. Вы можете искать так, как вам кажется естественным.
BERT основан на машинном обучении Hummingbird и RankBrain, на этот раз нацелен на 15% запросов, которые Google не может предвидеть, потому что они никогда раньше не искались.
BERT выводит обработку естественного языка на новый уровень: по своей сути BERT помогает Google лучше понять значение каждого слова в короткой или длинной фразе и то, как эти слова соотносятся друг с другом в предложении.
Та же смысловая песня и танец, только улучшенные.
Вот пример улучшенных результатов поиска после BERT:
BERT делает еще один гигантский скачок вперед в семантическом поиске — источник ИтогСемантический поиск не произошел за одну ночь.
За последнее десятилетие он развивался благодаря достижениям в области машинного обучения, обработки естественного языка и искусственного интеллекта.
Хотя путь был долгим и извилистым, что-то мне подсказывает, что мы еще не увидели последний эволюционный шаг в семантическом поиске.
Примеры семантического поискаВы заметили, что внешний вид SERP (страниц результатов поисковой системы) сильно изменился за последнее десятилетие?
Это потому, что семантический поиск подразумевает более 10 органических результатов. Фактически, способность Google понимать значение и цель запросов позволяет им предоставлять дополнительную информацию в поисковой выдаче множеством различных способов:
- Избранные фрагменты
- Карусели
- Блоки содержимого
- Связанные поиски
- Предложения по автозаполнению
- человек также спрашивают раздел
Итак, если семантический поиск относится к способности поисковой системы мыслить как люди и понимать истинное значение того, что кто-то ищет (независимо от того, как они спрашивают), то выдавать множество результатов на основе этого понимания, что делать? вы думаете семантическое SEO относится?
…
Семантическая поисковая оптимизация , в более широком смысле, относится к процессу создания вашего контента более человечным и понятным за счет сосредоточения внимания на темах и удовлетворения поискового запроса, а не зацикливания на ключевых словах и фразах.
Почему важно семантическое SEO?Семантическое SEO знаменует собой фундаментальный сдвиг в том, как специалисты по поисковой оптимизации выполняют свою работу.
Сегодня семантическое SEO — это оптимизация по темам, а не по ключевым словам. Или, как сказал бы Google, оптимизация объектов и связанных с ними атрибутов, а не ключевых слов.
Например, если вы хотите ранжироваться по запросу «Мона Лиза», чтобы Google точно знал, о чем ваша страница и насколько она релевантна запросу, они ожидают, что страница также будет содержать информацию о Да Винчи (кто его нарисовал), Лувр (где его можно увидеть), Париж (город, в котором он находится) и Ла Джоконда («Мона Лиза» по-французски).
Пример сущности и связанных с ней атрибутов — источникДавайте используем эту статью в качестве еще одного примера.
Объект, по которому я хочу ранжироваться, — это «семантическое SEO».
Чтобы Google с высокой степенью уверенности знал, что эта статья о семантическом SEO, недостаточно просто дать простое определение или снова и снова включать слова «семантическое SEO». Уже нет.
Вместо этого мне нужно просмотреть связанные атрибуты и подтемы, связанные с семантическим SEO, а затем включить эти атрибуты и подтемы в статью. Что в данном случае означало бы разговор о семантическом поиске, Hummingbird, BERT, RankBrain, намерении поиска и графе знаний.
Семантическое SEO (объект) и его атрибутыВидите разницу? Оптимизация по темам и их подтемам — это серьезный отход от оптимизации по ключевым словам.
До семантического SEO, традиционное SEO стремилось оптимизировать ключевые слова, а не значения — источник Как оптимизировать семантическое SEOСемантическое SEO не сложно.
Во многих отношениях семантический поиск вознаграждает только здравый смысл и качество.
Но вот семь обязательных пунктов для лучшего семантического SEO:
- Идентифицировать и удовлетворить намерение поиска
- Исследуйте темы, не ключевые слова
- Постройте свой сайт, как Wikipedia
- Не зацикливайтесь на рейтинге
- 1. Определите и удовлетворите поисковое намерение
Просто и понятно: ранжирование в верхней части результатов семантического поиска сводится к пониманию значения слов, которые люди используют для поиска. Не обязательно то, что они говорят или как они это говорят, но то, что они имеют в виду.
Забудьте, какие ключевые слова они буквально вводят; о чем на самом деле спрашивают эти ключевые слова? Какую информацию они намереваются найти на основе этого запроса? Какие вопросы они подразумевают, даже если прямо не сформулированы? Какой формат они ожидают: список, инструмент, длинная статья, что-то еще?
В семантическом поиске всем правит намерение. Удовлетворить его.
Как:
- Ключевые слова для SEO (+ четыре типа намерения)
- Как выбрать ключевые слова для SEO
Как мы упоминали ранее, ключевые слова больше не имеют значения. Они делают.
Дело в том, что сосредоточение внимания исключительно на фразе или строке ключевых слов не поможет вам занять более высокое место в семантическом поиске.
Помните сущности? Переходя от строк к вещам, Google ищет сущности и их атрибуты. Это означает подробные ответы, независимо от ключевых слов, используемых на странице.
Подумайте о ключевом слове шире: какова тема (сущность), которую пытается исследовать ваше ключевое слово, и какие другие семантически связанные подтемы (атрибуты) вы ожидаете найти в том же семействе? Тогда иди вглубь.
Используйте ключевые слова в качестве отправной точки. Но статьи должны включать семейство ключевых слов, а не одно:
- Исходные ключевые слова (короткие, широкие, с большим объемом поиска, конкурентные)
- Длинные ключевые слова (длинные, конкретные, с меньшим объемом поиска, менее конкурентные )
- Семантические ключевые слова (слова, которые вы ожидаете найти в связи с основной темой)
- Варианты ключевых слов и синонимы (например, «исходные ключевые слова», «начальные ключевые слова», «короткие ключевые слова» относятся к одному и тому же вещь; держите их на одной странице)
Это позволяет достичь двух целей. Во-первых, добавление глубины создает лучший пользовательский опыт для посетителей. Во-вторых, сосредоточение внимания на темах (а не на ключевых словах) заставляет вас исследовать больше атрибутов сущности, что упрощает для Google определение смысла вашей страницы.
Практическое руководство:
- Исследование ключевых слов: исходные слова, длинные хвосты, семантические ключевые слова
- SEO на странице: 7 простых шагов для лучшей оптимизации
Создайте свой сайт, как Википедия: узлы и спицы.
Ступицы и спицы? Ага. Одна основная тема (сущность), которая связана с десятками других подтем (атрибутов).
Подумайте об этом: Google использует структурированные данные Wikipedia.com в качестве основного источника для своей сети знаний. Это означает, что они настолько доверяют информации и архитектуре веб-сайта, что готовы использовать его в качестве окончательного и проверенного центра ресурсов, подключить его непосредственно к своей сети знаний, а затем использовать эту информацию, чтобы узнать, как разные темы (сущности) и подтемы ( атрибуты) связаны.
Это потому, что Википедия уже буквально построена вокруг сущностей и атрибутов и причудливо переплетена с внутренними ссылками (ссылками с одной страницы на другую в том же домене).
Если структура сайта Википедии достаточно хороша, чтобы помочь Google узнать значение тем и их связь с другими темами (и стимулировать семантический поиск), не думаете ли вы, что ваш сайт должен делать то же самое?
(кивая)
Конечно.
Каждая страница Википедии подобна отдельной сущности (теме), и каждая сущность имеет внутренние ссылки на сотни более важных атрибутов (подтем), которые, в свою очередь, функционируют как собственные сущности с атрибутами.
Создавая центры и спицы (как русская матрешка), Википедия может создать большую сеть значений для посетителей и поисковых систем, чтобы легко перемещаться и понимать.
Будь как Википедия. Устраните неоднозначность своего контента, сделав более глубокую ссылку на более релевантный контент.
Практическое руководство:
- Внутренние ссылки: 9 лучших практик для улучшения поисковой оптимизации (#5 Hubs & Spokes)
- Ключевые слова с длинным хвостом: что это такое и как их найти
Рейтинге ключевых слов. Мех.
Ключевые слова по-прежнему имеют значение (это — это SEO), как мы упоминали дважды.
Но имеет ли значение ранжирование ключевых слов в семантическом поиске?
Типа? Не так, как раньше, это точно.
Подумайте об этом: если Google может предоставить лучший ответ на поисковый запрос (ключевое слово AKA), даже если эти ключевые слова не появляются нигде на странице, они, по сути, переписывают поисковые запросы. И если они перепишут поисковые запросы, как вы все равно узнаете, какие ключевые слова отслеживать? Вы не будете.
Google существенно переписывает запросы. Напрашивается вопрос: насколько тогда релевантны ключевые слова?Продолжая наш предыдущий пример, если вы хотите отслеживать свой рейтинг по ключевому слову «Владимир Харконнен», но Google также показывает ваши результаты, когда люди вводят ключевое слово «как зовут плохого парня в Дюне?» (по сути, переписав этот запрос «Владимиру Харконнену»), вы никогда не узнаете.
Отслеживание рейтинга «Владимир Харконнен» вам ничего не скажет. Так что не зацикливайтесь на них больше.
Лучше сосредоточиться на трафике на уровне категории. Если вы фильтруете и группируете URL-адреса, посвященные разным частям одной и той же темы, вы увеличиваете общий трафик по этой теме из месяца в месяц?
Практическое руководство:
- SEO-отслеживание: как измерить свой успех
- 10 важных показателей SEO, которые вы должны измерять
Чем больше подробной информации вы можете предоставить Google о значении вашего контента, тем лучше ваши результаты в семантическом поиске.
Структурированные данные не являются прямым фактором ранжирования. Но использование языка поиска увеличивает ваши шансы на косвенное ранжирование.
Как? Разметка схемы.
Schema.org — это язык семантической разметки, основанный всеми основными поисковыми системами. С помощью Schema вы можете обернуть определенные элементы на странице тегами HTML, которые предоставляют поисковым системам дополнительную информацию о содержимом. Посетители не видят Schema, только поисковые роботы.
Например, вы можете использовать Schema, чтобы сообщить поисковым системам, что в вашем контенте рассказывается об автомобиле, информация о состоянии здоровья, отзывы звезд, рецепты, люди и их дети, события, категории продуктов и многое другое.
Микроданные до схемы:
Микроданные до схемы — источникМикроданные после схемы:
Микроданные после схемы — источникВидите разницу?
Бонус: Google использует разметку Schema, такую как обзоры, сведения о рецепте и информацию о продукте, для создания расширенных фрагментов (результаты с дополнительной информацией рядом с ними) в поисковой выдаче.
Google использует разметку Schema для создания расширенных фрагментов в поисковой выдачеКак:
- Разметка Schema: язык поиска
Семантический HTML — это HTML, который четко определяет различные разделы страницы.
Подобно разметке Schema, семантический HTML говорит на языке поисковых систем и предоставляет явную информацию о значении вашего контента.
Например, популярные несемантические элементы включают
и , которые ничего не сообщают разработчикам или поисковым роботам о содержимом.Но семантические элементы, такие как