Кластеризатор запросов: Кластеризация запросов в Яндексе и Google. Инструмент от PromoPult.— PromoPult.ru

Содержание

Кластеризация запросов Семантического Ядра – Topvisor.com

Михаил Шакин Автор блога Shakin.ru Топвизор — это целый комплекс полезных инструментов. Сервис динамично развивается, регулярно появляются новые инструменты и расширяется текущий функционал. Умеет интегрироваться с Яндекс.Метрикой, Я.Вебмастером, Google Analytics и Google Search Console.

Александр Ожгибесов Автор блога Ozhgibesov.net Топвизор с первых дней задал высокий уровень работы относительно рынка и каждый день подтверждает своё лидерство. Помимо удобства и точности инструментов сервиса, хочу отметить отзывчивую работу службы поддержки.

Дмитрий Севальнев Руководитель «Пиксель Плюс» Топвизор — один из самых динамичных инструментов на рынке поискового продвижения. Команда регулярно наращивает число полезных сервисов для SEO-специалистов.

Дмитрий Шахов Директор «Ремарка» В Топвизор наша компания перешла не по какой-либо рекомендации. Подкупила отзывчивость разработчика. Приятно, когда твои предложения внедряют и делают жизнь и работу легче. И спустя время эта способность выслушать и внедрить не исчезла. Это очень круто!

Константин Солодянников Руководитель SEO «IT-agency» Начали использовать Топвизор в сентябре 2014 года. Используем модуль позиций, получаем статистику по удобному API, с которым отлично дружит и Power BI/Query для визуализаций готовых отчетов по параметрам количества и динамики запросов в топ-3 по 100+ за нужный период времени.

Виктор Каргин Создатель @seochat Пользуюсь Топвизором с 2013 года. С самого начала меня удивляла суперлояльная Техподдержка. Это лучшая ТП, что мне встречалась.

Сервис вырос из инструмента для проверки позиций в полноценную аналитику для SEO с анализом конкурентов и продолжает развиваться. Это главное его преимущество.

Как правильно кластеризовать семантическое ядро и разгруппировать ключевые запросы?

Следующим шагом после сбора семантического ядра, является кластеризация. По своей сути это процесс разбиения ключевых запросов на группы для определения будущих целевых страниц для продвижения.

Принципы кластеризации

Правильная группировка запросов позволит занять высокие позиции и хорошо ранжироваться поисковыми системами по всем подобранным запросам. Для этого нужно придерживаться определенным правилам.

Каждая группа содержит свой интент. Допустим, у вас есть ряд запросов и нужно их объединить по одной потребности:

  • Доставка грузов из Китая;
  • Доставка грузов из Китая на самолете;
  • Доставить груз из Китая;
  • Доставка товаров из Китая авиа.

В данном примере логично 1 и 3 запрос объединить вместе, а также 2 и 4.

Важно понимать тот факт, что запросы «Доставка грузов из Китая» и «Доставка грузов из Китая на самолете» не удастся продвинуть на одной целевой странице.

Сложность кластеризации может возникнуть для таких запросов, как слова-синонимы вида «грузоперевозки из Китая» и «доставка из китая», или же «таможенное оформление грузов» и «растаможка товаров из китая». В таком случае ориентироваться лучше на результаты поисковой выдачи.

Каждая группа ведется на отдельную ключевую страницу. Он вытекает из пункта выше, и необходимо это для успешного продвижения.

В процессе кластеризации может возникнуть вопрос, а можно ли объединить два кластера в один, если их логично продвигать на одну страницу?

Ответ на данный вопрос — да. Это нормальная ситуация, когда логично объединить группы запросов, имеющий одинаковый смысл и вылезающие страницы. Например, «искусственные елки 2 метра купить» и «новогодние елки 2 м цена».

Но не стоит объединять информационные и коммерческие запросы на одну страницу.

Методы кластеризации ключевых запросов

В зависимости от объема семантического ядра можно применять ручной, автоматический и смешанный способ группировки.

Ручной метод удобен для небольшого ядра в пределах 500 запросов — просто группируем запросы с одинаковым интентом. Для запросов, которым трудно определить кластер, анализируем поисковую выдачу. Если в ТОП выдачи отображаются одинаковые страницы одного сайта по разным запросам, то следует их вести на одну страницу.

Для ускорения этого процесса можно использовать сторонние сервисы, например «Выгрузка ТОП-10 сайтов». Его принцип заключается в следующем — вводим интересующие нас запросы и получаем список вылезающих страниц. Одинаковые страницы выделяются цветом.

На скриншоте выше как раз подтверждается та гипотеза объединения попарно запросов «Доставка грузов из Китая» и «Доставить груз из Китая», а также «Доставка грузов из Китая на самолете» и «Доставка товаров из Китая авиа».

Автоматическая кластеризация происходит с помощью специальных инструментов. В основе их алгоритмов также лежит основа группировки по ТОПу. Наиболее популярные онлайн-сервисы:

После автоматической группировки рекомендуется вручную проверить итоговые кластеры на наличие несоответствий.

Вывод

Разбиение ключевых запросов на группы — один из важных этапов на пути продвижения. По своей сути, он является фундаментом, с которого будет происходить развитие сайта. От результатов кластеризации зависит объем требуемого контента, его содержание, распределение внутренней и внешней ссылочной массы внутри сайта и прочие факторы. А самое главное — позиции сайта по подобранным запросам!

Сбор и кластеризация ключевых слов от А до Я – Idea Digital

Каждый сайт делают для того, чтобы привлечь аудитории. Структура адаптируется под цель получения трафика, в результате чего пользователь приходит на нужную ему страницу, чтобы получить конкретный ответ на вопрос. Кластеризация поисковых запросов – важный этап в работе над структурой сайта. Ниже вы найдете полную информацию о том, что это такое, а также узнаете, какими сервисами лучше всего пользоваться.

Материал по теме: 

контент-маркетинг — зачем он нужен?

Кластеризация: что это

Кластеризацией называют разделение запросов на определенные группы. После формируется список ключей, которые состоят из различного количества позиций.

Статистику сначала группируют по убывающей частоте запросов. Чтобы подобными сырыми материалами можно было пользоваться делают кластеризацию. При работе с семантическим ядром сортировка считается завершающим этапом.

Для чего делать кластеризацию

Объем семантики зависит от масштабности проекта. Счет чаще всего идет на тысячи строк. Подобные перечисления нужно сортировать и группировать. После образуются кластеры, сформированные по интересам пользователей. Крупные делятся на маленькие. Пример:

  1. Купить дом.

  2. Арендовать дом.

  3. Сдать дом.

  4. Купить трехкомнатный дом.

  5. Сдать комнату в доме.

Чтобы каждый человек, желающий приобрести дом, попал на страницу с покупкой недвижимости, запросы со словом «купить» необходимо сгруппировать в единый кластер:

       1. Купить дом.

       4.Купить трехкомнатный дом.

В результате главная задача кластеризации – привести всех людей, которые ищут однотипный объект, на конкретную страничку.

Методы кластеризации

Кластеризацию делают автоматически и вручную. В первом варианте пользователь всё равно принимает участие, ведь некоторые группы остаются неотсортированными.

Сервисы для кластеризации

Делать автоматическую кластеризацию семантического ядра с помощью специальных сервисов куда проще, чем вручную. Подобные сайты учитывают:

  • конкурентный фактор;
  • поисковую выдачу

Практически каждый сервис идентичен другим.

Кластеризация запросов в Excel

Табличный процессор Excel удобен для ручной кластеризации ключей. Он позволяет делать сортировку, автоматически высчитывать общую частотность запросов в кластере.

Алгоритм кластеризации в Excel выглядит следующим образом:

  1. Загрузка всех ключевых запросов.

  2. Формирование кластеров — выделение основных запросов с максимальной частотой.

  3. Сортировка всех остальных ключей в сформированные кластеры.

Ручная кластеризации в Excel возможна, если мы хорошо знакомы с тематикой сайта и если количество запросов не превышает 100.

Serpstat

Украинский многофункциональный сервис. Алгоритмы Serpstat уникальны. Особенности портала:

  1. Группировка происходит по иерархическим принципам. Ключевые запросы объединяются в кластеры. Они, в свою очередь, группируются в суперкластеры, а эти – в протокластеры.

  2. Можно установить силу связи в качестве отдельного параметра между фразами.

  3. Кластеризация происходит в режимах soft и hard. Как итог – 6 способов для алгоритмов.

  4. Анализируются результаты из ТОП-30.

При необходимости можно установить приложение, а не только пользоваться онлайн-сервисом.

KeyAssort

Программа KeyAssort обладает следующими важными характеристиками:

  • при объединении фраз учитываются синонимы, транслитерация и запросы с ошибочными написаниями;
  • 3 алгоритма кластеризации — hard, middle и soft;
  • возможность сбора пересечений в вариативном размере ТОПе от 5 до 50;
  • удобство для ручной корректировки: можно вручную перетягивать запросы из одного кластера в другой, сворачивать и разворачивать группы;
  • слова можно искать с помощью фильтров и объединять фразы из нескольких групп в одну.

Программа позволяет проводить кластеризацию с разной силой группировки запросов, в двух модулях – для коммерческих и для информационных сайтов (Soft и Hard, соответственно).

Key Collector

Основные характеристики программы Key Collector:

  • автоматический подбор дополнительных релевантных запросов;
  • возможность выявления редких низкочастотных запросов, которые не используются конкурентами;
  • анализ ключей конкурентов;
  • выдача рекомендаций по поисковой оптимизации (внутренней перелинковке).
  • возможность последующей интеграции данных с сервисами SAPE, MainLink, Rookee.

МегаЛемма

Эта программа позволяет:

  • анализировать тематические запросы пользователей на основе частотного словаря;
  • очищать от мусора тысячи ключевых слов;
  • автоматически исправлять опечатки в ключах;
  • оформлять семантическое ядро в виде единого файла;
  • сформировать контекстную кампанию в Яндексе и выгрузить ее в аккаунт;
  • сохранять и применять списки стоп-слов.

МегаЛемма, как и другие программы, позволяет проводить кластеризацию для целей информационных сайтов и для контекстной рекламы двумя различными алгоритмами.

TopSite

В программе TopSite реализован алгоритм гиперболической кластеризации, который используется как дополнительная операция при проверке позиций. Разработчик утверждает, что внедрение этого алгоритма позволяет улучшить сортировку запросов, так как ценность адресов из первой десятки топа существенно выше, чем из второй и третьей (программа использует выдачу ТОП-30 как базовую).

Для использования алгоритма и формул, описывающих гиперболическое уменьшение веса url в выдаче, пользователь устанавливает дополнительный параметр «Степень схожести результатов поиска», который может принимать значение от 0 («минимальная схожесть») до 20 («очень высокая схожесть»).

Пользователь может запретить программе объединять кластеры при необходимости, что может быть полезно в некоторых случаях.

MindSerp

В MindSerp включены 3 инструмента:

  1. Кластеризатор, распределяющий запросы по группам.

  2. Оптимизатор, выдающий рекомендации на основе анализа поисковой выдачи.

  3. Определение коммерческого фактора, позволяющее классифицировать поисковую фразу как коммерческую или нет.

Кластеризация проводится обычным образом с выставлением силы связи и строгости группировки.

Онлайн-сервисы для кластеризации запросов

Помимо локальных программ, существует еще большее количество онлайн-сервисов для кластеризации запросов. Рассмотрим наиболее популярные.

Kg.ppc.panel

Простой и малофункциональный сервис, позволяющий загружать список запросов, фильтровать их, использовать минус-слова. На этом все. Результаты группировки выгружаются отдельным списком, без сохранения.

S:toolz

Данный сервис проводит кластеризацию, учитывая поисковую выдачу в объеме ТОП-10. Со своей функцией справляется не хуже, чем локальные программы.

JustMagic

Один из интереснейших и оригинальных сервисов. Включает комплекс инструментов для seo-оптимизации: сбор семантического ядра, анализ текстов, в том числе, на тематичность запросу, внесение предложений по оптимизации существующего СЯ. Кластеризация ключей – один из модулей JustMagic.

Группировка ключей проводится на основе топа выдачи поисковой системы по каждому запросу.

Coolakov

Coolakov – представляет набор простых, но нужных инструментов:

  • пинг — проверка сайтов на доступность;
  • ИКС — проверка индекса качества сайта;
  • считалка соц.ссылок — проверка страниц на количество твитов, лайков и «поделиться»;
  • парсер LI — парсит статистику liveinternet.ru;
  • кластеризация запросов;
  • проверка отключения ссылок в Яндексе по запросам;
  • поиск наиболее часто встречаемых url конкурентов в ТОПе.

Непосредственно сервис кластеризации прост и понятен. Группировка производится с учетом поисковой выдачи. Данные удобно выгружаются в Excel.

Топвизор

Комплексный сервис под названием Топвизор, хотя и позиционируется как поисковый анализатор, но в действительности его функции выходят далеко за очерченные пределы. Например, он может регулировать ставки в Яндекс.Директ, проводя до 288 корректировок в течение суток.

Кластеризация запросов – лишь один из элементов сео-процесса. Процедура проводится на основе поискового топа в трех возможных вариантах силы связи ключей – софт, хард и установка параметров вручную.

SEMparser

Сервис имеет оригинальное название – структуризатор семантики, что, безусловно, характеризует авторов как творческих личностей. Помимо общих элементов, которые присутствуют и у других разработчиков, SEMparser позволяет формировать технические задания копирайтерам.

Если говорить непосредственно о кластеризации запросов, то здесь мы не увидим ничего удивительного или нового. В целом сервис берет своей комплексностью: удобно все этапы работы совершать в рамках одной оболочки, а не прыгать из одной программы в другую.

SE Ranking

Глобальный сервис SE Ranking имеет физические представительства в США, Великобритании и России, что само по себе свидетельствует о высоком уровне и профессионализме разработчиков. По мнению большинства сео-специалистов и диджитал-маркетологов, SE Ranking является, если и не лучшей, то по меньшей мере одной из лучших программных онлайн-оболочек в данной области.

Сервис предлагает широкий инструментарий:

  • аудит сайта или его страниц, проверка позиций в поиске;
  • анализ и мониторинг ссылок;
  • подбор ключевых слов;
  • анализ конкурентов;
  • лидогенератор;
  • маркетинг-план;
  • SMM (автопостинг и аналитика).

Кластеризация запросов – одна из функций сервиса, реализуемая на основе ТОП-10 из поисковых систем.

Rush Analytics

Сервис с типичным набором функций – сбор ядра, проверка позиций и подсказок, анализ текста.

Кластеризация может быть проведена, используя 1 из 3 алгоритмов:

  1. На основе автоматического выделения самых высокочастотных запросов, к которым будут «привязываться» все остальные.

  2. На основе введенных маркеров.

  3. Гибридный алгоритм. Сначала используется метод с маркерами. Для запросов, которые не получилось привязать, автоматически выбираются наиболее высокочастотные ключи по Wordstat и производится повторная кластеризация.

Также пользователь имеет возможность установить силу связи – точность кластеризации.

Алгоритмы и принципы кластеризации

Не важно, как проводится кластеризация. Самое главное – привлечь людей на целевую страницу.

Принципы

Запросы группируются, исходя из:

  • Предметного разделения. Однотипные объекты дробятся на минимальные сегменты. Посетитель должен попадать на конкретную страницу, а не на какой-то аналог.
  • Целевого ограничения. В единой группе ключевиков собираются запросы людей, которые объединены одной задачей. К примеру, «купить часы» и «купить часы Hublot» относят уже в разные группы.
  • Совмещения информационных и коммерческих запросов. У этого принципа кластеризации предусмотрены и возможные ограничения. Пример: «Как пьют чай в Америке» и «Где купить чай в Америке» нельзя группировать в единый кластер.

Алгоритмы кластеризации

Выше мы рассмотрели популярные сервисы и программы. В их основе лежат собственные алгоритмы. Поэтому и создаются различные предложения.

Кластеризация по ТОПу

Сервисы используют алгоритмы поисковых систем для выявления семантической и смысловой принадлежности ключевиков. Как результат – анализ состава ТОПа выдачи. Как уже было показано ранее, они могут принадлежать как к одной группе кластеров, так и к разным.

Взаимосвязь семантики и смысла обладает разной степенью силы. Алгоритмы определяют hard и soft в качестве двух характеров для группировки.

Кластеризация по словоформе

В этом случае фразы относятся в одну группу, если слова, которые в них входят, обладают едиными корнями. Пример: «Хорошие лейкоциты в крови у женщин» и «Нормальное количество лейкоцитов в крови у женщин» принадлежит к одному кластеру.

Кластеризация «Вопрос/Не вопрос»

Разделять запросы на повествовательные и вопросительные имеет смысл в тех случаях, когда второго вида ключей много. Их обычно группируют на отдельных страничках.

Но многие специалисты не пользуются этим методом. Ведь пользователь может сформировать свой запрос, как угодно.

Проблема кластеризации

Группировать запросы не сложно, особенно при наличии современных сервисов. Проблема состоит в наличии списка ключей, которые автоматически не отнеслись к какой-то группе. Число подобных запросов до 30% от общего количества. Да, алгоритмы исправляют положение, но нужно также пользоваться своим умом и руками.

При работе с узкоспециализированными порталами это особенно актуально. Допустим, кластеризуется запрос по пшенице. Тогда ключевики не смогут быть сгруппированы.

Итоги

  • При работе над семантическим ядром сайта важно делать кластеризацию поисковых запросов.
  • Чтобы автоматически группировать ключи, нужно использовать специализированные программы и сервисы.
  • Корректировку необходимо проводить вручную.

Что такое кластеризация запросов | Roistat.Blog

Объясняем, как поделить ключевые слова на кластеры и почему деление их на группы поможет увеличить рекламный и органический трафик.

Что такое кластеризация запросов

Работа над сайтом или рекламной кампанией начинается с формирования семантического ядра. В него могут входить тысячи ключевых слов, по которым будет продвигаться компания. После подбора ключевики группируют. И лучший способ для этого с точки зрения SEO — кластеризация.

Подключить Roistat бесплатно

Кластеризация — разделение ключевых слов на группы по их значению, интересам потенциальных клиентов и схожести поисковой выдачи по запросам. Кластеры или группы запросов формируют, чтобы продвигать целевые страницы по всему кластеру сразу, а не по отдельным ключевым словам.

Пример: компания продаёт автомобили и сопутствующие товары. Есть шесть ключевых слов для продвижения:

  1. Купить машину.
  2. Купить незамерзайку для машины.
  3. Машина бу.
  4. Купить машину с рук.
  5. Купить машину в Москве.
  6. Подержанные авто.

Запросы «Купить машину», «Купить машину в Москве» похожи — их можно объединить в один кластер. Делать разные лендинги для продвижения не нужно, достаточно ограничить показ рекламы геотаргетингом по Москве. Запросы «Машина бу», «Купить машину с рук» и «Подержанные авто» также можно объединить: пользователи, которые вбивают их в поисковиках, явно заинтересованы в выборе или покупке подержанного автомобиля. Запрос «Купить незамерзайку для машины» попадёт в третий кластер.

Чаще всего проводят кластеризацию, сравнивая запросы по ТОП-10 органической выдачи. Если ТОП-10 объявлений по двум запросам в поиске совпадают или почти совпадают, то запросы можно объединить в один кластер.

Пример:

1. Возьмём два запроса «купить мультиварку» и «купить мультиварку интернет магазин» и посмотрим результаты органической выдачи по каждому запросу.

2. Поисковая выдача по запросам «купить мультиварку» и «купить мультиварку интернет магазин» практически совпадает, запросы можно объединить в один кластер.

Кластеризовать запросы можно и по словоформе — в одну группу попадают однокоренные ключи. Но в этом случае есть риск объединить в один кластер коммерческие и информационные запросы, которые поисковики ранжируют по разным правилам. Первый тип запросов нацелен на продажу товаров, второй — на то, чтобы предоставить пользователям полезный контент. Можно объединить такие запросы в кластер, а потом долго и безрезультатно продвигать посадочную страницу по обоим типам. Например, по однокоренным ключам «купить мультиварку» и «как сварить рис в мультиварке». Релевантность будет низкой, как и позиция сайта в поисковой выдаче.

Зачем специалисты по контексту кластеризуют запросы

Кластеризация помогает сэкономить ресурсы при настройке контекстной рекламы. В теории можно под каждый ключевой запрос делать отдельное рекламное объявление и посадочную страницу. Пользователь, который вбивает в поисковик свой запрос и переходит по конкретному объявлению, ожидает увидеть на лендинге релевантную информацию. Но если объединить похожие запросы в кластеры, можно сделать одно объявление и одну посадочную страницу на группу ключевых слов.

С помощью кластеризации можно определить целевые страницы для рекламных объявлений, чтобы не тратить деньги на нерелевантный трафик. После сбора семантического ядра поделите его на кластеры. Внутри каждого из них будет группа ключевых слов, по которым продвигается отдельная страница. Направляйте на неё трафик по всем запросам кластера, чтобы увеличить конверсию.

Пример: настраиваем контекстную рекламу по запросам «купить зимнюю резину», «зимняя резина цена», «зимняя авторезина купить». Можно создать посадочную под каждое ключевое слово и рекламировать их отдельно друг от друга. Но в ходе кластеризации мы узнали, что все три ключа входят в одну группу. Поэтому дешевле и проще рекламировать но ним одну и ту же страницу.

Как собрать базу ключевых слов — простой способ

Чтобы проводить кластеризацию запросов, нужно собрать семантическое ядро. Это удобно делать с помощью сервиса Яндекса «Подбор слов» или Wordstat.

Сразу сохранять найденные ключи помогают расширения для браузера, например, WordStater. Для начала в сервисе «Подбор слов» выделяете нужные запросы и нажимаете на «+» слева от ключевого слова, чтобы добавить его в расширение. 

Собранные данные синхронизируются между вкладками, база слов не исчезнет, даже если закрыть браузер. Фразы можно скопировать группами и добавить в таблицу Excel.

Пример: наша компания — «Арендоватор». Мы сдаём в аренду экскаваторы в Подмосковье. Для создания семантического ядра набрасываем список из 10-20 фраз, которые описывают нашу тематику — аренду экскаваторов. 

Каждую фразу заносим в сервис Яндекса и кликаем по кнопке «Подобрать». В правом столбике будут подобраны запросы, похожие на наши. Добавляем их в расширение, чтобы пополнить базу ключевых слов. Когда прогнали все фразы через «Подбор слов», выгружаем базу ключей из расширения в Excel. Затем подготавливаем их для кластеризации — выделяем группы запросов, по которым будем продвигаться.

Зачем проводить минусовку семантического ядра

Очищайте базу ключей от фраз, по которым приходит нецелевой трафик. Это поможет сэкономить рекламный бюджет и увеличить релевантность страниц. Собирать минус-слова удобнее с помощью генератора минус-слов от Livepage.pro или сервиса подбора ключевых слов от Kparser. Потребуется указать целевые запросы и начать поиск.

Пример: у нашей компании «Арендоватор» минус-словом будет «мини-погрузчик». Мы сдаём в аренду экскаваторы-погрузчики, а мини-погрузчиков в нашем парке нет. Поэтому фраза «мини-погрузчик» нецелевая — её нужно убрать из базы.

Какие ошибки в контекстной рекламе считают непростительными? Читайте в нашем материале.

Подключить Roistat бесплатно

Подписывайтесь на наш канал в Telegram: делимся полезными материалами, дайджестами и кейсами, объявляем о бесплатных обучающих вебинарах.

Кластеризация запросов семантического ядра (СЯ)

4 Февраля 2020
    Содержание
  1. Анализ перед кластеризацией запросов
  2. Золотые правила кластеризации
  3. Виды группировки запросов
  • Заключение
  • Семантическое ядро — это набор ключевых запросов (слов и словосочетаний), которые характеризуют вид деятельности, товары или услуги, предлагаемые на сайте. Именно по этим запросам мы и пытаемся повысить позиции сайта в ТОП-10 поисковой выдачи.

    Качественная проработка семантического ядра позволит получить хороший целевой трафик на сайт. Поэтому стоит уделить анализу семантического ядра особое внимание.

    В данной статье разберемся в правилах составления и кластеризации семантического ядра и рассмотрим способы группировки запросов на сайте.

    Анализ СЯ перед кластеризацией

    Прежде чем приступать к кластеризации ядра запросов, необходимо провести анализ семантического ядра. К слову, анализ СЯ необходимо проводить регулярно, т.к. выдача периодически изменяется. И запросы, актуальные в данный момент времени, уже не будут актуальны через полгода.

    Правильно подобранное и сгруппированное семантическое ядро позволит вам продвинуть сайт на топовые позиции в Яндексе и Google, привлечь на сайт правильную аудиторию, которая обеспечит вам успех!

    Необходимо учесть, что при анализе и группировке СЯ необходимо ориентироваться на выдачу именно в вашем регионе.

    Основные правила кластеризации поисковых запросов

    После сбора СЯ нам необходимо определить на какие страницы сайта у нас будут продвигаться собранные запросы. В этот момент необходимо грамотно проработать структуру на сайте. Если же на нем не найдется подходящей страницы для кластера запросов, то следует создать новую. Важно отталкиваться от потребностей продвижения, а не от того, что мы сейчас имеем на сайте.

    Очевидно, что на одну страницу сайта не следует вести все запросы. Но даже если мы группируем (кластеризуем) запросы по отдельным страницам, при неверном распределении положительного эффекта не будет.

    Что имеется в виду? Объясним наглядно. Например, на продвижении у нас сайт, занимающийся продажей и установкой кулеров по Москве. Необходимо распределить группу запросов: “купить кулер для воды”, “купить кулер в Москве”, “купить напольный кулер для воды”. Попробуем сгруппировать их вместе:


    рис.1 — пересечения страниц из топ10 по запросам

    Имеем в пересечении 4 конкурентных страницы (главные и сайты-агрегаторы мы сразу исключаем). Это значит, что 4 конкурента, находящихся в ТОП10, продвигают эти запросы на одну страницу (и вполне успешно).

    Теперь попробуем добавить к ним еще один запрос — “купить напольный кулер для воды” .


    рис.2 — отсутствие пересечений страниц из топ10 по запросам

    В результате пересечения есть, но это только сайты агрегаторы, которые не являются нашими конкурентами. Значит, если мы будем продвигать все три запроса на одну страницу, в лучшем случае, в ТОП не выйдет только часть запросов. Чем еще плохо продвижение несовместимых запросов на одну страницу — при составлении заголовка Title мы стараемся включать все запросы в заголовок, поэтому добавив в Title и нужные, и не нужные слова, мы неправильно распределим вес слов, и такой заголовок будет плохо ранжироваться в выдаче.

    Существует еще ряд правил, которых стоит придерживаться при кластеризации СЯ для успешного продвижения сайта по ряду запросов:

    • Одну группу запросов стоит продвигать на одну страницу. Т. е. не нужно создавать для одной группы запросов 10 страниц на сайте разного вида (информационную, коммерческую, смешанную и т.д.). Потому что в итоге все эти страницы будут мешать друг другу при ранжировании.
    • Продвигаемая страница, которую вы выбрали для группы запросов, должна отвечать запросам пользователя. Например, если в запросе присутствует слово “цена / прайс / стоимость”, то на странице должен присутствовать прайс-лист, каталог товаров с ценами.
    • Не нужно объединять на одной странице коммерческие и информационные запросы. У пользователей, которые вводят такие запросы, разные потребности, которые вы не удовлетворите, продвигая их на одну страницу.
    • Учитывайте “золотое правило SEO” — “В топе — не трожь”. Это значит, что, если при распределении СЯ по страницам, определенные запросы находятся уже в ТОП10, то постарайтесь их оставить на своих страницах.
    • Надо стараться не создавать одинаковые по смыслу страницы, которые будут оптимизированы под разные запросы. Ведь наша цель не запутать посетителя, а наоборот, помочь ему найти то, что он искал 🙂
    • Не всегда все синонимы можно продвигать на одну страницу. Здесь действует правило — “Если вы считаете, что эти два слова означают одно и тоже, то это совершенно не значит, что поисковая система будет с вами согласна”. Имеется в виду то, что для поисковой системы синонимы, очевидные для специалиста, могут иметь все-таки разное значение.
    • На главную страницу желательно продвигать самые высокочастотные запросы и запросы, которые отражают суть деятельности компании.
    • Старайтесь не продвигать большое количество запросов на одну страницу даже если кажется, что это возможно. Например, запросы со словом “цена” можно выносить на страницы прайса, создавая при этом страницы вида “price/coolers”, “ceny/stellazhy” и т.д., это считается нормальной практикой.

    На практике это выглядит так. На изображении представлена группа запросов про песок. Принято решение разделить их на три группы: песок; строительный песок; прайс на песок.


    рис.3 — пример кластеризации семантического ядра

    Виды группировки запросов

    В общем случае можно выделить ручной способ кластеризации семантического ядра, группировка СЯ с использованием инструментов и комбинированный способ. У каждого из них есть свои особенности, о которых поговорим ниже.

    Ручная кластеризация списка запросов

    Ручная группировка СЯ подразумевает под собой то, что, имея список запросов, вы будете по одному их распределять в определенные группы. Кластеризовать таким образом запросы можно по смыслу или ориентируясь на выдачу ТОП10.

    Важно! При кластеризации СЯ, в первую очередь, снимите позиции по запросам. Если есть часть запросов, которая уже в ТОП10, то продвигайте запросы на соответствующие запросы. Таким образом вы сэкономите себе добрые полчаса времени 🙂

    Hard- и Soft-кластеризация

    Рассмотрим сначала группировку семантического ядра по конкурентам из выдачи. Существует два вида такой группировки ключевых фраз: Soft-кластеризация и Hard-кластеризация. При использовании варианта Soft, стоит брать один ядрообразующий запрос и добавлять к нему остальные. Например, “ондулин купить” — ядрообразующий и дополнительные: “ондулин ижевск”, “ондулин ижевск купить”, “ондулин ижевск цена”. Сравниваем по этим запросам общие URL в ТОП10 и, если количество одинаковых URL выше определенного порога, то добавляем запрос в группу.

    Когда используется вариант Hard, можно объединить ключи в одну группу только тогда, когда пересечение URL из ТОП10 происходит для всех запросов.


    рис.4 — hard- и soft-кластеризация

    На точность группы влияет порог кластеризации — это наименьшее количество общих URL для создания группы. Как правило, для Soft-кластеризации порогом являются 4 URL, а для Hard-кластеризации — 3.

    Кластеризация СЯ на уровне логики

    При другом варианте ручного распределения семантического ядра нам понадобится только логика и знание ниши. Сразу хочется сказать, что такой способ применим в случае, когда у вас имеется небольшой список запросов или вы продвигаетесь по большому количеству низкочастотных запросов. Допустим, мы имеем определенный список продвигаемых запросов и нам необходимо определиться на какую страницу будут продвигаться определенные запросы. В первую очередь составьте файл в MS Excel, LibreOffice или в Google Docs (тут вы выбирайте сами что вам удобнее для работы), выгрузите все запросы туда. Затем, если у нас условно до 100 запросов то можно поступать следующим образом, смотрите на запрос, определяете на какую страницу он должен продвигаться и вносите URL в файл:


    рис.5 — пример подбора релевантных URL

    Советуем попутно отмечать цветом (или в примечаниях), если необходимо создать новую страницу или изменить URL у текущей (как на скрине).

    Совет! Как определить есть ли на сайте подходящая страница для продвижения? Отправляйтесь в Яндекс и введите в поисковую строку “запрос site:yoursite.ru” (без кавычек). Если на сайте будут подходящие страницы, берите их (лучше самую первую, если она не занята).

    Такой вариант группировки СЯ, конечно, не подойдет, если у вас более ста запросов, иначе, вы потеряете огромное количество времени на распределение СЯ. Что же делать, когда у вас много запросов? Суть способа остается такой же, мы все-равно подбираем страницы вручную, просто имеются небольшие хитрости (на самом деле это обычные функции файлов, просто о них необходимо знать). Самыми основными помощниками будут являться функция ctrl+f и фильтры по столбцам. Например, имеем список запросов:


    рис.6 — группировка запросов с помощью фильтров

    Далее поступаем таким образом: т.к. наш сайт посвящен мужским костюмам, то мы будем делить костюмы на категории. Идем по списку вниз, натыкаемся на характеристику “классические”, создаем фильтр с этим словом и оставляем только эти запросы:


    рис.7 — группировка запросов с помощью фильтров №2

    Определяем их на одну страницу. Далее видим характеристику “тройка”, находим соответствующие запросы:


    рис.8 — группировка запросов с помощью фильтров №3

    Выделяем их в отдельную группу и определяем им URL. Продолжаем до тех пор, пока не закончатся характеристики и не останутся общие запросы типа “купить мужской костюм”. Такой способ кластеризации СЯ существенно облегчит работу с большим количеством запросов.

    Хочется отметить, что ручная кластеризация является наиболее точным способом распределения запросов. Однако, существенным минусом ручной кластеризации является большие времязатраты. Ускорить процесс распределения запросов можно используя инструменты для кластеризации СЯ.

    Автоматическая кластеризация семантического ядра

    Абсолютное большинство инструментов для кластеризации СЯ основано на принципе анализа выдачи поисковых систем по конкретным запросам. Отличие только в том, что это уже не вы смотрите выдачу, а анализирует ее программный код. Рассмотрим несколько инструментов для группировки запросов.

    Just Magic

    В этом сервисе можно не только сделать распределение, но и определить коммерческость запроса, что является важной функцией при анализе семантического ядра.

    Чтобы сделать группировку, необходимо зайти в пункт “Сервисы -> Кластеризатор”, именно там и происходит “магия”.


    рис.9 — кластеризатор Just Magic


    рис.10 — легенда кластеризатора Just Magic

    На скриншоте изображен тот самый кластеризатор и выделены основные поля:

    • Метка — это просто название проекта, чтобы вы могли его быстро найти в списке заданий.
    • Регион — можно задать кодом или буквами, инструмент понимает, и то, и то.
    • Тот самый определитель коммерческости. Если у вас уже определенное СЯ, то можете не ставить галочку напротив него, если же сомневаетесь в части запросов — воспользуйтесь.
    • Домен для поиска релевантных страниц — сюда вы вводите ваш домен. Если инструмент найдет подходящую страницу, то она будет в соответствующем поле.
    • Фразы — непосредственно список наших запросов.

    Как видите, все просто и интуитивно понятно. Далее нажимаем “Отправить задачу” и ждем результата.


    рис.11 — результат кластеризатора Just Magic

    На выходе получаем таблицу, в которой содержится информация о том, к какой группе отнесен запрос (разделений четыре — от самого мягкого grp1 до самого жесткого — grp4). Также присутствует информация о количестве в выдаче главных страниц сайта, коммерческости запроса от 0 до 1 (1 — коммерческий запрос, 0 — информационный), подходящих URL (в данном примере нет подходящих страниц на сайте) и тематике, к которой отнесен запрос. Данные можно выгрузить для дальнейшей работы с СЯ.

    Инструмент довольно удобный, не часто возникают с ним споры. Единственный его минус — инструмент платный.

    Key Collector

    Этот инструмент известен всем оптимизаторам сайта, поэтому не будем уделять ему много внимания. Основной вопрос — можно ли сделать кластеризацию в Key Collector бесплатно? Однозначно да, для этого уже должны быть загружены все запросы, а также собрана информация о поисковой выдаче. После чего переходим во вкладку “Данные” и выбираем “Анализ групп”.


    рис.12 — кластеризатор Key Collector

    В настройках выбираем тип группировки “по поисковой выдаче”.


    рис.13 — анализ групп Key Collector

    Результат можно выгрузить и продолжить работать с ним.

    Группировка СЯ от Pixel Tools

    Основное предназначение этого инструмента — распределение запросов по группам и построение правильной структуры сайта с точки зрения SEO. Также у него есть ряд дополнительных параметров, по аналогии с justmagic. Чего-то эдакого, чего бы не было у других инструментов у него нет.


    рис.14 — кластеризатор от Пиксель Тулс

    Однако, можно найти одну “изюминку” у этого сервиса. Помимо стандартных Hard- и Soft-кластеризаций, в инструменте есть, так называемый, метод “Пиксель Тулс”. Это, вроде как, их уникальный алгоритм, который работает более точно. Создатели рекомендуют использовать его для классического продвижения по позициям. Для продвижения по трафику, например, можно использовать Софт-метод.

    На выходе получаем документ, содержащий стандартные поля: запрос, URL, группа, позиция, количество главных страниц в выдаче.

    SEOQuick

    Это очень простенький инструмент, который исключительно группирует запросы, не находя подходящий для продвижения УРЛ. Этот инструмент подходит для смешанной кластеризации. Вы можете сгруппировать запросы, а страницы подобрать вручную.


    рис.15 — кластеризатор SEOQUICK

    На выходе получаем таблицу с группировкой запросов.


    рис.16 — результат кластеризатора SEOQUICK

    В принципе, единственный его плюс — этот инструмент бесплатный.

    Coolakov

    Приведем еще пример бесплатного сервиса для разбивки запросов по группам. Функционал в нем прост и понятен даже если вы используете его впервые. Ввести необходимо регион продвижения, список запросов и порог кластеризации (по необходимости).


    рис.17 — кластеризатор Coolakov

    На выходе получаем таблицу с рассортированными запросами.


    рис.18 — результат группировки Coolakov

    Никаких дополнительных параметров сервис не показывает, но зачастую этого и не требуется. Поэтому считаем, что этот сервис заслуживает внимания.

    Мы привели пример пяти инструментов для кластеризации запросов. Рассматривать больше сервисов смысла нет, т.к. почти все они работают по единому принципу.

    Заключение

    Итак, в этой статье мы рассмотрели способы кластеризации семантического ядра. Как вы видите, это сделать не так уж и сложно, и вы обязательно с этим справитесь. Выбирайте тот способ, который вам лично удобнее. Наши советы такие:

    • Если кластеризуете до 100 запросов, можете использовать ручной или смешанный тип кластеризации.
    • Если вам необходимо сгруппировать большое количество запросов, не тратьте время, и используйте автоматический способ кластеризации.
    • Для предварительной или первой кластеризации запросов можно использовать бесплатные сервисы. Для более детального анализа запросов — выбирайте платный сервис.
    • Если продвигаете сайт по позициям, то кластеризуйте запросы методом Hard, если по трафику — методом Soft.

    Сервисов для кластеризации на данный момент большое число, подобрать подходящий — не проблема.


    Кластеризация запросов и ключевых слов, семантика Яндекс и Google

    Семантическое ядро (СЯ) сайта – ключевой элемент при его продвижении. Более того, от качества СЯ во многом зависит и эффективность работы PPC-кампаний (Pay-per-Click – показ рекламных объявлений в сетях Google AdWords или Яндекс.Директ). Поэтому составление семантического ядра и кластеризация запросов – первое, что нужно предпринять при работе над продвижением сайта в поиске или создании рекламных объявлений.

    Но просто собранные ключевые слова сложно использовать в работе, ведь их необходимо упорядочить. Поэтому после сбора СЯ идет кластеризация запросов – их разделение на группы (кластеры), в соответствии с особенностями и свойствами.

    В рамках темы, рассмотрим процесс в действии, а также возможные способы автоматизации. Однако затронем только ключевые аспекты и сервисы, поскольку кластеризация слишком многогранна и для ее описания придется выпустить пару томов.

    Часть 1. Подбор семантики

    Первичный SEO анализ сайта достаточно показателен, чтобы определиться с общей тематикой ключевых слов. Не придется привлекать каких-то специалистов или обращаться к сервисам, чтобы определиться с тематикой. На этом этапе все просто. Ведь «о чем пишем, те запросы и используем».

    Сложности начинаются потом: далеко не всегда понятно, как именно думает пользователь, которому окажется полезен ваш сайт. Если детально разбирать каждый запрос, то можно встретить явление, которое называется «потоком сознания».

    Сервисы для кластеризации запросов

    Например, человека интересует продвижение сообщества в Facebook. Но искать информацию об этом он может и по запросу «Как продвинуться в мордокниге» (Мордокнига – сленговое название соцсети Facebook). И это тоже придется учесть в работе над семантикой.

    Спасает здесь то, что составление семантического ядра для сайта ведется с помощью специализированных сервисов.

    • Wordstat – подбор поисковых запросов Яндекса. Частично упрощает кластеризацию, поскольку в выдаче присутствуют все слова из начального запроса с дополнительными формулировками.
    • Keyword Planner – практически аналогичный сервис от Google.
    • Тренды Google – еще один помощник, который покажет запросы, набирающие популярность.

    Некоторые  блогеры включают в список Google Correlate, отображающий другие варианты запросов, основанные на поведенческих данных пользователей поисковой системы. Однако в русскоязычном сегменте сети, «отвязанном» от США географически, этот сервис не пригоден, увы.

    Но популярность слова «Мордокнига», применительно к Facebook, эти сервисы не отобразят. Поэтому выборку ключей, по которым будет вестись кластеризация запросов, стоит провести и по другим сервисам. Выбор довольно большой:

    • Готовые базы. Преимущества – все сделали за вас. Недостатки – не самая высокая достоверность, ведь не учитываются тренды и текущая популярность ключей. Из популярных в .ru зоне – Мутаген, UP Base.
    • Специализированные сервисы  дадут представление о том, по каким запросам продвигается сайт, причем некоторые покажут СЯ конкурентов. Наиболее популярны SEMRush, Key Collector, Alexa, Ahrefs.

    Альтернативные способы сбора семантики

    Рассматривать все сервисы для сбора семантики не имеет смысла. Их слишком много, они отличаются механизмами работы, дополнительными параметрами. К тому же, все они разной степени платности. Качественных обзоров в сети достаточно, поэтому подобрать оптимальный по соотношению цены, качества и удобства не составит труда.

    Но какой способ сбора семантики предпочесть? Сравним безотносительно конкретных сервисов, а по общим признакам:

    Для поиска синонимов можно воспользоваться 3 вариантами:

    1. Ручной сбор по подсказкам поисковой системы. Например, Google в последнее время часто показывает похожие запросы в формате «также ищут». Но не обязательно, что удастся почерпнуть какие-то уникальные слова.
    2. Анализ СЯ конкурентов. Но здесь следует понимать, что найдется далеко не исчерпывающий список, и охват может оказаться не настолько большим, каким он мог быть.
    3. Специализированные сервисы, например, Serpstat. Система «умеет» работать с похожими фразами, и количество синонимичных запросов довольно большое. Но опять же, кластеризация запросов происходит не всеобъемлюще.

    Стоит попробовать все 3 способа, чтобы получить как можно больший охват синонимов и тематически схожих слов. Чем шире охват, тем больший целевой трафик удастся привлечь.

    Но при анализе конкурентов нужно обратить внимание на структуру их сайтов, предлагаемый ассортимент и дополнительные услуги. Иначе в необработанную базу запросов попадет «мусор», не соответствующий содержанию сайта, которые будет продвигаться.

    Например, предполагается заниматься только продажей садоогородных товаров, из услуг – доставка. У конкурентов расширен товарный ассортимент за счет стройматериалов, малых архитектурных форм. Из дополнительных услуг помимо доставки – ландшафтный дизайн, консультации агронома, вывоз строительного и растительного мусора, спил деревьев и обрезка кустарников. Следовательно, все, что не относится к уже вашему бизнесу – бесполезный мусор, парсить который не имеет смысла.

    Так или иначе, но по окончании подбора ключевых слов появляется обширный список, который можно импортировать в формате электронной таблицы для последующей обработки. Кажется, составление семантического ядра завершено. А что делать со всем этим “богатством”?

    Сразу приступать к созданию контента? Тогда как определиться, какие ключи будут на каждой из страниц? А что, если итогом работы над СЯ становится 1000+ ключевых слов? Такое количество страниц для небольшого сайта не нужно, да и не все запросы “одинаково полезны”. Некоторые хоть и связаны тематически, но смысла от их использования не будет никакого.

    Например, составляется семантика для сайта пасеки. И здесь релевантными окажутся и просто “мед” – информационный запрос и «купить мед» – коммерческий запрос. А вот «лечение подагры медом» уже не имеет отношения к тематике сайта, хотя на первый взгляд кажется, что использовать этот запрос целесообразно.

    Вот для распределения запросов и нужна кластеризация ключевых слов. То есть, нужно распределить все слова по «тематическим группам» – кластерам,  в соответствии с которыми определить количество страниц и создать уникальный контент для продвижения в поисковых системах или PPC-рекламе.

    Часть 2. Кластеризация запросов

    Сразу оговорюсь, что не рассматривают кластеризацию в разрезе «soft» и «hard». По большей части для коммерческих сайтов используется именно hard кластеризация. Вариант мягкой классификации используется редко и, по моему мнению, для низкочастотных запросов (то есть тех ключей, по которым конкуренция низкая).

    Также хочу оговориться: если сайт состоит из 3-5 страниц, а для продвижения отбирается менее 10 ключей, то особенной потребности в кластеризации СЯ не возникает.

    Иное дело, когда отобрано 1000+ запросов. В этом случае нужно выполнить 3 шага

    1. Сгруппировать ключи по тематике.
    2. Распределить ключи по группам, в зависимости от их знанчения.
    3. Оценить совместимость ключевых слов для их использования в пределах 1 страницы сайта

    Часть 3. Кластеризатор от SEOquick

    Кластеризация запросов от SEOquick позволяет осуществлять морфологический поиск автоматически. Опытные специалисты знают, что это приходится делать вручную, либо при больших финансовых затратах. Вот несколько аргументов в пользу использования инструмента:

    • Быстрая работа (если раньше вам требовалось 1 – 2 дня, чтобы создать полноценный список, теперь надо 5 минут).
    • Совершенно бесплатный, хотя аналогичные программы стоят дорого (например, за 3000 слов придется отдать 20$).

    Шаг 1. Группировка по тематике

    Ключевые слова разделяются по группам, в соответствии со структурой сайта. Предположим, что необходимо продвинуть интернет-магазин, посвященный садоводству и продаже семян, удобрений, инвентаря. Условно отделяем коммерческие запросы «купить», «цена», «дешево» от остальных.

    Затем распределяются слова по группам – «томаты», «огурцы», «инвентарь», «удобрения». Количество групп определяет первичный SEO анализ сайта, если ресурс уже существует. Если нет или имеются проблемы в структуре, группы дополняются или создаются «с нуля».

    Также стоит определиться с геозависимостью и не очевидной коммерцией. Что это? Для примера – единственное и множественное число. Обратимся к поисковикам:

    Баклажан для Яндекса – информационный запрос, а баклажанЫ уже коммерческий. То же самое и в Google.

    Шаг 2. Оценка совместимости слов на 1 странице по топу выдачи

    Далеко не все слова «уживаются» вместе на странице. Но самостоятельно выделить и определить совместимость, особенно если нет опыта, практически невозможно.

    Представим ситуацию, что на 1 и 2 шаге ошибок не совершено и группы собраны с идентичной тематикой. Перейдем к проверке по URL. Для этого вбиваем в поиск фразу «мотокосы купить москва», а затем «мотокосы москва». Совпадает 4 url, следовательно, эти ключи можно использовать на 1 странице.

    Продолжим дальше: «мотокосы отечественные» и «мотокосы дешево» не имеют совпадений. Соответственно, стоит разнести эти ключи на разные страницы – вместе они не «уживутся».

    Выводы

    Закономерна мысль: имея порядка 100 запросов, кластеризовать их вручную по тематике и морфологии еще реально. Но банальная проверка по ТОП/url займет недели, месяцы, годы. Время будет потрачено впустую.

    Но с первыми шагами тоже не все просто. Если в таблице будет 1000+ запросов, то только лишь на распределении их по группам и оценке релевантности «сломаются глаза» уже через 8-10 часов непрерывной работы. К тому же, человеческая память «коротка», и возможность пропустить какие-то запросы или создать лишние кластеры тем выше, чем более сложной структурой обладает сайт.

    Давайте посчитаем количество страниц для 1 небольшого сайта пасеки:

    1. Разделы : Главная страница + О компании + Доставка и оплата + Товары + Блог (обзоры/новости/etc.).
    2. Для раздела Доставка и оплата – 2 страницы (или 1 с большим кластером)
    3. Товары – количество страниц соответствует ассортименту, но даже если продается всего лишь 5 сортов меда, ульи и пчелы, то количество страниц составит 10-15.

    Считаем:  В общей сложности более 20 кластеров, для каждого из которых порядка 2 запросов. 20х2=40. Обработка 40 запросов займет не менее дня. Вот только фактический объем, который придется «перелопатить» стоит смело умножать на 10, если семантика собиралась автоматически.

    Следовательно, придется автоматизировать этот процесс.

    Часть 3. Автоматическая кластеризация запросов

    В помощь оптимизатору создано немалое количество сервисов автоматической кластеризации. Их суть – пропуск 1 и 2 шагов и обработка всего массива запросов только по совпадению url. Есть и альтернативные методы разделения. Кластеризация ключевых слов здесь выполняется только по шагу 2.

    Хочу заметить: тематическое разделение запросов понадобится только при работе вручную. Во всех остальных случаях алгоритмы кластеризации справятся самостоятельно. Но это не значит, что конечный итог не придется изучать на предмет ошибочного разнесения ключей по подгруппам.

    Кластеризация по ТОПу/url

    Предполагается, что при таком подходе учитывается алгоритм ранжирования поисковой системы, следовательно, и разделение ключей на группы окажется наиболее точным. Но очевидных минусов здесь предостаточно.

    • Алгоритмы ранжирования меняются. Вспомним судьбоносные апдейты у Google – Florida, Panda, Penguin, Pigeon. А ведь ранжирование адаптируется выдачу не под сайты, а под пользователей поисковой системы. А она меняется с течением времени. Спустя 1-2 месяца список сайтов по запросу окажется совсем другим.
    • Разные поисковые системы – разные результаты. Сравним выдачу по одинаковому запросу у Google и Яндекс: по запросу «мотокоса» она отличается довольно сильно, нашелся всего пересекающийся 1 url.
    • Включение в группу неоднородных слов, которые сложно использовать при создании контента. Представьте вариант, когда в кластер помещается слова «семена герман ф 1» и «корнишоны 6 соток». Да, речь про огурцы, но и ключи разной тематики (1 относится к семенам, 2 – к продукции определенного бренда). Увязать их между собой на карточке товара не то чтобы невозможно, но копирайтеру придется попотеть.

    К определенным минусам можно отнести относительную дороговизну сервиса. Однако здесь следует понимать, что инструмент не всегда может быть бесплатным. И каждый сам для себя решает, готов ли он платить и стоит ли услуга своих денег.

    Второй, не вполне очевидный недостаток – необходимость доработки семантики. И вдвойне обидно, если кластеризация запросов была платной. Причем сервисы запрашивают немалые суммы, от 150 USD и выше.

    Лично мое впечатление от кластеризации методом url/топа выдачи – попытка сделать профессиональный инструмент не вполне разбираясь, как на самом деле работают алгоритмы ранжирования. И вместо реальной работы над контентом и семантикой  специалисты пошли по пути наименьшего сопротивления, полагаясь лишь на примитивный перебор вариантов.

    Оппоненты же утверждают, что подобный подход – единственно правильный, поскольку гарантирует попадание в ТОП. Сюда же «приплетается» LSi (latent semantic indexing – скрытое семантическое индексирование), поскольку существует «притча» о некой семантической зависимости между словами.

    На самом деле, и здесь есть свои нюансы:

    • Если на странице встречаются 2 запроса, то это значит, что не Яндекс или Google их признал наиболее релевантными, а что веб-мастер (SEO-специалист) конкретного сайта их туда поместил.
    • Семантическая зависимость существует, но в отрыве от ранжирования. К тому же LSi – это больше кластеризация запросов по тематике/морфологии, но не по ТОПу/url
    • Выдача адаптирована под конкретного пользователя, тогда как кластеризаторы работают в отрыве от нее. Соответственно у конечного пользователя «картинка» окажется совсем другой, чем у сервисов во время работы над семантикой

    Тематическая (семантическая) кластеризация

    Альтернативой сервисов разделения ключей по группам на основе ТОП/url являются тематические кластеризаторы.

    Здесь правят бал несколько иные принципы, которые можно охарактеризовать следующим образом:

    • Анализируется семантическая зависимость каждого из запросов. Не LSi в чистом виде, но что-то близкое. Ведь алгоритму нужно не просто выявить главное слово в запросе, но и подобрать для него пару/аналог, который имеет абсолютно идентичное значение. Например, «томаты – помидоры», «мотокоса – бензиновый триммер». В то же время сервис должен уметь разделять не равные по смыслу, но похожие по написанию ключи. «луковицы тюльпанов – луковицы (в значении лук репчатый)».
    • Анализируется состав фразы по словам/сочетанию. Не семантическая (смысловая, синонимичная) зависимость, а именно количество однокоренных слов или целых фраз из них. Например «купить семена герман ф1 – купить герман ф1».
    • Анализ геозависимости. Коммерческие запросы геозависимы. Кластеризация ключевых слов обязательно включает в себя фактический источник запроса. Ведь одно дело, когда интернет-магазин работает по Москве, и другое – по Владивостоку. Понятно, что для семантического ядра московского магазина запрос «мотокультиватор владивосток» абсолютно бесполезен, и его не должно быть ни в одной из групп.

    Недостатки есть и у этого метода, однако они не такие критические, как в случае с кластеризацией по ТОП/url.

    Прежде всего – синонимизация, которую не всегда корректно выполняет алгоритм кластеризатора. Для программного кода фразы «электротриммер – электрокоса», «насос  СН90-В – насос СН 90» не всегда имеют знак равенства, поскольку “компьютер” не обладает абстрактным мышлением и потому вполне может разнести их по разным группам.

    Второй аспект – внесение в одну группу несовместимых запросов. Например, тип техники: «Погружной грязевой насос – погружной скважинный насос» относятся к разным типам. Еще хуже обстоят дела с моделями техники: «насос SP1 – насос SP3».

    Третий аспект – пользователи не всегда полностью указывают местоположение поиска или поисковые системы неправильно определяют регион, соответственно, автоматическая кластеризация запросов не обязательно учтет целевой регион.

    Возьмем для примера Костромскую область:  Яндекс и Google считают все населенные пункты области за г. Кострому. Однако жителям Шарьи выдача для областного центра не принесет пользы. Расстояние порядка 300 км сделает покупку семян в Костромском интернет-магазине непривлекательной.

    Следовательно, результаты работы кластеризатора придется править вручную, даже если сервис предлагает самостоятельно указать неразрывные слова, региональную принадлежность и список синонимов. Но времени на это потратиться все равно меньше, чем, если пытаться все сделать самостоятельно.

    Часть 3. Финальная кластеризация запросов

    Файл практически готов, из него убран лишний мусор. Осталось пересмотреть кластеры, сосчитать их вес и разнести по категориям.

    Шаг 1. Пересмотр кластеров.

    Некоторые кластеры после правок обладают, по сути, одинаковым признаком, но разным набором ключей. Следовательно, все их нужно проверить и удалить лишние, то есть те, которые не будут взяты в работу ни сейчас, ни когда-нибудь потом.

    Шаг 2. «Вес» кластера

    Для каждого ключевого слова установлена частотность. По высокочастотным запросам конкуренция больше, но и прибыль от них выше. SEO-специалисты применяют разные подходы, но чаще всего стараются использовать на странице запросы с разной частотностью – только ВЧ, только СЧ, только НЧ или их сочетания.

    На этом шаге можно перегруппировать запросы по кластерам, распределив их в соответствии со своей привычкой. Например, объединить ВЧ-кластеры, или наоборот – разбавить их НЧ или СЧ.

    Шаг 3. Подбор страниц

    Кластеризация запросов, выполненная для уже существующего сайта, потребует подбора страниц для каждого из созданных кластеров. Можно пойти двумя путями:

    1. Перераспределить ключи по страницам в соответствии с картой сайта.
    2. Распределить кластеры с проверкой через поисковик.

    В последнем случае в поисковую строку вбивается запрос формата «Ваш сайт» + «Основной Запрос Кластера» (у которого наивысший вес) и берется страница, которая окажется 1 в списке. Но здесь может возникнуть казус: общее содержимое страницы и смысл ключа фактически не релевантны.

    Часть 4. Заключительная

    Если все сделать правильно, то на выходе получится файл, в котором:

    • все ключевые слова собраны по группам (кластерам) и объединены по смыслу;
    • для каждого кластера просчитан вес, что определяет очередность работ для копирайтера/контент-менеджера/администратора/программиста;
    • подобрана целевая страница или раздел сайта, релевантный запросам.

    Рассмотренная кластеризация запросов во многом упрощает продвижение сайта в ТОП. Но нужно понимать, что это – далеко не панацея, и без дополнительных усилий ничего не сработает. Под полученное СЯ необходимо создать уникальный контент (то есть, дать задание копирайтеру и/ или редактору/контент-менеджеру), организовать соответствующую структуру.

    20 сервисов кластеризации семантического ядра + 8 ошибок

    Кластеризация семантического ядра – это разделение всех собранных запросов на группы для последующего определения целевых посадочных страниц и их продвижения.

    Это крайне важный этап работы с семантикой, который может как улучшить, так и ухудшить ранжирование сайта по запросам в поисковиках. А все работы по сайту зависят от того, как будут распределены ключевые фразы по сайту.

    Лучшие сервисы кластеризации

    Если Вы уже все про кластеризацию знаете, то вот Вам сразу сервисы. Мы разделили их на категории – сервисы с одной функцией кластеризации и площадки с комплексом SEO инструментов. Практически в каждом есть бесплатный период, поэтому Вы сможете протестировать сервис и выбрать наиболее удобный для себя.

    Кроме сервисов на рынке есть программы с различными функциями по работе с семантическим ядром – Key-collector и KeyAssort. Чтобы пользоваться, Вы платите уже не за запрос, либо месяц, а покупаете лицензию.

    – Только кластеризация

    СервисБесплатный доступСтоимостьМетод группировкиПоисковая системаМожно задавать регионыСила группировки
    Сoolakov500 запросов0,2 руб/запросНе регулируется– Яндекс.Даот 2 до 10
    Stoolz1 500 запросов0,1 руб/запрос– Hard.– Яндекс.Даот 2 до 10

    – С другими SEO инструментами

    СервисБесплатный доступСтоимостьМетод группировкиПоисковая системаМожно задавать регионыСила группировки
    SERanking14 днейот 0,12 руб/слово– Soft;
    – Hard.
    – Яндекс;
    – Google.
    Даот 1 до 9
    PromoPultЕстьРассчитывается индивидуально– Hard.– Яндекс;
    – Google.
    Даот 1 до 10
    SerpstatЕстьот 5 275 руб/мес– Soft;
    – Hard.
    – Яндекс;
    – Google.
    Да– Weak;
    – Medium;
    – Strong.
    Rush-analyticsЕстьот 500 руб/мес– Soft;
    – Hard.
    – Яндекс;
    – Google.
    Даот 3 до 8
    MegaindexБесплатный тарифот 1 490 руб/месНе регулируется– Яндекс;
    – Google.
    Даот 3 до 10
    Keys.soНетот 1 500 руб/месНе регулируется– Яндекс;
    – Google.
    Нетот 10 до 100%
    Topvisor200 запросовот 0,09 руб/слово– Soft;
    – Hard;
    – Moderate.
    – Яндекс;
    – Google.
    Даот 1 до 9
    Just-magicБесплатный тариф1 000 руб/мес– Hard.– Яндекс;
    – Google.
    ДаНе регулируется
    SeoquickНетРассчитывается индивидуальноНе регулируетсяНе регулируетсяНетНе регулируется
    Semparser50 запросовот 0,18 руб/запросНе регулируется– Яндекс;
    – Google.
    Даот 1 до 10
    Engine.seointellectНет0,2 руб/запрос– Soft;
    – Hard;
    – Balance.
    – Яндекс.ДаНе регулируется
    SemantistНет2 000 руб/10 000 запросовНе регулируется– Яндекс.Даот 1 до 10
    ArsenkinБесплатный тарифот 549 руб/мес– Soft;
    – Hard.
    – Яндекс.Даот 2 до 10
    MajentoНетБесплатно– Soft;
    – Hard.
    – Яндекс.НетНе регулируется
    Be1НетБесплатноНе регулируется– Яндекс.ДаНе регулируется

    как сделать кластеризацию в сервисе

    Все перечисленные сервисы в принципе работают одинаково, просто в них разные возможности – где-то больше настроек, где-то меньше. Мы рассмотрим кластеризацию запросов семантического ядра на примере сервиса SERanking.

    Шаг 1. Настройка

    После регистрации найдите вкладку “Кластеризация” в разделе “Инструменты”. В окне настройки первое, что нужно сделать – это ввести название отчета. Далее указать поисковую систему, по которой будут анализироваться ТОПы. Это может быть Google или Яндекс.

    Онлайн сервис кластеризации позволяет выбрать регион, город или индекс и язык интерфейса Google выбранной страны. Ниже устанавливается уровень точности. Он задает, сколько нужно общих URL в выдаче для того, чтобы объединить ключи в одну группу.

    То есть чем больше степень группировки, тем большее количество групп с меньшим количеством запросов будет создано в результате кластеризации. Оптимально 2-3.

    Настройка

    Шаг 2. Выбор метода

    Далее необходимо выбрать метод кластеризации, их в данном сервисе два. Если Вы не знаете о них, то ниже в теории я расписала их и еще один метод, который можно встретить в других сервисах.

    По методу Soft сервис находит совпадения в выдаче каждого запроса и самого частотного, при этом в пределах одной группы может не быть общих URL.

    По методу Hard – ключи будут сравниваться между собой и объединяться в группу, только если будут найдены общие URL у всех в ТОПе. За дополнительную плату (0.05 руб за ключевое слово) можно провести проверку частотности.

    Методы кластеризации

    Шаг 3. Добавление запросов

    Далее следует добавить в систему ключевые фразы, которые необходимо кластеризовать. Это можно сделать вручную или импортировать из файла. Но оба способа одновременно использовать нельзя.

    Для ручного ввода предусмотрена специальная область, каждую фразу нужно вносить с новой строки. Если будете загружать из файла, оставьте его пустым – тогда внизу появится поле для импорта.

    Добавление запросов

    Шаг 4. Получение результатов

    Они отобразятся в виде таблицы. В ней указано общее количество добавленных запросов, число групп, которые получились и точность кластеризации.

    Результаты

    Галочкой можно отметить отдельные кнопки для выгрузки результатов. Данные экспортируются в форматах .xls и .csv с помощью соответствующей кнопки.

    Выборка для выгрузки

    Если нужны подробные результаты группировки, разверните любую группу, нажав на маленьких треугольник рядом с ней.

    Подробности группы

    При клике на название группы, можно просмотреть все запросы, которые попали в одну группу, частотности, если собирались и количество совпадений URL и ТОП-10 сайтов по конкретному запросу. А также выделенные слова из сниппета по запросу.

    Топ сайтов

    Важно. Выжимайте из бизнеса максимум с помощью нашей методички формата “фишечная стратегия”. В ней самый сок из сотен тренингов и книг по маркетингу и продажам. А также концентрат успешных действий. По ссылке скидка 50% в течение 4 часов, кликайте -> “Реальный маркетинг: 165 фишек + 33 основы

    как сделать кластеризацию вручную

    Способ подойдет, если ключевых запросов у Вас не много. Удобнее всего делать кластеризацию вручную в MS Excel. Для примера – создадим кластеры для интернет-магазина винтажной одежды.

    Шаг 1. Создайте таблицу в Excel и загрузите в неё ключевые запросы и их частотность.

    Таблица с ключевыми запросами

    Выделите для себя основные запросы с максимальной частотой.

    Запросы с максимальной частотой

    Шаг 2. В колонке с ключевыми запросами с помощью фильтра или сами найдите однокоренные слова, слова-синонимы и слова-интенты.

    Фильтр запросовПолучившийся список

    Шаг 3. Из получившихся групп запросов сформируйте кластеры.

    Сформированные кластеры

    подробнее о кластеризации

    Если не уверены в своих знаниях по кластеризации сематического ядра сайта или хотите их освежить, то читайте до конца. И первая мысль – чтобы правильно сгруппировать запросы, важно разобраться с понятием поискового интента.

    Интент – та потребность, с которой пользователь пришел на сайт: что именно ищет человек, вбивая данный запрос в поисковик.

    Один запрос может одновременно иметь несколько интентов, то есть пользователи могут иметь в виду абсолютно разные вещи, набирая одинаковый запрос в поиск. Например, “такси” – это непосредственно служба такси и фильм.

    При правильной кластеризации все запросы, посаженные на одну страницу для продвижения, должны отвечать одному и тому же интенту пользователя.

    1. Виды группировки

    Здесь поговорим о том, как можно группировать запросы, какой вариант и для каких тематик подойдет, а также расскажу о недостатках каждого из видов.

    – Логическое разбиение

    Просмотр запросов и предположение, что искал пользователь. Подходит для низко конкурентных тематик или если это совершенно новая тема. Соответственно, состав выдачи будет постоянно меняться и далеко не факт, что результаты в ней будут релевантны.

    Или в случае, если в семантическом ядре много низкочастотных запросов. Конкуренция низкая, у поисковиков мало данных о поведении пользователей – и качество выдачи низкое.

    В остальных случаях группировать запросы с точки зрения логики – не рационально, так как слишком высока вероятность ошибки и много времени понадобится на работу, особенно если ядро запросов большое.

    – Группировка по семантической схожести

    Запросы объединяются в одну группу, когда у них есть пересечение общих фраз. Например: “телефон купить”, “телефон обзор”, “телефон бу”. Телефон – общее слово, поэтому ключевые слова объединяются в одну группу.

    Этот вид группировки часто приводит к ошибкам, так как на одну страницу могут сесть одновременно коммерческие и информационные запросы, чего делать не стоит – выдача по ним разная.

    Также в этом случае не учитывается интент пользователя. Если страница не будет ему соответствовать, и пользователь увидит не ту информацию, что хотел найти – он закроет сайт и вернется в выдачу. Такие действия снижают конверсию и поведенческие факторы.

    – Группировка по ТОПам

    Более совершенный вид, так как разделение запросов на группы происходит через анализ ТОП-10 поисковой системы, через оценку схожести поисковой выдачи.

    Если в выдаче для двух разных запросов находятся общие документы, можно предположить, что их можно объединить. Чем больше пересечений, тем выше вероятность, что ключи можно продвинуть на одной странице. Если общих URL-ов нет, то скорее всего запросы нужно сажать на разные страницы.

    2. Методы

    Выше в инструкции мы уже говорили о методах группировки, но сейчас рассмотрим их подробнее. Различают следующие методы группировки семантики:

    1. Soft. Запросы сравниваются с главным ключевым словом (с большей частотностью), но не сопоставляются между собой. Если найдено заданное настройками число одинаковых результатов в выдаче, то запросы попадают в один кластер.

    Группы могут получиться слишком обширные, нужно обязательно корректировать результат вручную, чтобы получить данные, с которыми можно работать. Метод больше подходит для информационных проектов и тематик с невысокой конкуренцией, где точность группировки не так важна.

    2. Hard. Запросы сравниваются и с главным ключевым словом, и между собой. Из них те, по которым не найдено заданного количества одинаковых URL-ов в поиске, выпадают из группы.

    Это более точный метод, используется для сложных и высококонкурентных тематик. Количество совпадений определяется показателем “сила кластеризации”. Им задается минимальное число совпадений в выдаче у фраз, чтобы они объединялись в одну группу.

    3. Moderate или Middle. Это компромисс между Soft и Hard. Берется один самый частотный запрос, а все остальные сравниваются с ним по количеству общих URL-ов. В то же время инструмент сравнивает все ключевые слова друг с другом.

    Если количество общих урл превышает заданный порог или равно ему, то запрос добавляют в группу. По итогу в кластере все запросы будут попарно связаны друг с другом, но в разных парах URL могут отличаться.

    3. Способы

    Группировка может делаться вручную и с применением специальных программ.

    • Ручная. Занимает много времени, невозможна на крупных проектах, велика вероятность человеческого фактора;
    • Сервисы. Позволяют работать с большим объемом данных, но не всегда выдают качественный результат.

    Поэтому целесообразно использовать оба способа в комплексе: сначала делите запросы на группы автоматически, потом проверяйте полученные результаты вручную. Прежде чем пользоваться инструментом, разберитесь, по какому методу он работает, поскольку среди них встречаются те, что сравнивают схожесть только по словоформам, а не выдаче, например, Mc-Castle.ru или программа МегаЛемма.

    Важно. Если Вы настраиваете контекстную рекламу или только собираетесь это сделать, то обязательно используйте сервис Click. Он поможет сделать правильные настройки и сэкономит бюджет. К тому же в нем есть плюшки, которые помогут увеличить конверсию и привлечь больше клиентов. Кликайте и изучайте сервис -> Click

    4. Ошибки

    Теперь перейдем к самым часто совершаемым ошибкам при кластеризации запросов, а также расскажу, к чему они могут привести.

    • Смешивать коммерческие и информационные запросы;
    • Объединили несколько интентов на одной странице;
    • Запросы не соответствуют тематике сайта;
    • Семантическое ядро без синонимов ключевых слов и фраз;
    • Ключевые слова содержат ошибки;
    • Маленькое сем. ядро без низкочастотных запросов;
    • Слишком много ключей в одном кластере;
    • Дубли, нулевые, ошибки в словах, спецсимволы в семантике.

    Из-за таких ошибок охват собранной семантики низкий, тип содержания страницы не соответствует поисковому запросу, либо сразу несколько страниц сайта отвечают на запрос пользователя. Соответственно все это приводит к размытию релевантности и ухудшению поведенческих факторов.

    Лайфхак. Упростить кластеризацию семантического ядра можно, воспользовавшись трудами конкурентов. Для этого нужно спарсить запросы их сайта и отсортировать по URL. Подробности здесь.

    НАС УЖЕ БОЛЕЕ 32 000 чел.
    ВКЛЮЧАЙТЕСЬ

    коротко о главном

    Группировка необходима, чтобы наилучшим образом с позиции поисковых систем распределить запросы по посадочным страницам. Это один из важнейших этапов построения семантического ядра, ибо в случае ошибок все дальнейшие работы по оптимизации придется переделывать.

    Ни один сервис кластеризации, платный или бесплатный, не гарантирует идеальный результат. Полученные кластеры нужно анализировать, пробовать разные варианты точности кластеризации. Но из всех площадок мы советуем эти:

    И запомните, кластеризацию нельзя сделать один раз и навсегда. Выдача со временем меняется, где раньше был коммерческий запрос, через пару месяцев может оказаться информационный. Поэтому периодически пересматривайте семантику, удаляйте запросы, которые больше не актуальны, добавляйте новые и вносите необходимые правки на сайт.

    По теме:
    Массово проверить частоту запросов: 20 сервисов + как сделать
    ТОП-70 СЕО-инструментов (по категориям) + рейтинг от эксперта

    Изучение роли групп контента и поискового намерения в SEO

    Патенты показывают нам, какие стратегии Google выбирает для исследования и инвестирования, что, в свою очередь, дает представление о том, как лучше всего подготовить веб-сайт к индексации Google.

    Однако чтение патента иногда может быть непростым, поскольку наши предположения могут не соответствовать действительности, а сам патент, возможно, еще не был использован.

    Как сказал Гэри Иллис, некоторые люди воспринимают патенты Google как должное. Кроме того, есть только чистые предположения о том, как на самом деле работает внутренний поиск.

    Итак, с этой оговоркой, давайте посмотрим, какую информацию мы можем извлечь из патента «Оптимизированная классификация веб-доменов на основе прогрессивного сканирования с кластеризацией» (PDF).

    Патент

    В этом патенте предлагается механизм обработки и классификации URL-адресов с использованием различных методов сканирования для получения информации о них.

    Вместо того, чтобы классифицировать каждый URL по отдельности, создаются и уточняются тематические кластеры контента, а также учитываются такие элементы, как текстовый анализ и аналогичные темы контента.

    Тематические кластеры контента затем могут быть опубликованы в качестве ответов на поисковые запросы с использованием различных аналитических методов для определения и улучшения кластера, который наилучшим образом соответствует цели запроса, согласно патенту.

    Реклама

    Продолжить чтение ниже

    Для специалистов по SEO это довольно интересно, поскольку показывает, как можно использовать машинное обучение для понимания содержания веб-сайта, и, следовательно, предлагает способы обеспечить соответствие тематики и цели веб-сайта. правильно подбираются поисковыми системами.

    Процедура, предложенная патентом

    Механизм

    Предлагаемый механизм обработки URL описывается как состоящий из трех частей:

    • Поисковый робот.
    • Кластеризатор.
    • Издатель.
    Предлагаемый механизм состоит из трех частей

    1. Поисковый робот

    Поисковый робот выбирает хост (example.com), поддомен (other.example.com) и подкаталог (example.com/another).

    Объявление

    Продолжить чтение ниже

    Мы различаем два типа сканирования:

    • Прогрессивное сканирование : собирает данные с подмножества страниц, включенных в кластер в определенном домене.
    • Инкрементное сканирование : фокусируется на дополнительных страницах в пределах известной границы сканирования перед выборкой (поскольку новые страницы могут быть обнаружены во время сканирования).

    Чтобы избежать предвзятости в процессе сканирования, в патенте перечислены различные методы, которые могут быть использованы, в том числе:

    • Классификация просканированных страниц в один или несколько кластеров категорий и последующее определение того, публиковать ли эти страницы в качестве результатов для одна или несколько категорий.
    • Определение вспомогательной точки входа для случайного выбора следующей страницы для сканирования с использованием алгоритма выбора, который использует базу знаний, которая может включать прошлые данные сканирования.

    Когда новые имена хостов не обнаружены, цикл сканирования работает как бесконечный цикл, постоянно регулируя вероятность того, что каждая классификация страницы верна.

    Это говорит нам о том, что сканирование веб-сайта служит целям, выходящим за рамки обнаружения веб-страниц. Циклический характер сканирования, необходимого для определения категории страницы, означает, что страница, которую никогда не посещают повторно, может не рассматриваться Google как полезная.

    Изучение поведения обхода контента

    2. Кластеризатор

    Роль кластеризатора заключается в добавлении страниц в кластеры до тех пор, пока кластер не станет зрелым или пока не останется новых страниц для классификации.

    • Зрелые кластеры : Кластер считается зрелым, если категория кластера достаточно определена. Это может произойти при достижении определенных пороговых значений или когда разные кластеры, содержащие один и тот же URL-адрес, классифицируются одинаково.
    • Незрелые кластеры : Кластер считается незрелым, если указанные выше требования не выполняются.

    Классификация кластера как зрелого или незрелого сходится, когда новые имена хостов не обнаруживаются. Этот срок действия продлевается при обнаружении новых URL-адресов. Он также взвешивается на основе уровня достоверности, определяемого темпами роста кластера.

    Понятие кластеров выходит далеко за рамки определения того, какому кластеру может принадлежать конкретная страница. Кластеры соответствуют намерениям или целям веб-сайта. Следовательно, кластеризация дает:

    • Первичные кластеры : Twitter.com принадлежит к социальному кластеру, и его цель малоизвестна.
    • Вторичные кластеры : Раздел вакансий в LinkedIn — это подкластер, принадлежащий кластеру вакансий внутри основного социального кластера.
    • Географические кластеры : В зависимости от местоположения подписчика может применяться определенная кластеризация в зависимости от различных переменных, таких как тип бизнеса, требования политики и т. Д.

    Объявление

    Продолжить чтение ниже

    Это означает, что поиск намерения, будь то информационные (поиск работы), навигационные (поиск веб-сайта местной компании) или транзакционные (покупка обуви), могут играть все более важную роль: кластеры и подкластеры идентифицируют и группируют URL-адреса, соответствующие этим видам преднамеренных запросов.

    Поскольку кластеры состоят из связанного контента, анализ веб-сайта с использованием алгоритмических средств может указать вероятность соответствующей кластеризации на веб-сайте и помочь предсказать, где дополнительный контент может стимулировать рост кластера и увеличить количество зрелых кластеров.

    Анализ связанного контента: степень сходства по глубине страницы

    3. Издатель

    Издатель — это шлюз к контенту поисковой выдачи. «Публикация» используется для обозначения различных методов утверждения, отклонения или корректировки кластеров:

    Объявление

    Продолжить чтение ниже

    • Алгоритм кластеризации K-средних : Цель здесь — найти группы, которые связаны, но не имеют были явно помечены как связанные в данных.В случае кластеров содержимого каждый абзац текста образует центроид. Затем каждый коррелированный центроид будет сгруппирован.
    • Алгоритм иерархической кластеризации : Это относится к матрице сходства для различных кластеров. Матрица находит ближайшую пару кластеров для слияния, поэтому количество кластеров имеет тенденцию к уменьшению. Эту логику можно повторять сколько угодно раз.
    • Обработка естественного языка (например, текстовый анализ): Хотя НЛП не новость, в последнее время этому методу анализа уделяется много внимания.Он состоит из классификации документов с использованием более 700 общих сущностей.
    • Байесовские проверки : Они относятся к методу классификации сомнительных входных данных (часто подписи, но в данном случае URL-адреса) как совпадающей или несвязанной темы. Подтверждение совпадающего URL-адреса означает сравнение всех известных URL-адресов в кластере друг с другом для получения точного распределения. Несвязанный означает необходимость разместить сомнительный новый URL подальше от других, чтобы получить другое распространение. Соответствующий результат указывает на зрелый кластер, а несвязанный результат сигнализирует о незрелом кластере.
    • Байесовский классификатор : используется для минимизации риска ошибочной классификации. Классификатор Байеса определяет вероятность ошибки T. Поскольку эта функция T может варьироваться в зависимости от типа ошибки, классификатор определяет обменный курс.

    Система использует эти различные методы для настройки кластеров. Он пытается понять концепцию или тему страниц в кластере, а затем оценить, может ли кластер отвечать на поисковые запросы.

    Количество методов и более глубокий анализ затрудняют использование преимуществ системы с использованием старых стратегий, таких как размещение ключевых слов и наполнение ключевыми словами.

    С другой стороны, классический технический SEO-аудит жизненно важен для предоставления Google доступа к максимальному количеству полезных данных.

    Проведение технического аудита SEO

    Последствия для SEO

    Вот основные моменты, о которых следует помнить:

    Реклама

    Продолжить чтение ниже

    • Страницы могут быть частью нескольких кластеров, и кластеры могут быть связаны с несколько категорий.
    • Схема обхода контента может выполняться с использованием прошлых данных обхода.
    • Чем больше количество страниц, посвященных схожей теме, тем больше создается кластер.
    • Кластеры могут переходить из одного статуса в другой по мере обнаружения новых URL-адресов. (Этот патент на планирование обхода контента стоит прочитать.)
    • Скорее всего, для одного домена будет существовать несколько кластеров, поскольку домен может содержать несколько бизнес-целей и услуг. На кластеризацию также влияет географическое положение.
    • Издатель определяет, можно ли продвинуть кластер до максимального охвата: то есть в качестве ответа на поисковую выдачу.

    Это усиливает текущее понимание того, что цель поиска и наличие нескольких страниц контента по заданной теме могут использоваться Google для определения того, следует ли представлять веб-сайт как хороший ответ на поисковый запрос.

    Независимо от того, используется ли механизм этого патента, это показывает, что Google исследует и инвестирует в методологии, подобные тем, которые мы рассмотрели здесь.

    Итак, какую ценную и, надеюсь, действенную информацию мы можем извлечь из этого патента?

    Отслеживание поведения сканирования

    Google Сканирование URL-адреса используется не только для обнаружения страницы или проверки ее изменений.Его также можно использовать для классификации URL-адресов по назначению и теме и уточнения вероятности того, что URL-адрес подходит для данного поиска. Следовательно, отслеживание поведения сканирования может выявить корреляцию с рейтингом поиска.

    Реклама

    Продолжить чтение ниже

    Включить семантический анализ

    Категоризация веб-страниц основана на сходстве слов, образующих концепции на странице.

    Здесь использование таких методов, как NLP для анализа страниц, может быть полезно для группировки страниц на основе их отношений и сущностей.

    Поощряйте контентные стратегии вокруг тематических центров

    Создание страниц по одной и той же теме приведет к росту кластера до зрелости и, таким образом, будет способствовать продвижению страниц в поисковой выдаче.

    Другими словами, связанный контент по данной теме может быть выгодным, потому что он увеличивает вероятность того, что категоризация верна, и позволяет сделать кластер доступным в качестве ответа на поисковые запросы.

    Дополнительные ресурсы:


    Кредиты изображений

    Изображения в сообщениях № 1-2: Скриншоты, сделанные автором, февраль 2019 г.
    Изображения в сообщениях № 3-5: Oncrawl

    Cluster для Windows 10 загрузки — Бесплатная загрузка Cluster для Windows 10

    Размер дисков

    … диски или приводы. Эта информация включает в себя тип диска, размер кластера , размер , используемое пространство, свободное пространство, процент свободного места, общий объем … Файлы хранятся в виде целого числа кластеров сек (или единиц распределения). Размеры дисков могут быть основаны на …

    Цена: $ 4,99 / условно-бесплатная.

    DiskView

    … или, нажав на кластер , можно посмотреть, какой файл занимает его. Дважды щелкните, чтобы получить дополнительную информацию о файле, которому назначен кластер . …

    Цена: БЕСПЛАТНО / Бесплатное ПО

    Пакет HPC 2008 R2 SDK x64

    … этот SDK для планирования заданий на Microsoft Compute Cluster Server 2003 (CCS) x64. …

    Цена: БЕСПЛАТНО / Бесплатное ПО

    Пакет SDK для HPC 2012

    … этот SDK для планирования заданий на Microsoft Compute Cluster Server 2003 (CCS). …

    Цена: БЕСПЛАТНО / Бесплатное ПО

    Кластеризатор NeuroXL

    NeuroXL Cluster izer — это надстройка нейронной сети для Microsoft Excel.NeuroXL Cluster izer — это надстройка для Excel, разработанная, чтобы помочь … пользователю легко понять результаты. NeuroXL Cluster Iizer использует только проверенные алгоритмы и методы и объединяет …

    Цена: $ 99,95 / условно-бесплатная.

    Мастер разделов Профессиональная версия

    … Преобразуйте динамический диск в базовый диск и измените размер кластера . Бизнес-пользователи и системные администраторы могут использовать … для изменения размера и перемещения разделов, слияния раздела, изменения размера кластера , копирования раздела, копирования диска, создания, удаления и …

    Цена: $ 39.00 / Пробная версия

    Кинтекус

    … с помощью анализа собственных векторов / собственных значений. Может также выполнять сложный иерархический анализ кластера временных профилей концентрации с / без экспериментально полученных временных профилей концентрации. …

    Цена: $ 645.00 / условно-бесплатная

    диспи

    … одиночная машина (SMP) среди множества машин в кластере или сетке. Вычисления могут быть автономными программами … · параллельная обработка, · распределенные вычисления · кластер вычисления …

    Цена: БЕСПЛАТНО / Бесплатное ПО

    Плитка для фортепиано 2

    … вокруг света. Эта диверсия включает в себя широкий кластер музыки различных жанров. У вас никогда не будет недостатка в новых мелодиях. Вы будете …

    Цена: БЕСПЛАТНО / Бесплатное ПО

    Стрелок по пузырям

    … чтобы запустить следующий пузырь, чтобы сформировать кластер из 3 или более. Очистите доску, прежде чем она заполнится, чтобы перейти к следующему …

    Цена: БЕСПЛАТНО / Бесплатное ПО

    VEGA ZZ

    … = 1.073.741.824 vs. 224 = 16.777.216 цветов). Cluster рендеринг (WireGL). Трехмерное изображение молекулы: каркас с многовекторными связями, CPK, мяч и палка, палка, след …

    Цена: БЕСПЛАТНО / Бесплатное ПО

    UltraDefrag x64

    … Представляет вашу файловую систему визуально в виде карты кластера с цветовой кодировкой. Консоль — еще один вариант для тех, кто предпочитает командную строку. Это позволяет вам …

    Цена: БЕСПЛАТНО / Бесплатное ПО

    WinStars

    … еле видна там туманность, звезда , скопление или галактика? Вы когда-нибудь спрашивали … каталог из 10 000 туманностей, галактик и звездного скопления s; направление наблюдения, которое легко …

    Цена: БЕСПЛАТНО / Бесплатное ПО

    NCache Enterprise Edition x64

    … потому что нет единой точки отказа из-за реплицированного кластера ing. NCache Enterprise Edition в качестве увеличения кэша объектов … предоставляет графический инструмент для настройки и мониторинга кэшей кластера и ed с одного компьютера. NCache Enterprise Edition …

    Цена: $ 995.00 / Пробная версия

    Пакет NeuroXL

    … Excel. Он состоит из NeuroXL Predictor и NeuroXL Cluster izer. Надстройка NeuroXL Predictor — это система прогнозирования нейронной сети … достаточно мощная для самых требовательных профессионалов. NeuroXL Cluster izer — это надстройка для Excel, предназначенная для помощи …

    Цена: $ 149,95 / условно-бесплатная.

    Сторожевой таймер защиты от вредоносных программ

    … использует нашу платформу облачного сканирования, высокооптимизированный кластер серверов, на котором работает несколько антивирусных ядер с последними обновлениями. Это дает вам силу …

    Цена: $ 24,99 / условно-бесплатная.

    StarStrider

    … другие звезды. И вы можете увидеть впечатляющие галактики, скопление , , туманности и Млечный путь! Релятивистские эффекты пространства-времени … — Просмотрите большой выбор галактик, звездное скопление , скопление s и туманности, составленный из множества каталогов. …

    Цена: $ 22.00 / условно-бесплатная

    Пруд с лилиями

    … Названия аккордов на английском, французском или итальянском языках. · Cluster ; обозначения и знаки ритмической группировки · Раскрашивание произвольных элементов обозначений · Распространение поперечного посоха · …

    Цена: БЕСПЛАТНО / с открытым исходным кодом

    Поиск слов

    Проверьте свои знания языка и словарный запас в этой развивающей игре в слова! Ваша задача — искать слова по заданным значениям.Вы будете …

    Цена: БЕСПЛАТНО / Бесплатное ПО

    Программа для подсчета часто используемых фраз в Excel

    Это программное обеспечение предлагает решение для пользователей, которые хотят подсчитать, сколько раз указанные фразы встречаются в нескольких файлах Excel.Пользователь просто добавляет …

    Цена: $ 19,99 / условно-бесплатная.

    Расшифровщик X

    … из моделей PCR, PLS-R и 3-way PLSR · Cluster ing (K-Means) · Классификация (SIMCA, PLS-DA) · ANOVA и ANOVA поверхности ответа · Варианты проверки: поправка на рычаг, …

    Цена: БЕСПЛАТНО / Пробная версия

    DMDE — DM Disk Editor и восстановление данных

    … секторов, каталогов и файлов) и использовать настраиваемые шаблоны. Карта Cluster позволяет найти файл, расположенный в указанном кластере или секторе. Конструктор RAID предназначен для виртуального RAID …

    Цена: $ 20.00 / условно-бесплатная.

    DMDE — DM Disk Editor и восстановление данных

    … секторов, каталогов и файлов) и использовать настраиваемые шаблоны. Карта Cluster позволяет найти файл, расположенный в указанном кластере или секторе. Конструктор RAID предназначен для виртуального RAID …

    Цена: $ 20.00 / условно-бесплатная.

    MySQL

    … для обновления до MySQL Enterprise Edition или MySQL Cluster Carrier Grade Edition. …

    Цена: БЕСПЛАТНО / с открытым исходным кодом

    Бесплатная программа для восстановления данных Aidfile

    … отформатирован и даже изменен, например: кластер файловой системы был изменен. Среди прочего, Aidfile может восстанавливать данные в …

    Цена: БЕСПЛАТНО / Бесплатное ПО

    Сетевой монитор PRTG

    … мониторинг, мониторинг трафика и использования, анализ пакетов, отказоустойчивый кластер ing, углубленный анализ и краткие отчеты. Удобный веб-интерфейс … Высокая доступность гарантируется инновационным отказоустойчивым кластером , а удаленные зонды могут использоваться для простого …

    Цена: БЕСПЛАТНО / Бесплатное ПО

    Эджабберд

    … Исходное программное обеспечение: GitHub ОТКАЗ ОТ ОТКАЗОВ: Работает в кластере из коробки Все узлы активны: … параллелизм: 2 000 000 пользователей на 1 узле Кластер с последовательным хешированием для избавления от данных ..

    Цена: БЕСПЛАТНО / с открытым исходным кодом

    Лесопильный завод Professional

    … форматы файлов журналов * Несколько источников журналов, включая Cluster / Среды с балансировкой нагрузки через HTTP, FTP, локальный файл или командную строку * Single, 5, 10, …

    Цена: $ 199.00 / Пробная версия

    Aibase

    … Особенности кратковременной памяти человека: Они группируют связанную информацию визуально, а также с помощью ссылок и заметок. Они подчеркивают информацию цветами. Быстрая навигация, …

    Цена: $ 64.00 / Пробная версия

    Лесопилка Lite

    … запись журнала Переход к многопроцессорности и кластеру Обработка файлов журнала для быстрого создания базы данных с автоматическим обнаружением нескольких процессоров. Откройте для себя …

    Цена: $ 99.00 / Пробная версия

    Сохраненных загрузок

    Вы не сохранили никакого программного обеспечения

    Нажмите «Сохранить» рядом с каждым программным обеспечением.

    Хотите получать объявления о новых версиях вашего программного обеспечения по электронной почте или через программу чтения RSS?

    БЕСПЛАТНАЯ регистрация здесь!

    Стратификация риска послеоперационного кровотечения у пациентов с сердечным легочным шунтированием с использованием искусственной нейронной сети

    • © 2015 by the Association of Clinical Scientists, Inc.
    1. Энди Н.Д. Нгуен 1
    1. 1 Центр медицинских наук Техасского университета в Хьюстоне — Департамент патологии и лабораторной медицины, Хьюстон, Техас, США
    2. 2 Центр медицинских наук Техасского университета в Хьюстоне — Центр тяжелой сердечной недостаточности, Хьюстон, Техас, США
    1. Адресная переписка Ричарду С.П. Хуанг, доктор медицины, и Энди Н.Д. Нгуен, доктор медицины; Научный центр здоровья Техасского университета в Хьюстон, Департамент патологии и лабораторной медицины, 6431 Fannin Street MSB 2.292, Хьюстон, Техас 77030; телефон: (713) 500 5337; факс: (713) 500 0712; электронные письма: Richard.Huang.1 {at} uth.tmc.edu и Nghia.D.Nguyen {at} uth.tmc.edu

    Аннотация

    Прогнозирование риска кровотечения у пациентов с искусственным кровообращением (КПБ) играет жизненно важную роль в их послеоперационном ведении.Таким образом, искусственная нейронная сеть (ИНС) для анализа интраоперационных лабораторных данных для прогнозирования послеоперационного кровотечения. был создан. Использовали программное обеспечение JustNN (Neural Planner Software, Чешир, Англия). Эта ИНС была обучена с использованием 15 интраоперационных лабораторные параметры в паре с одной выходной категорией — риск кровотечения, определяемый как единицы перелитых компонентов крови через 48 часов. ИНС была обучена на первых 39 случаях CPB.Также был определен набор входных параметров для этой ИНС, и ИНС была подтверждена в следующих 13 случаях. Набор входных параметров включает пять составляющих: протромбиновое время, количество тромбоцитов, время реакции тромбоэластографа, D-димер и индекс коагуляции тромбоэластографа. Результаты валидации показать 9 случаев (69,2%) с точным соответствием, 3 случая (23,1%) с разницей в одну оценку и 1 случай (7,7%) с разницей в две оценки между фактическим использованием крови и прогнозируемым использованием крови.Насколько нам известно, это первая ИНС, разработанная для Стратификация риска послеоперационных кровотечений у пациентов с ХПК. Получив многообещающие результаты, мы начали использовать эту ИНС для стратификации риска. наши пациенты с CPB, и это помогло нам предсказать риск послеоперационного кровотечения.

    Введение

    В мае 2012 года в нашем патологоанатомическом отделении запущена новая услуга — гемотерапия.Бригада гемотерапии (HT), в состав которой входят гематопатологов, патологов банков крови и патологоанатомов, консультирует кардиохирургов и анестезиологов по вопросам коагуляции во время и после операции. Их пациенты проходят операцию искусственного кровообращения (КПБ). для вспомогательного аппарата левого желудочка (LVAD) и хирургии трансплантации сердца. Рекомендации HT анестезиологу и кардиохирурги основаны на лабораторных данных, которые проводятся в лаборатории STAT рядом с операционной.Интраоперационно, HT формулирует рекомендации по переливанию продуктов крови для анестезиолога и кардиохирургов на основе этого лабораторные данные и клиническое впечатление пациента от HT. В послеоперационном периоде HT берет на себя ведение кровотечение пациента, заказав препараты крови, которые помогают контролировать кровотечение [1].

    Во время послеоперационного ухода, HT обнаружила, что прогнозирование риска кровотечения играет жизненно важную роль в ведении пациентов.Следовательно, Члены HT стремились разработать компьютеризированную программу для прогнозирования послеоперационного кровотечения. Имея некоторый предыдущий опыт Используя искусственные нейронные сети (ИНС), HT экспериментировала с этой идеей. ИНС — математические / вычислительные программы. которые смоделированы на биологической центральной нервной системе (нейронные сети) и состоят из взаимосвязанных узлов (нейронов) который может распознавать закономерности и взаимосвязи в данных.ИНС может принимать входные / выходные данные и проходить обучение с учителем. с методом обратного распространения, или он может принимать только входные данные и проходить обучение без учителя с адаптацией или самоорганизацией метод [2]. В то время как ИНС используется в качестве инструмента в различных условиях за пределами медицины, в медицинских учреждениях она в первую очередь используется для классификации, распознавания образов, предсказания и моделирования [2]. Используя лабораторные данные пациентов с ХПБ в службе гемотерапии, хранящиеся на нашей мобильной вычислительной платформе, члены HT экспериментировала с построением ИНС с этими данными [3].В этой статье речь пойдет о том, как была построена ИНС.

    Материалы и методы

    Выбор пациентов

    Это исследование было одобрено Комитетом по защите человека (CPHS) Техасского университета медицинских наук. Центр в Хьюстоне.Лабораторные данные первых 52 последовательных пациентов с ХПБ, получавших гемотерапию (в период с мая 2012 г. и октябрь 2013 г.) были рассмотрены на предмет включения в этот проект. В частности, первый 31 последовательный пациент с CPB был исследованы на предмет включения в часть проекта NeuroXL Clusterization. После исключения 14 пациентов из-за неполного лабораторные данные, остальные 17 пациентов были включены в эту часть проекта.Затем из первых 52 последовательных Пациенты с CPB на службе гемотерапии, первые 39 последовательных пациентов были использованы для создания ИНС, а следующие 13 пациентов. последовательные пациенты использовались для проверки ИНС.

    Определение пороговых значений с помощью NeuroXL Clusterizer

    Перед созданием контролируемой ИНС необходимо было определить пороговые значения низкого, среднего и высокого потребления крови.NeuroXL Clusterizer (ООО «ОЛСОФТ», Москва, Россия) — дополнительная программа Microsoft-Excel (Microsoft Corporation, Редмонд, Вашингтон). для этой задачи был выбран подход нейронной сети без учителя (Кохонен) для кластеризации данных. 15 лаборатория параметры (лабораторные значения, наиболее показывающие тенденцию к кровотечению среди нескольких наборов результатов интраоперационных тестов, были выбранный) и параметр использования крови (определяемый как единицы продуктов крови, использованных в течение 48 часов с начала операции) для каждого из первых 31 пациента, последовавших за CPB в нашей службе гемотерапии, были введены в таблицу Excel.Для этого проекта одна единица продукта крови была определена как одна единица упакованных эритроцитов, одна единица афереза ​​тромбоцитов, одна единица свежих замороженная плазма или одна доза криопреципитата (объединенная из 10 отдельных единиц). Поскольку NeuroXL Clusterizer требует полных данных входные данные для всех обучающих случаев, всех случаев у первых 31 последовательного пациента с ХПБ, у которых отсутствовали все 15 лабораторных параметров были исключены, оставив 17 случаев для определения пороговых значений в NeuroXL Clusterizer.Далее установленный ранее NeuroXL Кластеризатор запускался из вкладки надстроек MS-Excel, а также возможность кластеризации входных данных (17 случаев со всеми 15 лабораторные параметры) на 3 группы (низкий, средний и высокий уровень использования крови).

    Создание ИНС с помощью JustNN

    После определения пороговых значений для низкого, среднего и высокого использования крови начался процесс построения ИНС.Для для этого мы использовали программное обеспечение JustNN (Neural Planner Software, Чешир, Англия), программу, которую можно скачать бесплатно. с http://www.justnn.com/ и устанавливается на любой компьютер под управлением Windows для построения нашей ИНС. Эта программа выполняет контролируемое обучение с вводом и выводом. точки данных с использованием метода обратного распространения. При запуске программы JustNN отображается экран, похожий на экран Excel. электронная таблица (рисунок 1), в которой можно создать ИНС, введя все данные и создав метки для строк и столбцов.В этой конкретной ИНС каждый В строке указан номер случая, за которым следуют лабораторные данные для этого конкретного случая. Каждый столбец помечен с конкретным лабораторным параметром, за которым следует конкретный лабораторный параметр для каждого отдельного случая. В последний столбец помечен как риск кровотечения или использования крови (выходная категория) и сопровождается риском кровотечения или использование крови для каждого отдельного пациента.Последний столбец (использование крови) был обозначен как выходная категория двойным щелчком мыши. любую ячейку в столбце и изменив ее на «output», тем самым обозначив весь столбец как выходной столбец. Другие столбцы связанные с лабораторными параметрами, обозначаются как «входные». После того, как все строки и столбцы были размечены и все лабораторные были введены данные и выходные данные из обучающих примеров, была создана новая сеть, щелкнув значок «создать новую сеть» (Рисунок 1).Затем сеть была обучена нажатием на значок «начать обучение» (рисунок 1). После того, как сеть была создана и ИНС обучена, был нажат значок «добавить запрос» (рис. 1) и была заполнена строка с надписью «запрос». Затем можно ввести лабораторные данные пациента, которого мы хотели запросить. в строку запроса. Затем компьютерная программа даст прогноз использования крови (риск кровотечения) на основе обученная ИНС в строке «запрос» в столбце «Риск».Дополнительные сведения о том, как создать ИНС с помощью JustNN можно найти в руководстве пользователя JustNN [4].

    Рисунок 1

    Сетка лабораторных показателей 39 пациентов и риска кровотечения в искусственной нейронной сети. Столбец 1: № 1-21 слева. номера пациентов с вспомогательными желудочковыми устройствами, а № 1–18 — это номера пациентов, перенесших трансплантацию сердца, перечисленные последовательно начиная с когда была проведена операция.Ряд 1: R (время реакции при тромбоэластографии), CI (индекс коагуляции при тромбоэластографии), Количество Plt (количество тромбоцитов), PT (протромбиновое время), РИСК (РИСК определяется как L [низкий, ≤13,5 единиц компонента крови], I [промежуточный, 13,5–22,5 единиц компонента крови] и H [высокий, ≥22,5 единиц]). Стрелка, вырасти значок новой сети; стрелка, значок начала обучения; круг, значок запроса.

    Первоначально ИНС была построена и обучена с использованием 15 интраоперационных лабораторных параметров (время реакции тромбоэластографии). [TEG-R], время реакции тромбоэластографии с модифицированной гепариназой [hTEG-R], тромбоэластография с модифицированной гепариназой-Альфа [hTEG-A], максимальная амплитуда тромбоэластографии с модифицированной гепариназой [hTEG-MA], расчетный процент тромбоэластографии с модифицированной гепариназой лизис [hTEG-EPL], тромбоэластография-лизис с модифицированной гепариназой через 30 минут [hTEG-Ly30], тромбоэластография-коагуляция с модифицированной гепариназой индекс [hCI], гемоглобин [Hgb], тромбоциты [Plt], протромбиновое время [PT], частичное тромбопластиновое время [PTT], фибриноген [Fib], тромбиновое время [TT], D-димер и антитромбин III [ATIII]) в сочетании с одной выходной категорией, риском кровотечения, i.е. использование крови). Многие наборы лабораторных данных получают во время операции (исходный уровень, фаза гемоконцентрации / фаза нагревания, фаза без помпы, и возможная фаза кровотечения). Точные тесты, заказанные для каждого набора лабораторных тестов, а также количество и сроки заказанных наборов основаны на клиническом впечатлении от HT. Однако для использования в строительстве было выбрано только одно лабораторное значение для каждого параметра. это ИНС.Здесь выбранный параметр является наиболее показательным для тенденции к кровотечению. Например, самый высокий PT / PTT значение и наименьшее количество тромбоцитов среди наборов результатов были выбраны. Для этого проекта риск кровотечения определяется как единицы компонентов крови (одна единица упакованных эритроцитов, одна единица афереза ​​тромбоцитов, одна единица свежезамороженной плазмы, или одна доза криопреципитата), перелитых через 48 часов от начала операции: низкая, средняя и высокая в зависимости от результаты кластеризации с помощью NeuroXL Clusterizer, как описано ранее.

    ИНС была обучена на первых 39 последовательных случаях CPB (21 имплантат вспомогательного устройства левого желудочка и 18 трансплантаций сердца) о нашей службе гемотерапии. Обучение проводилось с настройками программного обеспечения по умолчанию, включая скорость обучения 0,60, импульс 0,80, целевая ошибка 0,01 и значение по умолчанию для количества узлов [4]. Входные параметры пациента будут введены в поле ввода данных запроса, и ИНС будет давать прогноз относительно того, ожидалось, что пациенту потребуется низкое, среднее или высокое количество компонентов крови.Прогноз затем сравнили. к фактическому использованию компонентов крови в случае.

    Было принято решение выполнить поднабор данных для уменьшения входных размерностей (количества входных параметров). Отметить, ИНС автоматически вычисляет относительную важность каждого входного параметра. Это определяется как сумма абсолютных веса соединений от входного узла ко всем узлам в первом скрытом слое.Процесс подмножества был выполнен следующее:

    1. ИНС была обучена с использованием исходных 15 входных параметров и 14 параметров, которые имеют наивысшую относительную важность. были идентифицированы.

    2. Затем были обучены 14 основных параметров, а затем были определены 13 основных параметров.

    3. Этот процесс повторялся до тех пор, пока не были получены 5 лучших параметров.

    Параметры были ранжированы по убыванию общей относительной важности. Это определяется как сумма относительной важности конкретного параметра за 11 итераций подмножества, как описано выше.Подмножество было выполнено для определения соответствующих входные параметры, которые больше всего влияют на выходной параметр и по существу устраняют шум в данных. Это было тогда проверил, может ли уменьшение размеров повысить точность прогнозов.

    Аналогично исходным 15 лабораторным параметрам, новая ИНС только с пятью наиболее важными параметрами. (идентифицировано подмножеством) в паре с риском кровотечения было создано и обучено на тех же 39 случаях CPB.Эта ИНС тогда была подтверждено следующими 13 последовательными случаями CPB и будет тем, что мы хотим использовать на практике. Проверка была проведена путем запроса ИНС с входными параметрами пациента в проверочном наборе, который состоит из следующих 13 последовательных случаи. Входные параметры пациента в поле ввода данных запроса и ИНС дадут прогноз относительно того, ожидается, что потребуется низкое, среднее или высокое количество компонентов крови.Затем прогноз сравнивается с фактическим. использование компонентов крови в корпусе.

    Результаты

    Результаты неконтролируемого анализа NeuroXL Clusterizer показали, что средние значения использования крови для кластеров 1, 2, и 3 составляли 12,28, 14,6 и 26,8 единиц компонентов крови соответственно.Рассчитывались средние значения кластерных средних. и используется в качестве пороговых значений для низкого, среднего и высокого потребления крови. Например, средняя точка между кластерами 1 и 2 была приблизительно 13,5; низкий уровень использования крови был определен как <13,5 единиц. С помощью этого метода были определены следующие пороги: низкие (≤13,5 ед.), среднего (13,5–22,5 ед.) и высокого (≥22,5 ед.).

    Результаты подгруппы показали, что пятью наиболее важными параметрами являются тромбоциты, TEG-R, PT, D-димер и CI, в то время как Шесть наименее важных параметров — это фибриноген, VFN-ASA, Hgb, TEG-MA, PTT и TT (Таблица 1).Эти параметры были ранжированы по убыванию общей относительной важности. Это определяется как сумма относительной важности конкретного параметра за 11 итераций шагов поднабора. Следует отметить, что процесс проверки показал, что пять входов Параметр ИНС обеспечивает лучшую точность предсказания по сравнению с ИНС с более или менее пяти входными параметрами. Кроме того, пять основных параметров процесса поднабора отличались от и давали более точные результаты при сравнении с пятью первыми параметрами, которые ИНС рассчитывает автоматически.

    Таблица 1

    Общая относительная важность входных параметров.

    Результаты проверки ИНС с пятью входными параметрами с 13 пациентами в проверочном наборе показали 9 случаев с точным соответствием, 3 случая с разницей в одну градацию и 1 случай с разницей в два балла между фактическим использованием крови и прогнозируемой кровью использование.Разница в один балл определяется как несоответствие между низким и средним или средним и высоким. Двухуровневый разница определяется как несоответствие между низким и высоким. Результаты представлены в таблице 2.

    Таблица 2

    Результаты проверки

    Кроме того, для ИНС сходимость произошла после 2207 циклов, и итерации завершились со средней частотой ошибок 0.009827. Окончательная ИНС с пятью входными параметрами была создана всего с 11 узлами, включая пять входных узлов, пять скрытых узлов и один выходной узел (рисунок 2).

    фигура 2

    Визуальные схемы нашей нейронной сети. Первый столбец сфер представляет входные параметры, второй столбец сфер представляет скрытый слой, а последний столбец сфер представляет выходной параметр.Каждая сфера представляет собой узел и линии между сферами представляют собой веса связей между узлами.

    Обсуждение

    ИНС используются в различных сферах, таких как фармацевтика, инженерия и медицина.В медицинских учреждениях, ИНС широко использовались в качестве инструмента для прогнозирования таких заболеваний, как рак груди, гинекологические заболевания, рак легких и даже нарушения сна [5,6,7,8]. В недавнем исследовании пять переменных (возраст, тип операции и лучевой терапии, размер опухоли, регионарный лимфатический узел, отдаленные метастазы) были использованы для прогнозирования пятилетней выживаемости больных раком груди с помощью ИНС [5].

    Благодаря хорошим результатам валидации и сходимости, эта ИНС стала доступным инструментом для всех патологоанатомов и патологоанатомов. на службе гемотерапии.Программное обеспечение JustNN и файл данных для ANN были загружены на два компьютера Dell (Dell Inc., Round Rock, Texas), которые в настоящее время посвящены гемотерапии. Здесь пользователь может просто ввести пять входных значений в поля ввода данных строки запроса в ИНС, и ИНС даст прогноз того, у пациента низкий, средний или высокий риск кровотечения, связанный с низким, средним или высоким количеством компонентов крови использовал.Затем патолог гемотерапии может использовать эту информацию, чтобы помочь в лечении послеоперационного кровотечения в этих пациенты путем приготовления большего или меньшего количества продуктов крови с прогнозом того, сколько продуктов крови пациент может необходимость.

    С тех пор, как ИНС стала доступной, она была хорошо принята врачами гемотерапии и местными жителями. Легко доступен на ультрабуках Dell, предназначенных для HT, и их можно загрузить с http: // hemepathreview.com (section14-Гемотерапия на основе коагуляции) на любой компьютер под управлением Windows. ИНС широко используется в гемотерапии. услуга по послеоперационному ведению наших пациентов, позволяющая HT готовить нужное количество продуктов крови для каждого пациента. В будущем мы проведем исследование, чтобы измерить коэффициент использования ИНС и то, как часто это влияет на клинические решения.

    Преимущества ИНС в том, что она распознает сложные нелинейные отношения, требует меньшего размера выборки, чем использованная в формальной статистике, имеет возможность идентифицировать все возможные взаимодействия между входными данными и может использоваться с несколькими разные алгоритмы обучения [2,9].С другой стороны, главный недостаток ИНС в том, что она похожа на «черный ящик». Это означает, что как только оператор создает ANN программа автоматически определит веса каждого входа [9]. В отличие от моделей логистической регрессии, оператор не может управлять весом каждой из входных переменных, и это невозможно найти причинно-следственную связь с ИНС [9].

    При выборе программного обеспечения для построения этой ИНС было доступно множество вариантов.NeuroShell2 v3.0, BrainMaker v3.7, CAD / Chem v5.0 и NeuralWorks Professional II / Plus — это несколько примеров коммерчески доступного программного обеспечения ANN на рынке [10]. Выбор JustNN был в основном основан на предыдущем опыте HT с этим программным обеспечением в другом проекте. Это относительно проста в использовании, а ИНС была создана с использованием JustNN с небольшими усилиями.

    В конце концов, контролируемая искусственная нейронная сеть (ИНС) была обучена анализировать внутриоперационные лабораторные данные для прогнозирования послеоперационное кровотечение.Результаты валидации многообещающие с накопленной точностью — точное совпадение плюс разность в один балл. 92,3%. Разница в две оценки составила всего 7,7%. Неточность прогноза в небольшом количестве случаев, скорее всего, была в связи с тем, что статус коагуляции не является единственным определяющим фактором кровотечения у пациентов. Лабораторные исследования могут только измерить коагуляционный статус пациентов. Другой главный фактор, вызывающий послеоперационное кровотечение у кардиологических больных. хирургическое кровотечение, относящееся к анатомическому дефекту, который не был полностью устранен во время операции.

    Была также хорошая корреляция между входными категориями и выходными категориями окончательной ИНС, что было измерено несколькими другие меры ИНС. Обучение ИНС прекращается, когда максимальная ошибка сходится с минимальной ошибкой; за наших ИНС, сходимость произошла после 2207 циклов. Если корреляция между входной и выходной категорией отсутствовала в наборе данных сходимости не произошло бы, и обучение могло продолжаться бесконечно или очень долго, потому что программе необходимо изучить больше шаблонов, чтобы найти тот, который коррелирует с набором данных.Следовательно, чем дольше длится обучение чем меньше корреляция между входными и выходными параметрами, тем менее эффективна модель прогнозирования. В этой ИНС 2207 циклов относительно быстрые, для достижения сходимости требуется менее одной минуты.

    Возможность оценить количество компонентов крови, необходимых для послеоперационного ухода за пациентами с ХПБ, на основе этой ИНС был очень полезен.Одна из основных проблем в банках крови — управление запасами компонентов крови. Для пациентов с фенотип крови редкий, компоненты крови трудно найти. На поиск этих компонентов уходит больше времени. Много раз они замороженные единицы, требующие размораживания, а у размороженной крови более короткий срок хранения. Проблема здесь в том, чтобы определить, сколько компонентов для подготовки к послеоперационному ведению пациентов с редкими фенотипами крови. Если приготовлено слишком много компонентов, то компоненты могут быть потрачены впустую из-за более короткого срока хранения.С другой стороны, если готовится слишком мало компонентов, то есть есть риск того, что компоненты не будут готовы, когда это необходимо, и коагулопатия пациентов не будет облегчена, с последующим плохой исход. Это позволяет лучше прогнозировать, сколько компонентов потребуется в послеоперационном уходе за пациентом. и поэтому можно приготовить оптимальное количество компонентов.

    Хотя это довольно точный инструмент прогнозирования, основанный на наших результатах проверки и нашем опыте работы с этой ИНС, прогнозы не всегда на месте.Например, существует двухуровневая разница в фактическом использовании крови пациентом и прогнозируемое использование крови в проверочном наборе для нашей ИНС. Как обсуждалось выше, неточность, скорее всего, связана с тот факт, что помимо статуса коагуляции, хирургическое кровотечение является основным фактором кровотечения у пациентов. Еще одно ограничение этого ИНС заключается в том, что она только предсказывает общие единицы кровопотери и не дает разбивки по компонентам; тем не менее, это все еще дает общее представление о том, сколько всего продуктов крови потребуется пациенту, и очень полезен в этом отношении.

    В заключение, насколько нам известно, эта ИНС является первой, разработанной для стратификации риска послеоперационных кровотечений. больных ХПБ. Получив многообещающие результаты, мы начали использовать эту ИНС для стратификации риска наших пациентов с ХПБ. Больше данных для обучающий набор накапливается для дальнейшего повышения точности этой ИНС.

    то, что вам нужно для SEO — Инструмент анализа

    Инструментальный анализ

    Яндекс.Метрика
    Яндекс.Метрика собирает информацию об аудитории сайта (возраст, география, устройства), а также позволяет оценивать конверсии и поведение пользователей.

    Что дает счетчик:

    Источники трафика
    Посещаемость: посещения, посещения, возвраты на сайт.
    Поведение пользователя: клики, маршруты, целевые действия.
    Информация о пользователях: география, демография, устройства.
    Популярность определенных страниц, вход и выход страницы.
    Карта путей пользователей — вы можете визуально оценить, как они перемещаются по вашему сайту.
    Уникальные возможности:

    Webvisor — фиксирует действия некоторых пользователей на сайте.
    Карта кликов и карта ссылок покажут, с какими элементами сайта чаще всего взаимодействует пользователь.
    Интеграция с Яндекс.Директом и J.Market.
    Анализ форм — позволяет оценить удобство форм на сайте.

    Google Analytics
    Google Analytics — это аналитическая система Google. Отличается некоторой сложностью настройки, но при этом широким функционалом.

    Возможности:

    Позволяет оценить качество мобильного трафика.
    Анализируйте конверсию сайта.
    Оцените каналы трафика: реклама, СМИ, соцсети, поиск.
    Формирует отчеты в реальном времени.
    Анализирует работу ресурса и ее эффективность: скорость загрузки, маршруты пользователей.
    Главное преимущество — гибкость и тонкая настройка аналитики, но это требует опыта и навыков.

    AAАнализ конкурентов
    SSEMrush
    SEMrush — сервис для анализа конкурентов по критериям: SEO, платный трафик, социальные сети, контент и PR-мероприятия.

    Доступно специалистов:

    Анализ и оценка обратных ссылок.
    Анализ конкурентов.
    Мониторинг позиций по заявкам.
    Сбор списка запросов.
    Аудит технической оптимизации.
    Рекомендации по увеличению органического трафика.
    Основная цель сервиса — анализ конкурентов. Вы можете узнать:

    Бюджеты рекламных кампаний.
    Запрашивает, чтобы ваши конкуренты продвигали в Google AdWords.
    Стоимость клика, объем трафика и текст объявления конкурента.
    Посещаемость сайта и позиция по определенным ключевым словам.

    SEMrush позволяет найти сабвуферы — в базе около 95 миллионов слов. Вы можете сравнить несколько сайтов по определенным параметрам.

    AA анализ ссылочного веса
    AAhrefs
    Ahrefs — сервис для анализа оптимизации внешнего сайта. Несмотря на то, что он коммерческий, ряд функций доступен бесплатно.

    Страны и доменные зоны, которые чаще всего ссылаются на ваш сайт.
    Искать обратные ссылки по времени публикации.
    Список доменов, на которые чаще всего ссылаются.
    Данные о ссылках на поддомены.
    Страницы сайта, на которые чаще всего ссылаются.
    Экспорт и просмотр списка привязок.
    Найдите источники и подсчитайте количество обратных ссылок на сайт.
    FFast Trust
    Fast Trust — это сервис, который собирает около 30 параметров сайтов из различных источников. Наиболее важными из них являются доверие к сайту и рассылка спама, которые оцениваются по 100-балльной шкале. Также он оценивает посещаемость, статистику из Alexa, SeoMoz, MajesticSEO, доступность в каталогах, статистику и PR, социальную активность и данные по ссылкам из сервиса Solomono.

    Основное приложение — экспресс-анализ сайтов-доноров, что позволяет существенно сэкономить время. Затем выбранные сайты можно будет оценить визуально. Есть система фильтрации, позволяющая создавать образцы по определенным параметрам, сортировать и группировать результаты.

    Программа позволяет скачать весь список обратных ссылок и проверить их качество. Затем вы можете использовать инструмент Disallow Links.

    Для анализа оптимизации
    GGoogle Page Speed ​​Insights
    Google Page Speed ​​Insights — это сервис для быстрого тестирования различных версий страниц сайта.Анализирует скорость загрузки, оптимизацию технической части, дает рекомендации по улучшению результатов. Отдельно оценивает версии для компьютеров и мобильных устройств.

    GGtmetrix
    Gtmetrix — один из популярных инструментов для измерения скорости загрузки сайта.

    Показатели:

    Скорость загрузки страницы и отдельных ее элементов.
    Время загрузки.
    Размер страниц.
    Оценивает каскадный трафик.
    Измеряет количество HTTP-запросов.
    NNetpeak Spider
    Netpeak Spider — программа для быстрого комплексного аудита сайта.

    Основные функции:

    Выявляет около 60 ошибок внутренней оптимизации.
    Проверяет 50 параметров SEO.
    Анализирует исходящие и входящие внутренние ссылки.
    Находит повторяющиеся страницы, метатеги, заголовки.
    Проверяет неработающие ссылки и перенаправления.
    Вычисляет внутренний вес страницы.
    Главное преимущество — гибкая настройка сканирования с учетом роботов.txt, Meta Robots, X-Robots-Tag, Canonical. Обеспечивает экспорт в Excel.

    Xenu’s Link
    Xenu’s Link Sleuth — это служба, которая позволяет вам находить неработающие ссылки, отсутствующие метатеги и проверять другие параметры, влияющие на оптимизацию.

    Находит изображения с незаполненными тегами Alt.
    Проводит внутренний аудит ссылок.
    Выполняет поиск страниц со слишком большим количеством исходящих ссылок.
    Показывает страницы со слишком большим временем размещения и отклика.
    Найдите повторяющиеся заголовки страниц в метаописаниях.
    Создает карту сайта в формате XML для статических страниц.
    Основная задача программы — поиск битых ссылок среди фреймов, скриптов, стилей и изображений, проверка ссылок HTML и PHP.

    Kkomplexnye tools
    CCoolakov tools
    Coolakov tools — это бесплатный кластеризатор запросов для создания семантического ядра. Разбивает запросы на группы. По схожести запросов из ТОП-10 Яндекс определяет, какие запросы нужно продвигать на одной странице, а для каких лучше выделить отдельную страницу.

    AArsenkin tools
    Arsenkin tools — инструмент для выделения LSI-фраз. Позволяет найти дополнительные слова, которые стоит использовать для полного раскрытия темы. Кроме того, он предлагает ряд дополнительных инструментов.

    Возможности:

    Проверить наличие повторяющихся фрагментов.
    Проверьте повторную оптимизацию и фильтры аффилированности.
    Определяет понижение рейтинга сайта из-за действия алгоритма Минусинск от Яндекса, который определяет сайты, которые используют покупку seo-ссылок для продвижения сайта.
    Разбор подсказок от выдачи «Яндекс».
    Скачивание сайтов с первой страницы «Яндекса».
    Визуальный редактор HTML.
    Разбор заголовков конкурентов из выпуска.
    Лемматизация текста.

    SE Ranking
    SE Ranking — это платформа для полного аудита и анализа сайта. Незаменим для владельцев бизнеса, агентств, маркетологов и специалистов по поисковой оптимизации.

    Основные возможности:

    Мониторинг — позволяет отслеживать любые изменения на вашем сайте и сайтах конкурентов.
    Аудит поисковой оптимизации — показывает, насколько оптимизирована страница по ключевому запросу.
    Поисковые запросы — сервис обещает более 3 миллиардов слов и советов
    Создание маркетингового плана — вы можете ставить цели пользователей, анализировать сайт, использовать контрольный список для SEO.
    Кластеризация — позволяет профессионально группировать поисковые запросы.
    Инструменты для SMM — авто публикация и анализ ключевых показателей в социальных сетях.
    Одна из «фишек» — дизайнер отчетов, который значительно упрощает работу специалистов над большим количеством проектов.

    WWebmasta
    Помимо обычных услуг по анализу и аудиту сайта, Webmasta имеет в своем арсенале ряд уникальных инструментов.Например, генераторы — они сильно упрощают работу. Есть генераторы метатегов, ключевых слов с сайта и из текста, HTML-ссылки, ссылки для бирж, файл robots.txt. Вебмаста также позволяет анализировать поведенческие факторы, внешние и внутренние ссылки, перенаправления сайтов, просматривать заголовки серверов.

    PR.CY
    PR.CY — это большой набор различных инструментов для проверки и анализа веб-сайтов. Услуга предназначена не только для SEO-специалистов. Полезные функции здесь найдут копирайтеры, маркетологи, веб-мастера, администраторы сайтов и серверов.

    Для SEO-специалиста следующий набор инструментов:

    Анализ сайтов по основным показателям.
    Контент-анализ и проверка на уровне оптимизации.
    Анализ Zipf — позволяет определить естественность текста.
    Аудит ссылки — внутренний и внешний.
    Посмотрите на сайт глазами поискового робота.
    Проверка положения
    Проверка скорости загрузки сайта и др.
    Сервис позволяет автоматически отслеживать свой сайт и сайты конкурентов.Это позволяет отслеживать изменения и быстро к ним адаптироваться.

    «Пиксель Тулс»
    «Пиксель Тулс» — набор инструментов для комплексного анализа сайта. Большинство из них бесплатны. Сервис позволяет оценить оптимизацию сайта (внутреннюю и техническую), провести аудит и аналитику, собрать семантическое ядро ​​и позиции, проверить сайт на наличие различных фильтров.

    Возможности:

    Проверить фильтры: на повторную оптимизацию, для аффилиатов, комплексная проверка.
    Работа с семантическим ядром: поисковые подсказки, данные Яндекс.Wordstat, список запросов от Яндекс.Вебмастера.
    Анализ запросов: коммерциализация, лемматизация, локализация и геозависимость, группировка запросов по ТОПу, оценка интенсивности, поиск и удаление дубликатов.
    Анализ внешней оптимизации: непот-фильтр, ссылочный вес, социальные сигналы.
    Проверка технической части: XML карта сайта и ответы сервера, размер и скорость загрузки документов, поиск зеркал и поддоменов.
    Инструменты внутренней оптимизации: подготовка технического задания для копирайтеров, проверка уникальности текста, семантический анализ, оценка качества оптимизации, анализ структуры сайта, SEO-теги для URL, визуальный HTML-редактор.
    Плюсы: множество инструментов в одном, облачный сервис — работает везде, не запрашивает ограничения по капче и XML, есть набор бесплатных инструментов, есть встроенные чек-листы.

    Международный журнал научных и технологических исследований

    ДОБРО ПОЖАЛОВАТЬ В IJSTR (ISSN 2277-8616) —

    Международный журнал научных и технологических исследований — это международный журнал с открытым доступом из различных областей науки, техники и технологий, в котором особое внимание уделяется новым исследованиям, разработкам и их приложениям.

    Приветствуются статьи, содержащие оригинальные исследования или расширенные версии уже опубликованных статей конференций / журналов. Статьи для публикации отбираются на основе экспертной оценки, чтобы гарантировать оригинальность, актуальность и удобочитаемость.

    IJSTR обеспечивает широкую политику индексирования, чтобы опубликованные статьи были хорошо заметны для научного сообщества.

    IJSTR является частью экологически чистого сообщества и предпочитает режим электронной публикации, поскольку он является «ЗЕЛЕНЫМ журналом» в Интернете.

    Мы приглашаем вас представить высококачественные статьи для обзора и возможной публикации во всех областях техники, науки и технологий.Все авторы должны согласиться с содержанием рукописи и ее представлением для публикации в этом журнале, прежде чем она будет отправлена ​​нам. Рукописи следует подавать в режиме онлайн


    IJSTR приветствует ученых, заинтересованных в работе в качестве добровольных рецензентов. Рецензенты должны проявить интерес, отправив нам свои полные биографические данные. Рецензенты определяют качественные материалы.Поскольку ожидается, что они будут экспертами в своих областях, они должны прокомментировать важность рецензируемой рукописи и внести ли исследование в знания и продвинуть как теорию, так и практику в этой области. Заинтересованным рецензентам предлагается отправить свое резюме и краткое изложение конкретных знаний и интересов по адресу [email protected]

    .

    IJSTR публикует статьи, посвященные исследованиям, разработкам и применению в области инженерии, науки и технологий.Все рукописи проходят предварительное рецензирование редакционной комиссией. Вклады должны быть оригинальными, ранее или одновременно не публиковаться где-либо еще, и перед публикацией они должны быть подвергнуты критическому анализу. Статьи, которые должны быть написаны на английском языке, должны содержать правильную грамматику и правильную терминологию.


    IJSTR — это международный рецензируемый электронный онлайн-журнал, который выходит ежемесячно. Цель и сфера деятельности журнала — предоставить академическую среду и важную справочную информацию для продвижения и распространения результатов исследований, которые поддерживают высокоуровневое обучение, преподавание и исследования в области инженерии, науки и технологий.Поощряются оригинальные теоретические работы и прикладные исследования, которые способствуют лучшему пониманию инженерных, научных и технологических проблем.

    Патент США на метод и устройство для поиска информации Патент (Патент № 6,631,367, выданный 7 октября 2003 г.)

    ПОЛЕ

    Изобретение относится к области поиска информации и, в частности, к поиску информации по меньшей мере в одной компьютерной сети.

    ИСТОРИЯ

    Searching — одно из самых популярных приложений, доступных в компьютерных сетях, таких как Интернет и корпоративные интрасети. Традиционно существует два варианта предоставления поисковых приложений. Первый вариант — приобрести или лицензировать проприетарную технологию поиска. Установка и обслуживание технологии поиска на частных серверах может оказаться очень дорогостоящим. Кроме того, заказчик может быть «привязан» к технологии конкретного поставщика, что затрудняет или делает невозможным создание интегрированных поисковых решений или смену поставщика.Второй вариант известен как модель поставщика услуг приложения (ASP). В модели ASP технология поиска устанавливается и обслуживается на серверах третьей стороны, поставщика услуг. Поисковые запросы к серверам клиента вызывают функцию поиска ASP, которая выполняет поиск на сторонних серверах и возвращает результаты. Опция ASP может упростить смену поставщиков услуг поиска и может снизить начальные расходы и текущие затраты на обслуживание.

    Ни один из традиционных вариантов поиска не позволяет выбрать наилучшую доступную технологию поиска для конкретного поискового запроса.Это отсутствие гибкости приводит к универсальному подходу к поиску. Приложения, созданные с использованием технологии поиска, не могут разрабатываться независимо от производителя. Существует потребность в стандартных протоколах технологий межпоиска, чтобы находить и смешивать лучшие технологии поиска для обслуживания конкретного запроса.

    ЦИФРЫ

    Изобретение можно лучше понять со ссылкой на следующие фигуры в свете прилагаемого описания. Однако настоящее изобретение ограничено только объемом формулы изобретения в заключительной части описания.

    ОПИСАНИЕ

    В нижеследующем описании многочисленные ссылки на «один вариант осуществления» или «вариант осуществления» не обязательно относятся к одному и тому же варианту осуществления, хотя могут. На фигурах одинаковые номера относятся к одинаковым элементам.

    Настоящее изобретение обеспечивает пользовательский интерфейс, организацию данных и протоколы для поиска информации с использованием технологий поиска, подходящих для поиска информации. Протоколы включают средства для передачи запросов поисковым системам и возврата результатов.Протоколы дополнительно включают средства для обмена возможностями поисковых систем, информацией профиля пользователя, журналами поиска и другой информацией, которая должна быть описана.

    Здесь используются различные ссылки на термин «поисковая машина». Под «поисковой машиной» следует понимать любую технологию, способную искать информацию в соответствии с полученным запросом.

    РИС. 1 показан вариант 100 осуществления системы в соответствии с настоящим изобретением. Клиентская система 103 взаимодействует с менеджером 108 поиска серверной системы 107.Взаимодействие может происходить посредством веб-браузера 104 при обмене данными с веб-сервером 106. Клиентская система 103 может содержать компьютерную систему, такую ​​как персональный компьютер, карманный компьютер, портативный компьютер, телевизионная приставка и так далее. В общем, любое устройство, содержащее процессор и память для хранения инструкций и данных для выполнения и манипуляции процессором, может служить в качестве клиентской системы 103.

    Веб-браузер 104 позволяет клиенту 103 связываться с серверами компьютерной сети, такой как Интернет или корпоративная интрасеть.Клиент 103 может отправить поисковый запрос на сервер 107 через веб-браузер 104. Поисковый запрос может иметь определенные свойства, такие как область поиска. Одним из примеров области поиска является ограничение по дате, например чтобы возвращать только документы, имеющие дату создания позже определенной даты, или до определенной даты, или между датами и т. д. Другими примерами области действия являются автор контента и язык контента, и это лишь некоторые из них.

    Поисковый запрос может быть получен веб-сервером 106, который пересылает запрос менеджеру 108 поиска.Менеджер поиска 108 может связывать категории контента с запросом. Менеджер поиска 108 может идентифицировать подходящую поисковую машину, такую ​​как поисковая машина 110, для обслуживания запросов, имеющих связанные категории контента. Менеджер поиска 108 может дополнительно идентифицировать конкретные домены поисковых машин, которые подходят для категорий контента и других свойств запроса (таких как область действия). Менеджер поиска 108 может передавать запрос поисковой машине 110, используя различные протоколы, которые будут обсуждаться.Поисковая машина 110 может выполнять поиск и возвращать результаты поиска менеджеру 108 поиска, снова через протоколы. Хотя показана только одна поисковая машина 110, менеджер поиска может передать запрос множеству поисковых машин.

    Менеджер поиска 108 отличается от поисковой машины 110 тем, что менеджер поиска не может напрямую выполнять фактический поиск. Менеджер поиска 108 может связываться с одной или несколькими поисковыми системами, которые выполняют поиск.Менеджер поиска 108 также может выполнять поиск, хотя это не обязательно.

    РИС. 2 показан вариант 200 осуществления системы в соответствии с настоящим изобретением. Менеджер поиска 108 может идентифицировать и связываться с множеством поисковых машин, подходящих для обслуживания конкретного запроса. Менеджер поиска 108 может выполнить это, например, путем определения возможностей поиска поисковой машины 110. Эти возможности могут включать в себя категории и объемы контента, для которых поисковая машина 110 лучше всего подходит.Эти возможности могут быть идентифицированы как набор свойств, возвращаемых диспетчеру поиска 108 поисковой машиной 110. Эти свойства могут помочь диспетчеру 108 поиска в установлении пригодности технологии поиска для обработки конкретного запроса. Менеджер поиска 108 может аналогичным образом запрашивать другую поисковую машину 202. Фактически, поисковые машины 110 и 202 могут быть частью набора поисковых машин, запрашиваемых менеджером поиска 108.

    Поисковая машина 110 может связываться с поисковыми машинами 204 и 206, чтобы выяснять их свойства, используя протоколы в соответствии с настоящим изобретением.Поисковая машина 110 может применять свойства, возвращаемые машинами 204 и 206, чтобы удостовериться, являются ли одна или обе подходящие кандидаты для обслуживания конкретных запросов. Поисковая машина 110 может запрашивать у машин 204 и 206 их свойства и может включать их в свои собственные свойства в ответ на запрос свойств от менеджера 108 поиска.

    Когда свойства различных поисковых машин известны, менеджер 108 поиска может идентифицировать, какие конкретные поисковые машины наиболее подходят для обслуживания конкретного запроса для поиска информации.Например, поисковая машина 110 может быть идентифицирована на основе свойств, возвращаемых диспетчеру 108 поиска. Используя протоколы в соответствии с настоящим изобретением, диспетчер 108 поиска может отправить запрос на поиск информации в поисковую машину 110, возможно, с указанием домена или ограничения области поиска. Поисковая машина 110 может пытаться обслуживать запрос, а также может передавать запрос поисковым машинам 204 и 206. Поисковые машины 204 и 206 также могут пытаться обслуживать запрос и могут возвращать результаты поиска в поисковую машину 110.Поисковая машина 110 может объединить эти возвращенные результаты поиска с результатами своей собственной попытки обслуживания запроса, и объединенные результаты запроса могут быть возвращены диспетчеру поиска 108. Все это может быть выполнено с использованием протоколов в соответствии с настоящим изобретением. . Менеджер поиска 108 может возвращать полные результаты поиска клиенту 103, который инициировал запрос.

    РИС. 3 показан вариант 300 осуществления схемы отображения в соответствии с настоящим изобретением. Схема 300 отображения может использоваться для определения набора поисковых машин, которые будут использоваться для обслуживания запроса для поиска информации.Выбор 304 категорий контента производится из набора 302 доступных категорий контента. Категории контента — это широкие классификации контента; например, «спорт», «погода», «финансы» и т.д. Выбранные категории 304 контента отображаются на набор 306 подходящих поисковых машин и, возможно, также домены для нахождения контента в этих категориях контента. Преобразование выбранных категорий 304 контента в подходящие поисковые машины 306 может выполняться различными способами, например, посредством таблицы поиска или базы данных, которая отображает категории контента в поисковые машины.База данных и / или справочная таблица могут поддерживаться в актуальном состоянии с использованием протоколов для запроса свойств доступных поисковых систем, когда это необходимо. Набор из одного или нескольких доменов может быть связан с конкретной поисковой машиной. Когда менеджер 108 поиска принимает запрос, выбранные категории контента могут быть связаны с запросом. Выбранные категории могут соответствовать определенным поисковым системам и доменам, наиболее подходящим для запроса.

    Поисковые домены могут содержать набор из одного или нескольких серверов, которые обеспечивают физическое хранилище документов.Домены могут иметь определенные атрибуты, такие как брендинг, авторские права и политики доступа. Другие атрибуты доменов могут включать доступность домена для поиска и диапазон дат для документов домена (например, область действия). Категории контента могут не зависеть от области поиска. Например, одна категория контента «спорт» может включать несколько или несколько сотен доменов. Некоторые домены могут быть внутренними по отношению к организации (частью интрасети), тогда как другие из этих доменов могут находиться во всемирной паутине (Интернете).Набор базовых веб-доменов для «спорта» может меняться ежедневно вместе с соответствующими поисковыми системами, но категория контента останется «спорт».

    Можно запросить у поисковой системы свойства связанных с ней доменов, такие как имя и описание домена, количество документов или других источников информации, доступных в домене, диапазон дат, связанных с информация о домене, а также информация об авторских правах и бренде домена.

    Категории контента могут быть организованы в таксономию. ИНЖИР. 4 показан вариант осуществления 400 таксономии категорий в соответствии с настоящим изобретением. Категории 402 контента высокого уровня включают финансы, здоровье и спорт. В категорию «Финансы» входят другие категории 404, включая акции, облигации и ИРА. Другими словами, категории могут быть родителями других категорий. Категория запасов включает в себя категории запасов полупроводников, запасов потребительских товаров и запасов биотехнологии 406.Конечно, разделение на более тонкие категории может продолжаться бесконечно. В одном варианте осуществления, помимо отношений родитель-потомок, категории также могут быть связаны с другими связанными категориями в дополнение к родителям, детям и братьям и сестрам.

    РИС. 5 показывает систему в соответствии с настоящим изобретением. Система 509 администрирования включает в себя приложение 502 администратора и веб-браузер 504. Администратор 509 может связываться через веб-сервер 106 с сервером 107. Система 509 администратора может использоваться для настройки таксономии категорий контента для менеджера 108 поиска.Система 509 администратора может дополнительно использоваться для настройки отображения категорий контента на домены. В одном варианте осуществления таксономия и сопоставления могут храниться на сервере 107. Конечно, таксономия и сопоставления также могут храниться в другом месте, в том числе распределенным между серверами сети. Например, каждая доступная поисковая система может хранить свои собственные категории контента и соответствующее сопоставление категорий контента с доменами, которые затем могут быть объединены для создания полной таксономии.

    Администратор 509 также может использоваться для связывания политик доступа с поисковыми машинами и / или поисковыми доменами. Например, для некоторых поисковых доменов может потребоваться процедура аутентификации или определенные условия оплаты, прежде чем поиск будет продолжен. Кроме того, администратор 509 может использоваться для определения набора из одной или нескольких поисковых систем и / или доменов по умолчанию для конкретных категорий контента. Пользователь может после отправки запроса изменить эти значения по умолчанию, явно указав набор поисковых систем и / или доменов.Администратор 509 также может использоваться для установки политик для порядка, в котором результаты поиска должны возвращаться из нескольких поисковых систем и / или доменов, и того, как несколько наборов результатов поиска должны быть объединены (удаление дубликатов и т. Д.).

    Менеджер поиска 108 может считывать информацию профиля пользователя из базы данных 506 профилей. Информация профиля для пользователя может содержать информацию о предыдущих поисках, представленных пользователем, а также о предпочтениях пользователя. Используя информацию профиля, менеджер 108 поиска может дать поисковой машине 110 команду обновить результаты предыдущих поисков пользователя.Обновленные результаты предыдущих поисков пользователя могут храниться в кэше 508 контента. Пользователь может получить доступ к этим результатам, которые затем могут отражать более недавно доступную информацию. Веб-поисковый робот 510 может использоваться для управления обновлением предыдущих результатов поиска на периодической основе.

    Информация профиля пользователя также может предоставляться поисковым машинам, так что, когда поисковый запрос получен от конкретного пользователя, поисковые машины могут определять, сколько результатов поиска возвращать, как интерпретировать различные условия поиска и так далее.

    РИС. 6 показан вариант 600 осуществления системы в соответствии с настоящим изобретением. Агент 602 может использоваться для облегчения выбора категорий контента, наиболее подходящих для запроса. Клиент 103 генерирует запрос 604. В качестве примера можно указать «запасы оптоволокна». Конечно, это всего лишь один из возможных вопросов. Запрос передается агенту 602, который содержит интеллектуальные данные для установления соответствующих категорий контента, подкатегорий, подкатегорий и т.д., наиболее подходящих для запроса.Используя упомянутый интеллект, агент 602 идентифицирует подходящие категории 304 из набора доступных категорий 302 контента. Например, выбранная категория 1 контента может содержать «полупроводниковые запасы», а выбранная категория 3 контента может включать «телекоммуникационные запасы». Выбранные категории 304 контента могут быть сопоставлены с технологиями поиска и доменами поиска, наиболее подходящими для обслуживания категорий «запасы полупроводников» и «запасы электросвязи».

    Агент может дополнительно применять информацию профиля пользователя из базы данных 506 профилей при определении выбранных категорий контента.Например, информация профиля пользователя может указывать на то, что пользователь часто отправлял запросы, чтобы найти информацию о чемпионате мира по футболу. Таким образом, получив запрос, включающий термин «футбол», агент будет склонен выбирать категории контента, относящиеся к «футболу», по сравнению с категориями, относящимися к футболу в стиле Национальной футбольной лиги.

    В одном варианте осуществления объем поиска может быть ограничен информацией, имеющей конкретную дату создания или диапазон дат создания — например, документы, созданные не позднее июля.1, 2000. Область поиска также может быть ограничена контентом из одного или нескольких конкретных доменов.

    РИС. На фиг.7 показан вариант 700 сервера в соответствии с настоящим изобретением. Вариант 700 осуществления содержит процессор 702, связанный с контроллером 704 посредством шины 722 процессора, обычно называемой лицевой шиной. Контроллер 704 шины связан с памятью 706 через шину 724 памяти. Контроллер 704 шины также связан с различными периферийными устройствами, такими как запоминающее устройство 714 большой емкости, сетевой интерфейс 726 и дисплей 708 через шину 728 ввода-вывода.Сетевой интерфейс 726 предоставляет устройству 700 доступ к таким сетям, как Интернет или корпоративные интрасети. В памяти 706 хранится вариант 734 осуществления программного обеспечения для выполнения операций управления поиском, и / или операций веб-сервера, и / или операций агента, включая обмен данными с поисковыми системами и сопоставлениями, как здесь описано и в соответствии с настоящим изобретением. Программное обеспечение 734 может храниться в памяти 706 в форме, подходящей для доступа и выполнения процессором 702. Архивированная загружаемая форма 736 программного обеспечения 734 может храниться в запоминающем устройстве 714 большой емкости для загрузки в память 706 для выполнения процессором 702.Запоминающее устройство 714 большой емкости может содержать любую форму энергонезависимой памяти, включая жесткие диски, приводы CD-ROM, приводы ZIP, дискеты и так далее.

    Память 706 обычно представляет собой форму оперативной памяти (RAM), такой как DRAM, флэш-память, SDRAM и так далее. Память 706 подает хранящиеся в ней инструкции программного обеспечения 734 в процессор 702 для выполнения. Выполнение варианта 734 программного обеспечения процессором 702 может привести к процессу для выполнения управления поиском, и / или операций веб-сервера, и / или операций агента, включая сопоставления и связь с поисковыми машинами, как описано здесь и в соответствии с настоящим изобретением.

    Конечно, специалисты в данной области техники поймут, что другие варианты осуществления могут содержать и программное обеспечение, аппаратные средства и встроенные программы, или любую их комбинацию, чтобы также выполнять операции по настоящему изобретению.

    Теперь будут описаны подробности одного варианта осуществления протоколов связи между поисковыми менеджерами и поисковыми машинами, а также поисковыми машинами и поисковыми машинами. Связь между этими компонентами может включать в себя соединение, обмен сообщениями, кодирование, формат сообщения, синтаксис сообщения и схему сообщения.Подключение — это процесс установления связи. Обмен сообщениями включает в себя обмен конкретными сообщениями, предназначенными для вызова определенных действий и ответов. Кодирование — это способ представления данных в сообщениях с целью обеспечения безопасности, размера и надежности. Формат сообщения — это организация данных высокого уровня, которой соответствует сообщение, например Extensible Markup Language (XML) или Extensible Style Sheets (XLS). Синтаксис сообщения — это грамматика и правила анализа формата сообщения.Схема сообщения — это особые интерпретации полей для формата сообщения.

    В варианте осуществления соединение и кодирование могут соответствовать протоколу передачи гипертекста (HTTP) или протоколу защищенной передачи гипертекста (HTTPS), хотя, безусловно, возможны другие протоколы соединения и кодирования. Формат сообщения может включать XML, XLS или широко доступные, но потенциально более ограниченные форматы команд HTTP GET и HTTP POST. Обмен сообщениями может включать в себя, среди прочего, сообщения для инициирования поиска, возврата результатов поиска, возврата журналов поисковой активности и возврата доменов и возможностей поисковых систем.Синтаксис сообщения может включать в себя хорошо известный синтаксис сообщения URL-адреса Интернета (далее синтаксис Интернета), подмножество синтаксиса Интернета (далее Internet Light), язык структурированных запросов (SQL) и многие другие. Схема сообщения будет варьироваться в зависимости от формата и синтаксиса конкретного сообщения. Один вариант синтаксиса и схемы сообщения более подробно описан в таблицах 1 и 2.

    Протоколы могут включать средства для получения журналов поисковой активности из поисковых систем. Журналы поисковой активности содержат свойства предыдущих поисков, выполненных поисковой системой.Свойства могут включать текст или условия поискового запроса, тип возвращаемых данных (документы, статистика и т. Д.), Время и дату поиска, клиент, выполняющий поисковый запрос, и т. Д.

    Как описано ранее, может оказаться целесообразным объединить результаты поиска, возвращаемые несколькими поисковыми системами. Как правило, каждая поисковая система присваивает уникальный (уникальный в пределах возвращаемых результатов) идентификатор каждому «документу», например контейнер информации в возвращаемых результатах. Однако, когда результаты возвращаются из нескольких поисковых систем, эти идентификаторы могут конфликтовать, то есть могут относиться к большему количеству документов в объединенных результатах, даже если документы разные.В одном варианте осуществления идентификатор поисковой машины комбинируется с идентификатором документа для каждого возвращенного документа, так что в объединенных результатах нет повторяющихся идентификаторов, даже когда идентификаторы документов из отдельных поисковых систем сталкиваются.

    Также возможно, что результаты поиска из первой поисковой машины могут идентифицировать документ, который идентичен документу, идентифицированному в результатах, возвращаемых из второй поисковой машины. Они известны как дубликаты. Каждая поисковая система может присвоить документу другой идентификатор.Таким образом, документ будет идентифицирован в объединенных результатах поиска с использованием двух разных идентификаторов. Чтобы исправить эту возможность, в одном варианте осуществления проверяются унифицированные указатели ресурсов (URL), связанные с каждым возвращенным документом. Когда URL-адреса двух документов идентичны, один из документов может быть удален из списка результатов поиска или иным образом идентифицирован как дубликат.

    В одном варианте осуществления связь между менеджерами поиска и поисковыми машинами, а также между поисковыми машинами осуществляется посредством точки входа общего интерфейса шлюза (CGI).Эта точка входа может иметь «стандарт», например предварительно определенное имя, например «/ _search». Эта точка входа может быть расположена в корневом каталоге веб-сервера, который работает через порт 80, способами, хорошо известными в данной области техники. В поисковую систему может быть отправлено следующее сообщение:

    http://www.search_engine.com/_search?query=“ фраза «

    Здесь search_engine.com — это доменное имя поисковой системы. «Запрос» — это ключевое слово, указывающее, что следующий за ним текст определяет запрос.См. Таблицу 2 для получения дополнительных сведений об одном варианте схемы сообщения запроса, включая определения ключевых слов и их значения.

    В одном варианте осуществления схема сообщения запроса может поддерживать больше, чем просто запросы для поиска и возврата документов, соответствующих определенным критериям. Схема может поддерживать сообщения для возврата набора доменов, к которым может обращаться поисковая машина, для возврата журналов активности из поисковой машины, для возврата категорий, поддерживаемых поисковой машиной, и статистики поиска, чтобы назвать лишь некоторые из возможностей.

    В таблице 1 ниже более подробно описан один вариант осуществления схемы сообщения запроса.

    Предопределенный действительный Ключевое слово Описание Ценности Дефолт запрос Обозначает строку поиска. синтаксис Определяет синтаксис Интернет Интернет строка поиска передана в internet_light, sql, поле запроса.текст формат Определяет формат xml, html_compatible, когда вернул результаты. html_compatible, GET и POST используются xsl_reference, для обмена сообщениями; xsl_render xml в противном случае xsl Определить таблицу стилей xsl использовать при форматировании возвращаемые результаты — xls_ *. Если формат & равно; xsl_reference, затем ссылка на это таблица стилей будет включены в заголовок документ.Если формат & равно; xsl_render, затем документ xsl style лист используется для форматирования результаты перед возвратом полученные результаты. объекты Определите тип search_statistics, Для ненулевого поиска: вернуть данные. Некоторые типы список_документов, search_summary, можно комбинировать; для search_variables, список_документов, например, search_summary raw_documents, search_variables.и список_документов, когда обработанный_доку- Для нулевого поиска (пусто вместе, укажите, что ments, data_sources, или отсутствует поиск сводка соответствия search_servers нить): документы должны быть search_summary и вернулся. search_variables. url Ограничьте набор искомых документы для тех, кто находится в место, начинающееся с этот фрагмент URL.min_date / Ограничить поиск документов max_date к диапазону дат. дней назад Ограничить поиск документов тем, кто создал ряд дней назад от текущего Дата. принести Ограничьте поиск набором один или несколько указанных документы. идентификатор сессии Обозначает сеанс поиска. search_id Определяет конкретный поиск.Может быть несколько поисков в поисковая сессия, каждая с другим идентификатором. ID пользователя Идентифицирует пользователя (участника отправка поиска Сообщения). passthrough_data Данные в кодировке XML, которые быть переданным в поисковый движок. Эти данные может иметь двигатель- специфический синтаксис и схема в XML формат.user_data_buffer Данные в кодировке XML, которые может быть передан в поисковая система, модифицированная, и вернулся как часть результаты, достижения. Опять же, это данные могут иметь двигатель- специфический синтаксис и схема в XML формат. preprocess_xsl Применить файл XSL к форматировать сообщение запроса перед отправкой в поисковый движок.preprocess_url Применить CGI или другое программа, вызываемая через URL для форматирования запроса сообщение перед отправкой в поисковую систему. Как много Определяет количество 10 соответствующие документы (или другие типы данных) взамен полученные результаты. смещение, пропустить Определяет количество 0 соответствующие документы (или другие типы данных), чтобы пропустить перед возвращением полученные результаты.Полезный для реализация «следующего X результаты поиска »и «Предыдущий поиск по X результаты ». источники Определяет набор доменов * Обычно все домены. искать. * Указывает что весь доступный поиск домены должны быть искал. max_time Максимальное время в 500 мс миллисекунды, которые могут пройти до обыска сообщение истекло.Определения синтаксиса сообщений: Интернет Указывает, что сообщение соответствует хорошо известный синтаксис URL-адресов в Интернете. internet_light Указывает, что сообщение соответствует подмножество синтаксиса URL-адресов в Интернете. sql Указывает, что сообщение соответствует Синтаксис SQL.текст Сообщение текстовое. Определения формата: xml Формат — XML. html_compatible Формат совместим с HTTP GET и команды POST. xsl_reference Определяет связанную таблицу стилей XLS с документом. xsl_render Указывает, что возвращаемые результаты должны быть отформатирован с помощью таблицы стилей XLS связанный с документом до возвращение.Определения типа возвращаемых данных: search_statistics Возвращать статистику результатов поиска (количество согласованных документов, документ чины и т. д.). Статистика может быть доступна для каждый домен, который ищется. список_документов Вернуть набор совпадающих документов либо сырые или предварительно обработанные.search_variables Верните поисковые запросы. raw_documents Вернуть соответствующий комплект документов без предварительной обработки документов. обработанные_документы Вернуть соответствующий комплект документов после первая обработка документов. Обработка зависит от поисковой системы и может включать такие операции, как выделение совпадающие поисковые запросы, перевод документы на другой язык, обобщение или сжатие документов, и изменение формата документов.источники данных Вернуть набор идентификаторов доступных поисковые домены. search_servers Возвращает набор доступных поисковых систем. Результаты возврата будут включать первичный поиск двигатель; это поисковая система, которая первоначально получает сообщение запроса от клиент.

    В таблице 2 ниже указан один вариант осуществления синтаксиса и схемы строки поиска в соответствии с настоящим изобретением.

    Элементы Имея в виду слово / фраза Любое слово, кроме символов специальных терминов определено ниже. Фраза: любое количество слов, разделенных пробелом, запятыми или другим согласованным разделитель. «фраза» Искать «фразу» & плюс; срок Этот срок требуется для матча −term Этот термин исключен (e.грамм. не должен присутствовать) для соответствие Имя поля: термин Найдите термин в поле, указанном по имени поля. (допустимые имена полей: URL, заголовок, описание, дата, ключевые слова, alt) срок и срок Оба термина должны присутствовать для матча срок или срок Любой термин может присутствовать для матча не срок Сопоставьте документы, не содержащие этого термина (срок) Сначала проанализируйте термин перед объединением с окружающим термины.& lsqb; & lsqb; текст & rsqb; & rsqb; Передавать текст в поисковую систему без применения правила синтаксического анализа.

    Поля заголовка, описания, даты, alt и ключевых слов являются хорошо известными полями метаданных, которые могут быть включены в документы для облегчения поиска. Поле URL-адреса описывает URL-адрес документа.

    Хотя некоторые особенности изобретения были проиллюстрированы, как описано в данном документе, многие модификации, замены, изменения и эквиваленты теперь будут очевидны специалистам в данной области техники.Поэтому следует понимать, что прилагаемая формула изобретения предназначена для охвата всех таких вариантов осуществления и изменений, которые соответствуют истинному духу изобретения.

    GMCA Поиск

    Созданный в феврале 2005 года тремя бывшими сотрудниками PayPal и проданный Google за 1,65 миллиарда долларов в ноябре 2006 года, YouTube позволяет миллиардам людей находить, смотреть и публиковать первоначально созданные видео. Каждое видео загружается с небольшим фрагментом HTML, что позволяет легко встраивать файлы на любой веб-сайт.Каждую минуту на сайт загружается около 60 часов новых видео, у YouTube восемьсот миллионов уникальных пользователей в месяц, четыре миллиарда видео транслируются в день, и он является доминирующим поставщиком онлайн-видео во всем мире с долей рынка около 43 процентов. Третий по посещаемости сайт в Интернете в 2013 году после Google и Facebook, он также предлагает около 4000 полнометражных шоу от более чем 60 партнеров и более 6000 фильмов.


    К началу страницы


    WhitePages.ком

    WhitePages.com — ведущий поставщик услуг онлайн-справочников для потребителей. Сеть WhitePages.com состоит из WhitePages.com ( www.whitepages.com ) , WhitePages.ca ( www.whitepages.ca ) , PhoneNumber.com ( www.phonenumber.com ) ) и 411.com ( www.411.com ) . Компания также предоставляет решения для частных торговых марок и поддерживает разделы на белых страницах более 1300 интернет-партнеров, включая YellowPages.com и две крупнейшие телефонные компании страны. Сеть WhitePages.com, насчитывающая более 7,2 миллиона уникальных пользователей в месяц, является вторым по посещаемости независимым сайтом White Pages в Интернете.

    Поиск людей Обратный поиск Обратный поиск адреса

    К началу страницы


    Verizon Superpages

    Verizon Superpages , часть огромной семьи Verizon, предлагает доступ к каталогам как для людей, так и для предприятий.Они издают ведущий в мире каталог желтых страниц для печати. Благодаря более чем столетнему опыту и распространению более 112 миллионов каталогов, Verizon может помочь вам найти любого! Ищите людей или ищите информацию по более чем 13 миллионам компаний по всей стране, включая карты и маршруты проезда. Веб-сайт SuperPages предлагает поиск людей , обратный поиск , желтые страницы , обратный поиск бизнеса , расширенный поиск , код AREA 9095 или ZIP-код AREA , ОБЛАСТЬ или почтовый индекс обратный поиск , поиск предприятий на карте , Схема проезда , поиск по категориям , поиск по городу 1, 1, университет search и Международные объявления .


    К началу страницы

    Поиск по сайту GMCA (или в сети)

    Поиск FreeFind

    FindFree дает вам возможность выполнять поиск на веб-сайте ассоциации сообщества Galt Mile или во всем Интернете. Возможности веб-поиска превосходны, но возможности поиска по сайту уникальны.Система мониторинга FreeFind ChangeDetection ™ позволяет отслеживать изменения содержимого страницы, а затем уведомляет вас об изменении страницы! Это потрясающе для мониторинга поиска по сайту. Нажав «Что нового», вы можете ограничить поиск теми элементами, которые изменились с момента вашего последнего посещения! Они также предлагают прекрасную вторичную карту сайта.

    К началу страницы


    Уровень сайта whatUseek

    Первоначально получивший название whatUseek intrasearch и запущенный в 1998 году, siteLevel является ведущим в отрасли решением для поиска по сайту, предоставляемым whatUseek.В основе уровня сайта лежит его мощная функция поиска. siteLevel обладает множеством функций поиска, в том числе фразировкой, логическими запросами, гибким повторным поиском, мощным структурированием URL-адресов, оптимизацией рейтинга релевантности, поисковыми фрагментами, словами перехода и многим другим.

    К началу страницы


    Поиск по сайту Bing

    Поиск по сайту Bing — запись Билла Гейтса в поисковой системе сайта derby.Сеть Bing — это суперпортал веб-поиска Редмонда. По мере того, как Bing наталкивается на Google за желанный статус поставщика «Numero Uno», он предлагает полный набор функций поиска, включая изображения, видео, карты, новости, путешествия, переводчика и погоду. Как и все «Майкрософт», даже результаты «проприетарные»!

    К началу страницы


    Yippy GMCA Поиск по сайту

    Yippy Search , ранее известный как Clusty, начал свою деятельность в Питтсбурге, штат Пенсильвания, в 2004 году, когда компания Vivísimo, производящая программное обеспечение для поиска, решила перенести свою отмеченную наградами технологию поиска в Интернет.

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *