Язык запросов Яндекса и недокументированные операторы поиска
Профессионал может творить небольшие фокусы, зная язык запросов Яндекса; знание некоторых операторов просто необходимо в работе, на кое-каких из них построена работа различных seo-сервисов. Опишу здесь пока что самые основные и в каких случаях они могут быть полезны; статья будет обновляться по мере обнаружения новых возможностей в работе. Правда, тут следует сделать оговорку, что операторы срабатывают не всегда, особенно если их используется несколько одновременно.
Язык запросов
Запрос в кавычках. Примеры использования:
«пластиковые окна высокого качества»
(Ищет документы, содержащие запрос со словами и их формой именно в таком порядке, в каком они введены)
Также кавычки полезны в том случае, если мы хотим выяснить естественность словоформы – насколько биграмма, триграмма и так далее естественны и встречаются в русском языке.
Запрос в кавычках + звёздочка. Звёздочка используется только в составе оператора «кавычки». Примеры использования:
«пластиковые окна * качества»
(Ищет документы, содержащие запрос со словами и их формой именно в таком порядке, в каком они введены; при этом вместо звёздочки может быть любое пропущенное слово)
«недорого * * окна»
(Здесь пропущено два слова)
Амперсанд. Примеры использования:
петербургские & окна
(Ищет документы, содержащие слова «петербургские» и «окна» в одном предложении)
петербургские & окна & пластиковые
(Ищет документы, содержащие слова «петербургские», «окна» и «пластиковые» в одном предложении)
Людкевич && Севальнев
(Ищет документы, содержащие слова «Людкевич» и «Севальнев» в рамках одного документа)
Людкевич && Севальнев && Латыпов
(Ищет документы, содержащие слова «Людкевич», «Севальнев» и «Латыпов» в рамках одного документа)
Плюс. Примеры использования:
Севальнев +анкоры
(Ищет документы, содержащие слова «Севальнев» и «анкоры» в рамках одного документа)
Полезно, когда нам нужно, чтобы в документе обязательно содержалось слово, перед которым мы поставим плюс.
Тильда. Примеры использования:
Манчини ~ Интер
(Ищет документы, где может быть слово «Интер», но не в одном предложении с «Манчини»)
Манчини ~~ Интер
(Ищет документы, где есть слово «Манчини», но нет слова «Интер»)
Разделитель, известный также как оператор «ИЛИ». Примеры использования:
матрац | матрас
(Ищет документы, содержащие слова «матрац» или «матрас»)
Мы тут можем также увидеть, какое слово чаще употребляется.
матрац | матрас | кровать
(Ищет документы, содержащие слова «матрац», «матрас» или «кровать»)
пластиковые окна | металлические двери
(Ищет документы, содержащие фразы «пластиковые окна» или «металлические двери»)
Этот оператор позволяет:
- Узнать, какое написание слова встречается чаще (мы это по топ-10 поймём)
- Сравнить релевантность сайта (например, при проверке наличия фильтра)
- Сравнить конкурентность запросов.
Оператор выбора релевантности. Примеры использования:
Интер << Манчини
(Ищет документы, где есть слова «Интер» и «Манчини», но релевантность найденных документов будет рассчитываться только по слову «Интер»)
Также известен как неранжирующее «И». Допустим, мы вводим запрос «мебель», и имеем под него выдачу. Если мы хотим добавить слово, но чтобы выдача не перемешалась, мы используем неранжирующее «И» — мебель << бу.
Восклицательный знак. Ищет по слову, сохраняя заданную в запросе словоформу и заглавную букву. Примеры использования:
!Лосиных
(ищет документы, где есть слово «Лосиных» именно в этой форме и с заглавной буквы)
!!день
(ищет только формы слова «день», исключая из выдачи результаты по слову «день» в значении «девать»)
Если у вас, допустим, запрос по заготовке лосиных рогов, и вы не знаете, как написать ЧПУ – можно ввести запрос [!лосиных] и посмотреть на урлы выдачи.
Скобки. Группирует условия. Пример использования:
Адриано ~~ (Челентано | Лейте)
(ищет документы, содержащие «Адриано», но не содержащие «Челентано» или «Лейте»)
Документные операторы
title – поиск текста в заголовках страниц. Если запрос состоит из нескольких слов, их следует взять в скобки. Примеры использования:
hyundai title:бирюза
(Ищет документы, где на странице есть «hyundai», а в title – «бирюза»)
title:пикачу
(Ищет документы с «пикачу» в title)
title:(seo пацаны)
(Ищет документы с несколькими словами, в данном случае «seo» и «пацаны», в title)
site – поиск по сайту. Ищет по всем поддоменам и страницам указанного сайта. Примеры использования:
покемоны site:rg.ru
(Ищет документы, содержащие «покемоны», на указанном сайте и его поддоменах)
site:rg.ru
(Ищет вообще все проиндексированные документы на указанном сайте и его поддоменах)
host – поиск по сайту, исключая поддомены. Примеры использования:
игры host:mail.ru
(Ищет документы, содержащие «игры», на указанном домене, исключая поддомены)
url – поиск по документу или по группе страниц с заданным URL. Если в конце адреса стоит *, то учитываются страницы, адрес которых начинается с заданного URL. Если URL содержит один из символов ‘, «, (, ), то его нужно искать в кавычках. Примеры использования:
выставка url:kudago.com
(Ищет, есть ли «выставка» на указанной странице)
выставка url:kudago.com/msk/*
(Ищет, есть ли «выставка» на страницах, начинающихся на kudago.com/msk)
эрмида url:»ru.wikipedia.org/wiki/Эрмида_(Каштру-Дайре)»
(Ищет «эрмида» на указанной странице. Поскольку запрос содержит один из символов ‘, «, (, ), то URL заключен в кавычки)
Еще один забавный момент – если ввести в поисковой строке адрес страницы с оператором url перед ним, а в адресную строку полученного результата добавим &how=tm, то мы увидим дату первой индексации документа.
inurl – поиск ограничивается группой страниц, URL которых содержит заданный фрагмент. Примеры использования:
пластиковые окна inurl:okna
(Ищет страницы, содержащие «пластиковые окна», а также фрагмент «okna» в URL)
Это нам позволит узнать, сколько есть страниц с ЧПУ по запросу.
mime – позволяет искать определенный тип документа (PDF, DOC, PPT, XLS, RTF, SWF). Примеры использования:
валлерстайн (mime:pdf)
(Ищет «валлерстайн» в документах PDF)
Довольно удобно, если вы много читаете. Можно ввести, например, запрос seo mime:pdf и получите кучу pdf-файлов по теме. Подсказываю, как это можно использовать в своих целях – когда у вас есть сайт определённой тематики, вы можете искать литературу по ключевым словам, и либо рерайтить её, либо брать оттуда идеи.
lang – ищет на страницах на определённом языке (русском – ru, украинском – uk, белорусском – be, английском – en, французском – fr, немецком – de, казахском – kk, татарском – tt). Примеры использования:
промокоды lang:uk
(Ищет «промокоды» на страницах на украинском языке)
domain – ищет на страницах, URL которых содержит заданную фразу. Примеры использования:
пластиковые окна domain:okna
(Ищет «пластиковые окна» на страницах, название домена которых содержит «okna»)
date – ищет по дате. Есть три варианта использования – указать определённую дату, указать диапазон дат или указать дату раньше/позже/раньше или равно/позже или равно. При указании даты идёт сначала год, затем месяц, затем число. Примеры использования:
Манчини date:20141110
(Ищет «Манчини» на страницах, созданных 10 ноября 2014)
Манчини date:20141101..20141110
(Ищет «Манчини» на страницах, созданных с 1 ноября 2014 по 10 ноября 2014)
Манчини date:<20141101
(Ищет «Манчини» на страницах, созданных раньше 1 ноября 2014)
Манчини date:>20141101
(Ищет «Манчини» на страницах, созданных позже 1 ноября 2014)
Манчини date:>=20141101
(Ищет «Манчини» на страницах, созданных 1 ноября 2014 или позже)
Кроме того, используя этот оператор, можно примерно вычислить дату текстового апдейта. А если, допустим, страница выпала из индекса и через полгода вернулась, будет ли она с помощью оператора date находиться по старой дате попадания в индекс или уже по новой? Тут логично предположить, что определенный срок поисковик хранит информацию о странице, но с течением времени ее удаляет. Поэтому если она вернулась в индекс, допустим, через пару месяцев, то дата может быть показана старая. А если только через пару лет — скорее всего, дата индексации будет новой.
rhost – позволяет искать исключительно по поддоменам. Примеры использования:
регион rhost:ru.yandex.*
(Ищет «регион» по всем поддоменам yandex.ru, исключая при этом сам yandex.ru)
@ — убирает из выдачи сайты, попавшие туда благодаря технологии Спектр. Ставится в конец запроса. Пример использования:
сэндвич панели@
(Ищет «сэндвич панели», исключая результаты, подмешанные по спектру — на момент написания статьи это были инструкции по монтажу)
Недокументированные операторы Яндекса
Есть также операторы, не указанные в хелпе Яндекса, но действующие (вроде как). Срабатывают не всегда, их могут также и прикрыть, но уж сообщу, чтоб были.
intext – ищет только по тексту, игнорируя анкор-файл. Примеры использования:
intext:(пластиковые окна)
То есть по сути, мы можем отсортировать результаты именно по текстовой релевантности.
inlink – используется для поиска в ссылках на документы.
inlink:(пластиковые окна)
Типа как inanchor в Гугле.
idate – ищет только среди тех документов, которые обновили дату индексации. Можно использовать в связке с другими операторами, чтобы узнать, какие документы переиндексировались после изменений.
idate позволяет увидеть только те страницы, которые обновили дату индексации, а оператор date убирает документы, которых раньше в индексе не было и они попали туда первый раз.
znet.ru
Оператор |
Описание |
Синтаксис |
Пример |
+ |
Поиск по документам, в которых обязательно есть запрашиваемое слово. Можно использовать в одном запросе несколько раз |
слово1 +слово2 |
Пушкин +улица В этом случае будут найдены сайты, на которых обязательно есть слово «улица» и может содержать «Пушкин» |
“ |
Поиск по цитате |
“слово1 слово2 … словоn” |
“я вас любил…” Будут найдены документы, в которых есть данная цитата |
* |
Ищет по цитате с пропущенными словами (словом) Один оператор соответствует одному пропущенному слову Используется только вместе с оператором “ |
“слово1 * слово2 … словоn” (оператор разделяется пробелами) |
“Мой дядя * * правил” Отобразятся те документы, в которые есть данная цитата с пропущенными словами |
& |
Поиск документов, в котором слова, объединенные этим оператором, будут в одном предложении Допускается использование сразу несколько операторов & |
слово1 & слово2 (оператор разделяется пробелами) |
Байкал & озеро В поиске будут представлены результаты, в которых данные слова встречаются в одном предложении. |
&& |
Поиск слов в пределах одного документа Допускается использование сразу несколько операторов && |
слово1 && слово2 (оператор разделяется пробелами) |
Россия && США В поиске появятся документы, в которые есть данные слова независимо от их расстояния |
<< |
Поиск слов в пределах одного документа. При этом приоритет в релевантности будет применятся к слову, которое стоит перед оператором |
слово1 << слово2 (оператор разделяется пробелами) |
Москва << Санкт-Петербург Поиск выдаст результаты, в которых эти слова будут в одном документе, но приоритет будет в пользу слова «Москва» |
| |
Поиск материалов, в которых есть одно из слов из запроса Допускается использование сразу несколько операторов | |
слово1 | слово2 | слово3 (оператор разделяется пробелами) |
Поезд | дорога | купе В результатах поиска появятся документы, в которых указано одно из слов запроса. |
— |
Из поиска исключается то слово, перед котором стоит данный оператор Равнозначен оператору ~~ Допускается использование сразу несколько операторов — |
слово1 слово2 … -словоn |
Золотая –антилопа Появятся документы, где есть слово «Золотая», но отсутствует «антилопа» |
~~ |
Из поиска исключается то слово, перед котором стоит этот оператор Равнозначен оператору — Допускается использование сразу несколько операторов ~~ |
слово1 слово2 … ~~ словоn (оператор разделяется пробелами) |
Синее ~~ море Появятся документы, где есть слово «Синее», но нет слова «море» |
~ |
Поиск материалов, где запрашиваемое слово будет присутствовать, но не будет указываться в одном предложении со словом, перед которым стоит этот оператор |
слово1 ~ слово2 (оператор разделяется пробелами) |
Морской ~ берег Отобразятся материалы, в которых есть слово «Морской», но ни в одном предложении вместе со словом «берег» |
() |
Делает возможной группировку слов в запросе. Внутри скобок могут применяться любые другие операторы |
слово1 оператор (слово2 слово3 … словоn)
|
Квартира –(купить в кредит) Найдутся документы, в которых будет слово «квартира», но не будет «купить», «кредит» |
azbuka-ineta.ru
Язык запросов в Яндекс, Google и Rambler: что это такое
Москва г. Москва, ул. Нобеля 7, п. 56 +7 (800) 700-59-30
Язык запросов поисковых систем — это набор правил, с помощью которых пользователь может формулировать свой запрос в адрес поисковой системы. Синтаксис языка запросов включает логические и расширенные операторы. Использование языка запросов позволяет учитывать расстояния между словами, префиксы обязательности, морфологию языка, регистр слов и уточнение поиска. Функция расширенного поиска информации есть в большинстве поисковых машин. Она позволяет использовать логические операторы языка запросов «и», «или», «не», в запросе вида «смартфон или планшет в Москве, но не в Санкт-Петербурге». Также в поисковый расширенный запрос можно вводить полную цитату, обычно заключенную в кавычки.
Особенности языка запросов различных поисковых систем
В зависимости от поисковой системы язык запросов может отличаться.
- Яндекс. Правила запросов в Яндекс имеет следующие особенности: список операторов и морфологию, сложные запросы, описание порядка слов, исключение и ограничение расстояния между словами.
- Рамблер. У Рамблера в языке запросов реализовано применение регистра, метасимволов, кавычек, стоп-слов, скобок, описание операторов, морфология, ограничение расстояния и специальные операторы.
- Google. Язык запросов поисковой системы Google включает описания операторов, по которым написан подробный Faq на английском языке, и встроенные функции дополнительного расширенного поиска.
Значение языка запросов
Несмотря на богатство возможностей и эффективность языка запросов Yandex или других поисковых систем, их используют меньше 2 % пользователей. Поэтому специалисты, занимающиеся раскруткой сайтов, должны учитывать, что язык запрос практически не оказывает влияния на посещение сайтов. Согласно предоставляемой поисковыми системами статистике большинство пользователей интернета стремятся к естественному использованию языка, т.е. составлению запросов из более длинных фраз и словосочетаний, а не к овладению языком запросов.
wiki.rookee.ru
Язык запросов Яндекса: что это такое
Виды запросов
Пользователи могут указывать требования к встречаемости запросов относительно друг друга:
- точное совпадение, т.е. слова в тексте расположены подряд в точной словоформе. По запросу “монтаж пластиковых окон” будут найдены страницы только с таким словосочетанием. Ресурсы, в контенте которых встречается “монтаже пластикового окна”, “монтажу пластиковых окон” и т.д., в результаты выдачи не попадут. С помощью кавычек также можно задать пропуск одного или нескольких слов, поставив вместо них звездочки через пробел, например, (“старый * год”).
- совместная встречаемость. Если элементы запроса соединены символом & через пробел, то будут найдены страницы, где данные слова расположены в одном предложении (например, продвижение сайтов & Москва). Использование оператора && позволит найти документы, внутри которых встречаются слова запроса в любом порядке и на любом расстоянии друг от друга. Символ << (неранжирующее И) предназначен для поиска статей, в тексте которых есть все слова, указанные в запросе, но ранжирование выдачи необходимо по слову, стоящему слева от оператора.
- исключение слов. Чтобы исключить из результатов страницы, в которых помимо запроса, встречаются конкретные слова (или одно слово), их указывают справа через ~~. Например, запрос раскрутка сайтов ~~ Киев позволит исключить из выдачи предложения киевские SEO компании.
- расстояние между словами внутри предложения регулируется оператором / и числом. Чтобы задать количество предложений между словами запроса, перед / ставят оператор &&.
- порядок слов. Если известен порядок слов запроса, между / и числом указывают + или – для прямого или обратного порядка слов. Например, по запросу Петр /+2 Сидоров будут показаны страницы, где между именем и фамилией встречается отчество.
- выбор из слов. При перечислении нескольких слов в запросе через символ | Яндекс найдет документы, в которых встречается одно или несколько из указанных слов.
- морфология. По умолчанию Яндекс ищет указанные слова во всех морфологических формах. С помощью оператора ! можно задать поиск слова только в одной словоформе (например, !музыка).
Все перечисленные варианты запросов могут быть скомбинированы. Сложные конструкции отделяются круглыми скобками.
Теги термина
Голосов 5, рейтинг 5 |
promo.ingate.ru
Сравнение фич и языка запросов Яндекса и Google, таблица поисковых запросов
Редактор-переводчик SEOnews
Поисковые системы уже давно идут к максимальному упрощению работы пользователя. Для этого они придумывают всяческие «штуки», которые помогают пользователям получить качественный результат сразу, не перебирая многочисленные ссылки в выдаче. Проанализировав язык пользовательских запросов, поисковые системы могут определять, что нужно пользователю, когда он набирает определенную последовательность запросов. В Яндексе подобные мгновенные ответы, которые находятся над первым пунктом поисковой выдачи, называются колдунщики. В Google такие ответы тоже имеются и называются они Search Features, говоря по-русски «поисковые фичи». Таким образом, поисковые системы делают пользователю хорошо, не напрягая его.
Но есть в поисковиках и другая сторона: они хотят обучать своих пользователей, раскрывая им специальный язык пользовательских запросов. Это набор операторов, которые изначально ограничивают область поиска информации, уточняют конкретный тип файла, в котором заинтересован пользователь, или позволяют искать тексты, в которых отсутствуют ненужные слова.
Мы решили составить сравнительную таблицу операторов и быстрых запросов к поисковым системам, по которым можно сразу получить интересующую вас информацию. Таблица разбита на несколько блоков:
- Базовые операторы, уточняющие запрос
- Информация
- Определения и перевод
- Конвертация и калькулятор
- Ссылки
- Поиск с ограничениями
- Время
- Развлекательные фичи
Сразу отметим, что мы рассматривали как международный Google, так и русскоязычный. Но в ходе работы почти все операторы и фичи этих поисковиков за небольшими исключениями совпали. Поэтому в итоговой таблице сравниваются Яндекс и Goоgle.com
Базовые операторы, уточняющие запрос
И Google, и Яндекс предоставляют пользователю возможность искать документ, в котором не содержится определенного слова; документ в котором присутствует любое из слов запроса, и документ, в котором встречается абсолютно точное вхождение запроса. В каждой из поисковых систем за это отвечают различные операторы. Уникальными для Яндекса являются операторы:
- /N, в котором N заменяется на число, обозначающее количество слов, которое может разделять в документе слова запроса;
- ! осуществляет поиск без учета морфологии запроса. В американском поисковике Google такой оператор не нужен из-за природы английского языка, слова которого практически не содержат окончаний;
- & и && осуществляют поиск слов, встречающихся в одном предложении и на одной странице соответственно.
Google может похвастаться операторами поиска в определенном числовом интервале (. .) и оператор, заменяющий любое слово (*).
Информация
По информационным запросам Яндекс и Google выглядят примерно одинаково. У российского поисковика есть преимущество в том, что он показывает пресс-портреты по имени и фамилии персоны, IP пользователя и погоду по однословному запросу [погода]. Западный поисковик не обладает ни одной из этих функций. Google ведет себя адекватнее при запросе, содержащем слово «новости», выдавая вверху выдачи новостной блок. Яндекс чаще не выделяет отдельным блоком новости на подобные запросы.
Определения и перевод
Google не предоставляет пользователю быстрого доступа к переводу слова как с иностранного, так и на иностранный язык. Яндекс выдает на запросы, содержащие слова «перевод», «по-английски», «по-испански» и им подобным, быстрый перевод слов из встроенных двуязычных словарей.
Для определений у западного поисковика есть специальный оператор define:, от Яндекса можно добиться словарного определения слова, если ввести, например, «что такое интернет» или «интернет это».
Конвертация и калькулятор
Наиболее серьезные различия между поисковыми системами наблюдаются в подсчитывании математических выражений и конвертации из одной меры измерения в другую. Начнем с того, что Яндекс выполняет 4 математических действия сразу в поисковой строке. Как только пользователь ввел, запрос, состоящий из чисел и математических знаков, поисковая строка раскрывается вниз, показывая результат. Google показывает результаты над выдачей.
Кроме четырех математических действий Яндекс не может вычислять ничего: ни корней, ни процентов, ни логарифмов, ни факториалов, ни тригонометрических функций. Это с успехом делает Google. К тому же западный поисковик способен переводить из римских цифр в арабские; из одной системы счисления в другую (например, в десятичную).
Примерно одинаково поисковые системы справляются с задачами конвертации: из одной системы мер длины, массы, объема в другую. Яндекс не поддерживает функции конвертации температур из системы Фаренгейта в Цельсиус, или наоборот, и из одной валюты в другую.
Ссылки и поиск с ограничениями
Еще в середине 2007 года Яндекс отменил операторы link и anchor, которыми пользовались SEOшники. Но Google сохранил возможность искать бэклинки и ссылки, анкоры которых содержат определенные слова.
Обе поисковые системы предлагают пользователю использовать специальный язык запросов для того, чтобы осуществить поиск на определенном сайте; поиск конкретного типа документа; поиск слов запроса в тайтле страницы. У Яндекса есть функция поиска документа только на определенном пользователем языке. У Google есть несколько операторов, которыми не располагает российский поисковик: просмотр закешированной страницы и поиск слов запроса в тексте урла.
Помимо вышеперечисленных функций у Яндекса есть несколько интересных фич. Цветовой спектр, с которым можно провести несколько приятных минут, выясняя, как выгляди «цвет детской неожиданности», «гуммигут» или «циннвальдитовый». На запрос, содержащий название праздника, Яндекс предложит перейти к Открыткам, чтобы пользователь поздравил своих друзей.
Update: Полную таблицу исследования вы можете посмотреть здесь (Excel).
www.seonews.ru
Язык поисковых запросов «Яндекса»: описание, особенности и отзывы
Интернет сегодня – это кладезь информации планетарных масштабов, где каждый житель Земли способен найти практически всё, что ему требуется. Обладая немыслимыми объёмами данных и сведений, человечество также имеет все необходимые средства для максимально быстрого и комфортного поиска того, что требуется каждому в определённый момент времени. Этими средствами являются поисковые системы, которыми каждый из нас пользуется ежедневно: Google, Yandex, Rambler, Yahoo и многие другие технологии со своими уникальными возможностями под разные предпочтения.
И объединяет их ровным счётом одно простое свойство – ни одна из систем не является неким сверхтехнологичным центром, хранящим в своих ресурсах невообразимое количество информации на все случаи жизни. Все они по своей сути являются путеводителями для пользователей по огромным просторам Интернета и работают по определённым программным алгоритмам.
Язык запросов поисковой машины «Яндекс»: базовые основы
Функционал «Яндекса» позволяет довольно гибко сортировать все получаемые результаты с учётом конкретных доменов, регионов, языков и многих других параметров. Формат вводимых данных и получаемые результаты могут настраиваться и фильтроваться пользователями при помощи простых комбинаций символов. Благодаря этому существенно повышаются эффективность и удобство поиска.
Каждый запрос от пользователя сначала отправляется на наиболее свободный сервер (сразу после автоматического анализа на загруженность системы), после чего его обработкой занимается программа «Метапоиск». Софт в реальном времени проводит анализ введённой информации в поисковой строке на предмет лингвистики, географического положения пользователя, принадлежности запроса к категориям «наиболее популярных»/«недавно заданных» и т. д. Результаты поиска для этих случаев на некоторое время сохраняются в кэше «Метапоиска», благодаря чему выдача необходимой информации осуществляется быстрее.
В случае поиска более редкой информации, сведения о которой в кэше отсутствуют, обработка запроса перенаправляется к другому программному механизму – «Базовый поиск». Тот анализирует всю базу данных, разбитую по различным дублирующимся серверам для ускорения процессов поиска, и выдаёт найденную информацию обратно «Метапоиску».
Все полученные данные в итоге упорядочиваются и предъявляются пользователю в готовом, удобно воспринимаемом виде. Весь процесс в среднем занимает максимум 1-2 секунды.
Правильный поиск в «Яндекс»: язык поисковых запросов и особенности синтаксиса
Наличие определённых слов в полученных результатах, а также их взаимное расположение можно легко настраивать при помощи специальных операторов, формирующих язык поисковых запросов «Яндекса».
Оператор | Функция | Пример использования |
+ | Отображение результатов по тем ресурсам, в которых обязательно есть обозначенное оператором слово. Язык запросов поисковой системы «Яндекс» допускает многократное использование при наличии двух или более слов в запросе. | всемирная+паутина+интернет «Яндекс» выдаст те результаты, которые точно содержат слова «паутина», «интернет» и, возможно, «всемирная». |
« | Поиск по конкретно заданной форме или последовательности символов. | «уходит далеко в багровый закат» Результаты поиска обязательно будут содержать в себе данную фразу без изменений. |
* | Используется только лишь с предыдущим оператором. Данный символ позволяет организовать поиск цитаты с пропущенными словами. | уходит *в багровый закат Поисковик выдаст результаты с данной цитатой и пропущенным словом. уходит ** закат Поисковик выдаст результаты с данной цитатой и пропущенными словами. |
& | Поиск результатов с предложениями, которые содержат объединённые данным оператором слова. | красиво & интерьер & дом Пользователю будут представлены результаты, в которых как минимум одно предложение содержит данный набор слов (их можно задавать оператором от двух и более). |
&& | Поиск ресурсов, которые просто содержат данный набор слов. | референдум && Великобритания && Европа & кризис Будут выданы все результаты, содержащие эти слова вне зависимости от расстояния и расположения друг к другу. |
По признакам служебной информации
Существуют операторы поисковых запросов «Яндекс» для уточнения сведений по таким параметрам, как: заголовки, типы файлов, хост, домены, дата последнего изменения страниц результатов и их язык.
Оператор | Функция | Пример использования |
title: | Поиск по документам, содержащим слова из запроса в заголовках. | title: машиностроение Будут найдены документы со словом «машиностроение» и его словоформами в заголовке. title: (машиностроение ФРГ) Будут найдены документы с заголовками, содержащие слова «машиностроение» и «ФРГ» (для запросов, в которых нужно скомбинировать для поиска два и более слова, необходимо ставить скобки). |
mime: | Поиск по документам определённого формата. | шаблон резюме mime:docx Результатами поиска будут все документы формата .docx, которые содержат слова «шаблон» и «резюме». |
host: | Поиск по страницам, которые размещены на определённом хосте. | законопроект host:www.yandex.ru На хосте www.yandex.ru будет проведён поиск по всем документам, содержащим слово «законопроект». |
domain: | Поиск по страницам всего домена. | хилари клинтон host:www.whitehouse.gov На домене www.whitehouse.gov будет проведён поиск всех документов, содержащих слова «хилари» и «клинтон». |
date: | Поиск по страницам с учётом даты их последнего изменения (использование языка запросов «Яндекс» предусматривает также отсутствие значения дня и месяца, если их заменить символом *). | событие дня date:20160624 Будут найдены все документы, содержащие слова «событие» и «дня», а также их словоформы, дата последних изменений которых соответствует 24.06.2016 саммит date:20150819..date20150909 Поиск результатов, дата последних изменений которых находится в интервале от 19.08.2015 до 09.09.2015 круиз date:>20160611 Отображаются все результаты, дата последних изменений которых позднее 11.06.2016
|
lang: | Поиск по страницам на конкретно указанном языке:
| green card lang:en Поиск англоязычных документов по данному запросу. |
Практически любой зарубежный аналог имеет подобный язык запросов. Язык поисковых запросов «Яндекса», в свою очередь, от конкурентов по большому счёту отличается чуть более расширенными возможностями и функциями.
Морфологические уточнения
По умолчанию поисковик предлагает пользователю широкий спектр выдаваемых результатов по введённому запросу, основу чего составляет не только само введённое слово/фраза, но и различные его формы (падеж, род, склонение, число и т. д.). Также учитываются вариации части речи (будь то существительное, глагол, прилагательное и т. д.) и регистр первой буквы. К примеру, при вводе в поисковую строку «атаковал» пользователь получит информацию и по прочим глагольным формам: «атаковать», «атакую», «атакован» (но однокоренные слова наподобие «атака», «атакованный», учитываться не будут). При этом будут показаны результаты как с заглавной первой буквой в запрошенном слове, так и с маленькой.
Практически все особенности языка запросов различных поисковых систем основаны на подобных принципах работы. В «Яндексе» ограничение по морфологическим признакам может пригодиться для более точной работы поисковика:
Оператор | Функция | Пример использования |
! | Поиск слова исключительно в заданной форме. Язык поисковых запросов «Яндекса» допускает многократное использование оператора при наличии двух или более слов в запросе. | !интернет «Яндекс» выдаст все результаты в заданной форме запроса с заглавной и строчной первой буквой. !Интернет «Яндекс» выдаёт результаты по заданной форме запроса, начинающиеся исключительно с заглавной буквы. |
!! | Чуть более широкий поиск слова и производных его форм. | !!пень Будут выданы результаты любой из форм этого слова («пнём», «пну», «пеньком» и т. д.), однако результаты со схожей словоформой глагола «пинать» будут исключены. |
Специальные методы подбора ключевых слов под контекстную рекламу
Языки поисковых запросов также распространяются далеко за пределы пользовательского сегмента, награждая простыми рабочими инструментами и рекламодателей. В частности, для подобных целей «Яндекс» имеет на вооружении целый ряд алгоритмов и операторов, позволяющих эффективно продвигать свои сайты и услуги в поисковой системе.
Логика показа контекстной рекламы на запросы пользователя основана на подборе слов, тематически относящихся к предмету этого объявления, а также на иных их словоформах. Например, подобные методы позволяют показывать объявление о юридических услугах не только лишь в ответ на «юридические услуги в городе N», а ещё и тем пользователям, которые делали схожие запросы (будь то «адвокаты город N цены», «адвокатские конторы», «юрист город N дёшево» и т. п.). В результате реклама будет отображаться более широкой аудитории пользователей, и это, соответственно, потенциально привлечёт больше внимания к ней.
Однако объявления должны быть показаны лишь тем пользователям, которые делают тематически смежные запросы в поисковике. К примеру, реклама юридических курсов никак не будет эффективной, если она будет показана пользователям, нуждающимся в услугах адвоката на данный момент. Регулирование подобных моментов осуществляется с помощью целого перечня операторов в поисковой системе «Яндекс». Описание языка запросов для рекламных задач в целом будет выглядеть так, как показано ниже.
Оператор | Функция | Пример использования |
— | Исключение для слов в запросах, когда объявление показываться не будет. Допускается многократное использование оператора при необходимости задать два или больше исключений. | юрист-курсы-дёшево Объявление будет показываться по всем запросам со словами «юрист» и «дёшево», но исключая те, которые содержат в себе слово «курсы». юрист-курсы-практика В этом случае реклама будет видна пользователям по запросам, содержащим слово «юрист», но не будет отображаться для запросов со словами «курсы» и «практика». |
+ | Отображение рекламы для тех запросов, в которых есть определённое слово/слова. | +аренда +квартиры+Сочи недорого Реклама отображена в запросах, содержащих слова «аренда», «квартиры», «Сочи», и, возможно, будет отображена при запросах, содержащих слово «недорого». |
! | Оператор служит определением конкретной формы слова в запросах, согласно которой сообщение будет показываться (либо наоборот). | !клуб !Лепассо Реклама показывается только для тех запросов, в которых содержится хотя бы одно из этих двух слов в конкретно заданной форме. При этом «Лепассо» в запросе обязательно должно начинаться с заглавной буквы для отображения объявления. !клуб !Лепассо-!пейнтбол
|
() | Группировка слов для сложных запросов, состоящих из нескольких слов (язык поисковых запросов «Яндекса» позволяет использовать эту функцию для двух или более слов). | машина-(аренда напрокат) Объявление будет показываться при запросе, содержащих слово «машина», но в то же время не имеющие слова «аренда» и «напрокат». +(машина купить Владивосток) дёшево Реклама отображается для запросов, которые обязательно содержат слова «машина», «купить», «Владивосток» и которые могут содержать слово «дёшево». |
«» | Показ объявления для запросов, содержащих только слова в кавычках или их словоформы. | «программист» Реклама показывается для запросов этого слова и его словоформ наподобие «программиста», «программисту». В то же время объявление не будет показано для таких запросов пользователей, как «программист ремонт компьютера недорого», «программист взлом сайта». |
Уроки комфорта и простоты от поисковых подсказок «Яндекса»
Упрощение процесса ввода поисковой информации при помощи подсказок воспринимается уже без какого-либо ажиотажного восторга. Такая технология сегодня есть в каждой популярной поисковой системе, основывается она на предварительной выдаче популярных запросов, схожих с введёнными пользователем в поисковую строку буквами.
«Яндекс» эту систему реализует посредством некоторых фирменных особенностей. Все наборы подсказок обрабатываются и группируются из числа наиболее массовых запросов пользователей. Используются также и научные термины из энциклопедических статей, названия фильмов, музыкальных произведений и иного тематически подходящего контента. В итоге пользователь с момента ввода самой первой буквы в поисковую строку получает под нею целый перечень вариантов наиболее популярных запросов, начинающихся с тех же символов.
К тому же в подсказках могут сразу указываться ссылки на нужные сайты или же ответ на заданный вопрос. К примеру, достаточно ввести половину запроса «длина окружности», как в соответствующем поле под поисковой строкой пользователю будет представлена готовая формула расчёта. Спрашивая «столица Австралии», вы не успеете дописать фразу до конца, как «Яндекс» тут же выдаст эти сведения в перечне подсказок.
Если же ссылка на какой-либо сайт будет релевантным ответом на запрос, то этот адрес будет доступен сразу в том же поле. Такой подход позволит быстрее перейти на нужный ресурс, минуя список всех найденных результатов.
Фильтрация непотребного контента
Функционал «Яндекса» также предусматривает исключение ресурсов «18+» из поисковых результатов вне зависимости от используемых средств языка запросов. Полезна эта функция будет в первую очередь для защиты малолетних пользователей от «материалов для взрослых» в Сети. И даже если ребёнок не стесняется использовать в действии все средства, которыми богат язык поисковых запросов «Яндекса», то это всё равно ему никак не поможет преодолеть барьер от подобных сайтов.
В поиске «Яндекса» для пользователей предусмотрено 3 режима фильтрации контента:
- «Без защиты» – какие-либо ограничения на выдаваемые результаты полностью отсутствуют.
- «Умеренный» – если запрос пользователя явно не направлен на поиск сайтов «18+», то они в таком случае изымаются из результатов поиска.
- «Семейный» – нецензурный контент полностью отсутствует в результатах поиска.
Все эти варианты защиты от недетского содержимого контролируются в соответствующем меню настроек «Яндекса».
Дополнительные функции поисковой машины
Помимо широкого спектра различных операторов языка запросов, «Яндекс» также предлагает ещё пару способов поиска информации:
- «Расширенный» – более приятный сервис с интуитивно понятной структурой для тех, кто нуждается в использовании средств языка запросов. Достаточно только ввести в соответствующие поля необходимые параметры (поиск по конкретному ресурсу, регион, точность совпадения со словами поискового запроса, поиск по заголовкам, язык, формат документа, дата последнего обновления и т. д.), не прибегая к менее комфортному ручному вводу операторов. «Расширенный поиск» и язык запросов «Яндекса» – один и тот же функционал, но с разницей в том, что первый предлагает использование тех же операторов в более удобной форме.
- «Дзен-поиск». Основываясь на истории поисковых запросов пользователя, «Яндекс» предлагает последнему сервис публикаций в СМИ. Доступен только для мобильных устройств и внешне представляет собою набор из превью новостей, подобранных согласно истории просмотров. Пользователь может выбрать любую понравившуюся публикацию, прочитать несколько первых абзацев и, если она ему интересна, перейти на сайт издателя по этому материалу. В противном случае достаточно выбрать «Не нравится» для того, чтобы не отображать конкретную новость или отметить таким образом весь ресурс, исключая его из своей новостной ленты.
Механизмы защиты от нежелательной и вредоносной информации
Основным свойством любой поисковой машины являются не только лишь разнообразные операторы поисковых запросов. «Яндексу» также характерен высокий уровень безопасности всех найденных результатов. Базовая проверка страниц и предупреждения о вредоносных сайтах у этой поисковой системы появились в 2009 году. Обнаружение угроз осуществляется двумя технологиями:
- Антивирусная защита, приобретённая у компании Sophos и основанная на сигнатурном подходе: обращение антивирусной системы при заходе пользователя на веб-страницу к базе данных, содержащей информацию об известном вредоносном ПО. Невзирая на высокую скорость работы, подобная технология практически полностью бесполезна в случае столкновения с новыми вирусными угрозами. Поэтому «Яндекс» дополнительно использует и вторую технологию.
- Фирменный антивирусный комплекс, основу которого составляет поведенческий фактор. Сначала защита при обращении к сайту анализирует, делает ли он запрос у браузера дополнительных файлов, перенаправляет ли на посторонний ресурс и т. д. Если обнаруживаются посторонние действия ресурса без ведома пользователя (запуск модулей JavaScript, полноценных программ, каскадных таблиц стилей), то он заносится в чёрный список опасных сайтов и базу вирусных сигнатур. Владелец самого сайта также будет уведомлён об этих угрозах, и все последующие проверки будут периодически проводиться вплоть до того момента, как все проблемы безопасности на нём не будут полностью устранены.
Подобный подход к анализу предоставляемых страниц с результатами поиска в сочетании с фирменными технологиями «Яндекса» позволили минимизировать процент заражённых сайтов в этом поисковике до единиц. Ежедневные проверки «Яндекса» охватывают в общей сложности до 23 миллионов ресурсов, а за месяц это число доходит примерно до 1 миллиарда.
fb.ru
Компания Яндекс — Технологии — Обработка запроса
Каждый раз, когда пользователь вводит запрос в поисковую строку Яндекса, поисковая система проводит лингвистический анализ этого запроса. Система определяет язык на котором пишет пользователь и исправляет ошибки, проводит морфологический разбор каждого слова, находит синонимы и устойчивые сочетания и в конечном счете решает, документы с какими словами нужно искать. И всё – за доли секунды.
Анализ запроса начинается с определения языка. Например, слово «дружина» в русском языке означает «военная рать», а в украинском – «военная рать» и «жена». Чтобы понять, что имеет в виду пользователь, нужно выяснить, на каком языке он общается с поисковой системой. Для этого Яндекс смотрит, какой алфавит использует человек, какие в запросе есть характерные слова и сочетания букв. Так, по запросу [дружина князя игоря] Яндекс будет искать информацию о войске, а по запросу [дружина князя iгоря] – еще и о жене полководца, княгине Ольге.
Кроме того, при определении языка поисковая система обращает внимание на регион пользователя и язык интерфейса. Например, если человек задает вопрос из Украины и использует интерфейс на украинском языке, это будет дополнительным фактором, чтобы посчитать запрос украиноязычным. Яндекс умеет работать с кириллическими запросами на русском, украинском, белорусском, казахском, татарском и башкирском языках.
Определив язык запроса, Яндекс переходит к морфологии и определяет, к какой части речи относятся написанные слова. Это позволяет находить документы, содержащие разные формы одних и тех же слов. Например, по запросу [стали для ножей] Яндекс будет искать документы, в которых есть не только это словосочетание, но и варианты: «сталь для ножа», «ножи сталь» и т.д. Анализируя запрос, Яндекс составляет список возможных словоформ для каждого слова.
По словоформе, которая есть в запросе, не всегда можно точно сказать, какое слово имел в виду человек. Например, в запросе [стали для ножей] слово «стали» – это не только существительное «сталь», но и глагол «стать». И в случае [стали для ножей] нужно искать формы существительного, а в случае [стали выпадать волосы что делать] – формы глагола. Нужно избавиться от неоднозначности, снять омонимию – совпадение слов с разным лексическим значением.
Чтобы выбрать для поиска наиболее вероятный список форм, система проверяет, как часто слова из запроса встречаются вместе, – для этого она обращается к собственной статистике. Например, в морфологическом разборе по запросу [стали для ножей] система выберет для поиска слово «сталь». Во-первых, по статистике слово «сталь» чаще встречается со словом «нож», чем «стать». А во-вторых, существительное в именительном падеже «сталь» часто сочетается с существительным в родительном падеже «ножей».
После снятия омонимии поисковая система не будет искать слова, которые пользователь точно не имел в виду. Но если ограничить поиск только словами из запроса, в поле зрения поисковой системы не попадут многие нужные документы. Ведь для одного и того же понятия в разных текстах могут использоваться разные слова: например, на одном сайте может быть аббревиатура, а на другом – полное наименование.
Для того чтобы учесть все возможные варианты, Яндекс дополняет запрос, добавляя новые формулировки с тем же смыслом. Например, вместе со сложносокращенным [физтех] Яндекс будет искать и официальное «Московский физико-технический институт», а по запросу [установка скайп] – ещё и skype. Точно так же Яндекс добавляет в запрос разные написания чисел – «Пётр I» и «Пётр Первый», близкие по смыслу однокоренные слова, варианты написания и синонимы. Если в запросе есть «воронежский», система может добавить к нему однокоренное «воронеж», к [авто-сервис мицубиши] – «автосервис мицубиси», а к [ветерок] – похожее «бриз». Выбирая, какое слово добавить, а какое нет, Яндекс смотрит, как часто это слово встречается с другими словами в запросах пользователей и вообще в текстах. Однокоренные слова и синонимы система берет из собственных словарей, которые Яндекс составляет специально для таких случаев.
Анализируя запрос, поисковая система выделяет в нём различные объекты — географические названия, имена людей, названия организаций и т.д. Например, если поисковая система поймет, что [Сергей Зубов] – это человек, она не будет дополнять запрос словоформой «зубным» или искать стоматологические клиники. А если в запросе [аптеки на парке культуры] система обнаружит, что «Парк культуры» — это место, она учтёт это при ранжировании: в результатах поиска первые строчки займут документы, в которых слова «парк» и «культуры» идут подряд. Для выделения устойчивых фраз и объектов Яндекс тоже составляет различные словари: географических названий – топонимов, имен и фамилий, названий организаций и другие. Получив запрос, система каждый раз проверяет по словарям, есть ли в нём устойчивые словосочетания.
По статистике Яндекса, около 12% запросов содержат ошибки. Это опечатки, орфографические ошибки или абракадабра, которая получается при неправильной раскладке клавиатуры. Если искать ровно то, что указано в поисковой строке, человек так и не получит нужный ему ответ – на большинстве сайтов слова написаны грамотно. Поэтому поисковая система проверяет запрос на грамотность.
Слова, в которых часто допускают ошибки (например, «агентство» и «винегрет») или по которым нет хорошего ответа, Яндекс сразу исправляет и показывает ответ на исправленный запрос. Разумеется, предупреждая пользователя, что запрос был исправлен.
В некоторых случаях сложно определить, ошибся пользователь или нет. Например, ресторан «фуджияма» очень похож на вулкан «фудзияма», а фамилия футболиста «Массад» на «Моссад», «массаж» и крепость «Массада». В таких случаях, показывая ответ на исходный вопрос, Яндекс спрашивает, не ошибся ли человек и не хочет ли он увидеть ответ на исправленный запрос. Есть ещё один вариант – когда система не уверена, опечатался человек или нет. Тогда она покажет на странице результатов поиска ответы сразу на два вопроса – на заданный, в котором предположительно есть опечатка, и на исправленный.
На работу с ошибками и весь лингвистический анализ уходят доли секунды. За это время система успевает определить язык запроса, разобрать каждое слово, найти синонимы и устойчивые сочетания и в конечном счете решить, документы с какими словами нужно искать.
yandex.ru