Язык поисковых запросов Google — ITandLife.ru
Содержание
- 1 Операторы языка поисковых запросов Google
- 1.1 Логическое «И»
- 1.2 Логическое «ИЛИ»
- 1.3 Точное совпадение
- 1.4 Выделение важных слов
- 1.5 Исключение нежелательных слов
- 1.6 Поиск по конкретному сайту
- 1.7 Похожие страницы
- 1.8 Ссылающиеся страницы
- 1.9 Использование синонимов
- 1.10 Поиск документов конкретного типа
- 1.11 Числовые диапазоны
- 1.12 Поиск определений
- 1.13 Поиск в Кэше
- 1.14 Поиск ключевых слов в URL
- 1.15 Текст ссылок
- 1.16 Учет заголовка веб-документа
- 1.17 Все ключевые слова запроса в одном документе
- 1.18 Регион поиска
- 1.19 Информация о странице
- 1.20 Составные запросы
- 2 Итоги
Каждый из нас постоянно сталкивается с различными проблемами. Чтобы их решить нужно собрать достаточно информации для принятия дальнейших решений или действий. Иногда поиск нужной информации занимает больше времени, чем последующие физические действия по решению проблемы. Я уже много лет пользуюсь поисковой машиной Google, но до сих пор не использовал его возможности на 100%. Поэтому я решил, что нужно изучить этот инструмент, который почти каждый день приходит мне на помощь (я взял за правило искать информацию по любой проблеме возникающей в моей жизни, будь то выбор зимней обуви или поиск описания WinAPI-функции; это очень помогает).
На первый взгляд такая тривиальная задача как поиск информации в Google не должна представлять проблем. Но не стоит забывать что Google это не простой поисковик, он оснащен специальными сервисами, призванными значительно упростить различные задачи. Также, разработчики, стремясь облегчить поиск, создали специальный язык поисковых запросов Google — специальные операторы и функции обработчика поисковых запросов.
О поисковых машинах и поиске информации я уже писал — правила поиска информации.
Язык поисковых запросов Google
Операторы языка поисковых запросов Google
Логическое «И»
Оператор AND
По умолчанию к каждому введенному ключевому слову поисковая система применяет операцию логического «И». Это значит, что на запрос «UserandLinux журнал ноябрь» Google выдаст только те страницы, которые одновременно будут содержать и слово «UserandLinux», и «журнал», и «ноябрь». Стоит заметить, что в 90% случаев результат такого запроса приводит к искомой странице (может поэтому рядовые пользователи не заморачиваются с языком поисковых запросов?).
Логическое «ИЛИ»
Оператор OR
Допустим нам необходимо найти журнал UserandLinux или Хакер за ноябрь, то тогда запрос будет выглядеть следующим образом — «UserandLinux or Хакер журнал ноябрь».
Точное совпадение
Оператор «текст запроса«
Сложные алгоритмы поиска Google учитывают морфологию языка, различные особенности построения веб-документа и вовсе не предполагают, что найденные страницы будут содержать в точности ту фразу, которая указана в строке запроса. Слова могут быть разбросаны по всей странице и даже иметь другую форму, что в большинстве случаев очень удобно. Но что если требуется именно точное совпадение? Скажем, нужно найти текст песни по одной известной строке? В этом случае надо заключить нужные слова в кавычки.
Выделение важных слов
Оператор +
Чтобы сделать акцент на одно или несколько слов нужно использовать «+». Это поможет системе понять, какие из ключевых слов наиболее важные, и сформулировать результаты поиска более точно.
Пример: UserandLinux +журнал
Исключение нежелательных слов
Оператор —
Полученные результаты нередко засоряет какая-то лишняя информация. Чтобы не тратить время на ее просмотр, советую наложить на результаты поиска фильтр. Просто нужно перед нежелательными слова поставить «-«.
Пример UserandLinux журнал +декабрь -ноябрь
Поиск по конкретному сайту
Оператор site:
Очень полезный оператор. Язык поисковых запросов Google и стоит изучать ради таких операторов. Если известно, что необходимая информация есть на определенном сайте, то можно ограничить поиск рамками только этого сайта. Для это используется модификатор site:somesite.com. Этот прием очень удобен, если нужно найти информацию на каком-то ресурсе у которого плохо или вообще не работает внутренний поиск.
Пример: site:rutor.org Тайны Смолвиля 10 Сезон +Smarts Studios
Похожие страницы
Оператор related:
Используя модификатор related: можно находить похожие страницы. Это очень удобно для владельцев сайтов для определения дружественных или конкурирующих сайтов.
Пример related:microsoft.com
Ссылающиеся страницы
Оператор link:
Мощь Google можно использовать для проверки популярности ресурса. Чем больше ссылающихся страниц, тем больше популярность проекта.
Пример link:habrahabr.ru
Использование синонимов
Оператор ~
Если нужно чтобы в поисковую выдачу вошли синонимы определенного слова, то нужно передним поставить символ «~».
Пример почтовые ~клиенты
Поиск документов конкретного типа
Оператор filetype:
Модификатор filetype: позволяет искать только конкретный тип документа по его расширению.
Пример smallville +»season 10″ filetype:torrent
Числовые диапазоны
Оператор 2002..2005
Если поиск нужно производить по определенному периоду (например за определенные годы), то этот оператор очень полезен.
Пример Ария дискография 2000..2006
Поиск определений
Оператор define:
Очень полезный модификатор! Позволяет найти определение неизвестного слова или понятия.Теперь с помощью языка поисковых запросов Google, найти нужное определение не составит труда.
Например define:ДНК
Поиск в Кэше
Оператор cache:
Этот модификатор предназначен для поиска в так называемом кэше, т.е. в сохраненных поисковым роботом страницах. Его использование очень полезно если целевой ресурс, содержащий информацию недоступен. Стоит отметить, что в выдаче есть специальная ссылка, «пройдя» по которой, можно открыть страницу кеша. На ней будут выделены цветом ключевые слова поискового запроса.
Пример cache:ora.com
Поиск ключевых слов в URL
Оператор allinurl:
Этот модификатор позволяет искать страницы адрес которых содержит все слова поискового запроса.
Пример allinurl: Java Eclipse Userguide
Оператор inurl:
Этот модификатор похож по функциональности с предыдущим, но в выдаче попадут страницы, в URL которых содержатся ключевые слова (в любом порядке, в любом количестве). Посмотрите выдачу, и увидите разницу.
Пример inurl: Java Eclipse Userguide
Текст ссылок
Оператор inanchor:
Ищет ключевые слова в анкорах (тексте) ссылок.
Пример «изучение SQL» inanchor:blog
Учет заголовка веб-документа
Оператор allintitle:
Находит страницы, в заголовках которых есть все искомые ключевые слова (один из самых полезных операторов языка поисковых запросов Google).
Пример allintitle:программирование на ActionScript
Оператор intitle:
Намного большей эффективности поиска удается добиться, если с помощью модификатора intitle указать слова, которые обязательно должны входить в заголовок документа (т. е в тег title).
Пример: intitle:статьи site:rsdn.ru
Все ключевые слова запроса в одном документе
Оператор allintext:
Поиск страниц с ключевыми словами в теле документа.
Пример allintext:как настроить веб-сервер
Регион поиска
Оператор :
Ищет информацию по регионам
Пример rootkit`s +:ru
Информация о странице
Оператор info:
Интерфейс для нескольких операторов. Показывает информацию о странице
Пример info:securitylab.ru
Составные запросы
Все описанные выше операторы языка поисковых запросов Google можно комбинировать для достижения более релевантных результатов. Вот, например, мне недавно нужно было найти пример практической работы по физике. Вот как я это сделал (первая ссылка — необходимый результат).
Пример allintext:определение ускорения свободного падения с помощью оборотного маятника +»практическая работа»
Итоги
Поисковая система Google это очень мощный инструмент поиска информации. Знание всех возможностей этого инструмента очень облегчает жизнь. Поэтому нужно запомнить эти команды (можно сделать закладку страницы) и начать их применять в повседневной поисковой рутине. Результат не заставит себя долго ждать. Итак, сводная страница наиболее используемых операторов языка поисковых запросов Google:
Оператор | Назначение |
AND | Поиск 1-го, 2-го и N-го слова (логическое «И», используется по умолчанию) |
OR | Поиск 1-го или 2-го слова (логическое «ИЛИ») |
» « | Поиск точной фразы, заключенной в » « |
+ | Выделение главных ключевых слов в запросе |
— | Исключение нежелательных слов в результатах поисковой выдачи |
site: | Поиск по конкретному сайту |
related: | Поиск похожих страниц (обычно этот оператор применяется для поиска похожих сайтов) |
link: | Поиск ссылающихся страниц |
~ | Включение в выдачу синонимов выделенного слова |
filetype: | Поиск документов по расширению |
define: | Поиск определений |
cache: | Обращение к странице, сохраненной в кеше поисковой машины |
allinurl: | Поиск страниц, содержащих в своем адресе все слова из поискового запроса |
inurl: | Поиск страниц, содержащих в своем адресе слова из поискового запроса в любом порядке и в любом количестве |
inanchor: | Поиск в тексте ссылок |
allintitle: | Поиск страниц, содержащих в своем заголовке все слова из поискового запроса |
intitle: | Поиск страниц, содержащих в своем заголовке слова из поискового запроса в любом порядке и в любом количестве |
allintext: | Поиск страниц, содержащих все слова поискового запроса |
: | Задает регион поиска |
info: | Показывает информацию о странице |
.![]() |
RFID технологии
Работают ли электромобили в зимних условиях?
Язык запросов Google — языки запросов различных браузеров
Язык запросов Google
|
Язык поисковых запросов | Google Issue Tracker
Язык поискового запроса — это синтаксис, который вы используете для поиска проблем. в системе отслеживания проблем Google. Вы можете использовать язык в поисковых запросах, которые вы введите в строку поиска. Вы также можете использовать конструктор поиска для графического выберите критерии, которые затем преобразуются в язык запросов, когда конструктор поиска закрыт.
Язык запросов позволяет выполнять поиск по следующим критериям:
- Ключевые слова
- Пары поле/значение
Поиск, который вы выполняете, может содержать несколько критериев, включая комбинацию
ключевых слов и пар поле/значение. Синтаксис языка запросов позволяет
указать взаимосвязь и порядок, в котором критерии рассматриваются с помощью
логические операторы, круглые скобки и кавычки.
Поиск по ключевым словам
Ключевые слова — это текстовые строки, которые можно использовать для поиска по определенным полям в проблемы. Эти поля:
- Заголовок
- Комментарии
- Имена вложений
- Поля, содержащие пользователей (например, Правопреемник или CC )
- Поля, содержащие внутренний идентификационный номер (например, те, которые указывают компонент или горячие списки, которые содержат проблему)
- Поля, содержащие номера версий
- Пользовательские поля
Примером критериев поиска по ключевым словам является строка свойств конфигурации
.
Когда вы вводите этот критерий в поиск, средство отслеживания проблем выполняет глобальный поиск проблем. во всех компонентах и возвращает те, чьи поля выше содержат оба ключевых слова,
в соответствии с вашим контролем доступа
разрешения. Ключевые слова могут быть в
разные поля или одни и те же поля.
Система отслеживания проблем рассматривает пробел, разделяющий критерии поиска, как
неявный оператор И
. Вы можете использовать кавычки ( "
) для
укажите, что строка из нескольких слов должна рассматриваться как одно ключевое слово. Все
поиск в системе отслеживания ошибок не зависит от регистра, независимо от того, используете ли вы кавычки или нет.
Метки.
Поиск пары поле/значение
Вы также можете указать критерии поиска в виде пары поле/значение. Базовый синтаксис [поле]:[значение]
. Для текстовых полей этот синтаксис соответствует задачам, в которых
указанное поле содержит значение . Для других типов полей он соответствует
проблемы, где значение поля равно эквивалентно .
Например, поиск title:latency
соответствует задачам со словом latency
в поле Заголовок . Поиск priority:p0
находит задачи с приоритетом
из p0
.
Обратите внимание, что для полей времени и количества можно использовать другие относительные символы кроме символа двоеточия. См. Реляционные операторы ниже.
Поиск по специальным значениям с использованием any и none
Дополнительные поля могут быть запрошены со специальными значениями any
и none
. любой
соответствует любому ненулевому значению. нет
соответствует нулевым значениям. Для списка всех
поддерживаемые метки полей на языке поискового запроса, см. Справочник по поисковым запросам.
Логические операторы
Логические операторы позволяют указать более одного критерия и указать отношения между ними. Как отмечалось выше, символы пробела вне кавычек действуют как неявные 9Операторы 0039 И . Трекер проблем поддерживает следующие дополнительные явные логические операторы:
Оператор | Альтернативный символ | Описание | Пример |
---|---|---|---|
И | {пробел} | Соответствует, если задача содержит оба критерия | звезда: истина И идентификатор компонента: 46046 |
ИЛИ | | | Соответствует, если проблема содержит любой критерий | тип:(Ошибка|feature_request) |
НЕ | — | Соответствует, если задача не содержит критериев | -правопреемник: Джим |
«.![]() | Соответствует, если в выпуске есть цитируемая фраза (слова в кавычках идут в том же порядке) | комментарий:"У нас проблема" | |
( ) | Группирует значения или критерии поиска вместе | статус: открыто И (приоритет: (p0|p1) ИЛИ серьезность: (s0|s1)) |
Обратите внимание на следующее:
Вы должны использовать все заглавные буквы для
И
,ИЛИ
иНЕ
.Оператор
NOT
имеет то же значение, если он предшествует имени поля или значение поля. Это означает, что-assignee:jim
иassignee:-jim
являются эквивалент.Свободно используйте круглые скобки, чтобы четко группировать термины в поисковом запросе.
К по умолчанию средство отслеживания проблем связывает
НЕ
с термином, следующим сразу за это только и группируетИЛИ
с двумя терминами, которые заключают его в скобки. Например, поисковый запросtitle:(a OR b NOT c AND d)
эквивалентенtitle:((a OR b) И (НЕ в) И г)
.
Дефисы
Символ дефиса ( -
) имеет разные значения в зависимости от контекста поиска.
запрос:
Система отслеживания проблем обрабатывает тире перед словом в поиске как
НЕ
оператор. Например, критерии поиска- правопреемник: нет
илиправопреемник: - нет
возвращает все задачи, у которых есть правопреемник.Система отслеживания ошибок рассматривает строки, соединенные дефисом, как заключенные по кавычкам.
Например, критерий поиска
современный
эквивалентно"современный"
.Средство отслеживания проблем обрабатывает слова, написанные через дефис в поле задачи, как независимые слова разделены пробелом. Это означает, что если в задаче есть слово
ультрасовременный
в названии и вы выполняете поисковый запросназвание:(состояние техники)
илиназвание:("состояние техники")
, выпуск возвращается как часть результатов поиска.
Реляционные операторы
Базовый синтаксис для критериев поиска поля/значения: [поле]:[значение]
, где
символ двоеточия ( :
) указывает, что данное поле должно быть равно или
содержать указанное значение для того, чтобы проблема возвращалась в поиске
Результаты.
Поля, содержащие значение времени ( создано
, изменено
, разрешено
, проверено
и некоторые настраиваемые поля) или значение счетчика ( дубликатов
, голосов
, commentcount
и cccount
) поддерживают следующие дополнительные реляционные
операторы:
Символ | Описание |
---|---|
< | Соответствует проблеме, если ее значение меньше или раньше вашего поискового значения. |
<= | Соответствует проблеме, если ее значение меньше/ранее или равно вашему поисковому значению. |
> | Соответствует проблеме, если ее значение больше или меньше вашего значения поиска.![]() |
>= | Соответствует проблеме, если ее значение больше/после или равно вашему поисковому значению. |
Поиск по времени
Язык поискового запроса предоставляет специальный синтаксис для сопоставления полей, которые содержат значение времени. Это позволяет системе отслеживания проблем выполнять поиск в диапазоне раз или относительное время по мере необходимости.
Формат абсолютного времени
Формат для указания времени:
[гггг]-[ММ]-[дд]Т[ЧЧ]:[мм]:[сс]
.
В этом формате [гггг]
— это 4-значный год, [ММ]
— 2-значный месяц, [дд]
— это двузначный день, [ЧЧ]
— двузначный час в 24-часовом формате, [мм]
— минуты, а [сс]
— секунды. Все время указано в формате UTC.
Вы можете указать желаемый уровень конкретности при поиске проблем
созданные в, до или после определенного времени. Например, вы
можно указать created:2014-06
, чтобы найти задачи, созданные в любое время в июне.
2014 года. Для большей конкретики вы можете выполнить поиск created:2014-06-03T04
найти
выпуски, которые были созданы 3 июня 2014 года в 4-й час (между 4 и 5 утра,
УНИВЕРСАЛЬНОЕ ГЛОБАЛЬНОЕ ВРЕМЯ).
Диапазоны времени
Вы можете использовать два символа точки ( ..
), чтобы указать диапазон времени в поле/значении
критерий поиска. Синтаксис: [поле]:[время начала]..[время окончания]
. Начало
и времена окончания могут иметь любую требуемую степень специфичности. Например, Verified:2013..2015
возвращает все проблемы, проверенные в 2013, 2014 или 2015 году.
Относительный формат времени
Вы также можете указать время в днях до сегодняшнего дня. Для этого используйте
формат [дней]d
, где [дней]
— количество дней в прошлом, которое вы хотите
для включения в результаты поиска. Например, вы можете использовать модифицированный:5d
, чтобы найти
вопросы, измененные за последние пять дней.
При использовании формата относительного времени оператор должен быть символом двоеточия.
( :
) как создано: 5d
. Если вы хотите найти проблемы, которые не попадают в
диапазон, вы можете использовать НЕ
или -
оператор.
Например, -verified:10d
возвращает проблемы, которые не были проверены в
последние 10 дней. Если вы хотите найти проблемы, которые были проверены, но не
за последние 10 дней вы можете использовать
(-verified:10d) И status:verified
.
Понимание поиска лучше, чем когда-либо прежде
Поиск
25 октября 2019 г.
мин. чтение
Панду Наяк
Почетный сотрудник и вице-президент Google, Поиск
Если и есть что-то, чему я научился за 15 лет работы над поиском Google, так это тому, что человеческое любопытство безгранично. Каждый день мы видим миллиарды поисковых запросов, и 15% из этих запросов мы не видели раньше, поэтому мы создали способы возврата результатов для запросов, которые мы не можем предвидеть.
Когда такие люди, как вы или я, приходят в Поиск, мы не всегда уверены, как лучше сформулировать запрос. Мы можем не знать, какие слова использовать или как правильно написать что-то, потому что часто мы приходим к Поиску, чтобы учиться — у нас не обязательно есть знания для начала.
В основе поиска лежит понимание языка. Наша работа — выяснить, что вы ищете, и найти полезную информацию из Интернета, независимо от того, как вы пишете или комбинируете слова в своем запросе. Хотя мы продолжали улучшать наши возможности понимания языка на протяжении многих лет, иногда мы все еще не совсем правильно понимаем, особенно со сложными или диалоговыми запросами. На самом деле, это одна из причин, почему люди часто используют «ключевое слово», набирая строки слов, которые, как они думают, мы поймем, но на самом деле они не так, как обычно задают вопрос.
Благодаря последним достижениям нашей исследовательской группы в области понимания языка, которые стали возможными благодаря машинному обучению, мы значительно улучшили понимание запросов, что представляет собой самый большой скачок вперед за последние пять лет. один из самых больших скачков вперед в истории поиска.
Применение моделей BERT к поиску
В прошлом году мы представили и открыли исходный код метода на основе нейронной сети для предварительного обучения обработки естественного языка (NLP) под названием «Представления двунаправленного кодировщика от преобразователей», или, как мы его называем, — BERT. , для краткости. Эта технология позволяет любому обучить свою собственную современную систему ответов на вопросы.
Этот прорыв стал результатом исследования Google трансформеров: моделей, которые обрабатывают слова по отношению ко всем другим словам в предложении, а не по одному по порядку. Таким образом, модели BERT могут учитывать полный контекст слова, рассматривая слова, идущие до и после него, что особенно полезно для понимания целей поисковых запросов.
Но это возможно не только благодаря достижениям в области программного обеспечения: нам также требовалось новое оборудование. Некоторые из моделей, которые мы можем построить с помощью BERT, настолько сложны, что расширяют границы того, что мы можем делать с использованием традиционного оборудования, поэтому мы впервые используем новейшие облачные TPU для обслуживания результатов поиска и быстрого предоставления вам более актуальной информации. .
Взлом ваших запросов
Итак, это много технических подробностей, но что все это значит для вас? Что ж, применяя модели BERT как к ранжированию, так и к избранным фрагментам в Поиске, мы можем значительно улучшить работу , помогая вам находить полезную информацию. На самом деле, когда дело доходит до результатов ранжирования, BERT поможет Поиску лучше понимать один из 10 поисковых запросов в США на английском языке, и со временем мы перенесем это на большее количество языков и регионов.
В частности, для более длинных, более разговорных запросов или запросов, в которых предлоги, такие как «для» и «к», имеют большое значение для значения, Поиск сможет понять контекст слов в вашем запросе. Вы можете искать так, как вам кажется естественным.
Чтобы запустить эти улучшения, мы провели много тестов, чтобы убедиться, что изменения на самом деле более полезны. Вот несколько примеров, демонстрирующих наш процесс оценки, которые демонстрируют способность BERT понимать намерение, стоящее за вашим поиском.
Вот поисковый запрос «Путешественнику из Бразилии в США в 2019 году нужна виза». Слово «кому» и его связь с другими словами в запросе особенно важны для понимания смысла. Речь идет о бразильце, путешествующем в США, а не наоборот. Раньше наши алгоритмы не понимали важность этой связи, и мы возвращали результаты о гражданах США, путешествующих в Бразилию. С помощью BERT поиск может уловить этот нюанс и узнать, что очень распространенное слово «кому» на самом деле имеет здесь большое значение, и мы можем предоставить гораздо более релевантный результат для этого запроса.
Давайте посмотрим на другой запрос: «много ли стоят на работе косметологи». Раньше наши системы применяли метод сопоставления ключевых слов, сопоставляя термин «автономный» в результате со словом «стоять» в запросе. Но это неправильное использование слова «стоять» в контексте. Наши модели BERT, с другой стороны, понимают, что «стоять» связано с концепцией физических требований работы, и отображают более полезную реакцию.
Вот несколько других примеров, когда BERT помог нам уловить тонкие нюансы языка, которые компьютеры понимают не так, как люди.
Улучшение поиска на других языках
Мы также применяем BERT, чтобы сделать поиск лучше для людей во всем мире. Мощной характеристикой этих систем является то, что они могут извлекать знания из одного языка и применять их к другим. Таким образом, мы можем взять модели, основанные на улучшениях английского языка (язык, на котором существует подавляющее большинство веб-контента), и применить их к другим языкам. Это помогает нам лучше выдавать релевантные результаты на многих языках, на которых доступен поиск.
Для избранных фрагментов мы используем модель BERT для улучшения избранных фрагментов в двух десятках стран, где доступна эта функция, и видим значительные улучшения на таких языках, как корейский, хинди и португальский.
Поиск — это не решенная проблема
Независимо от того, что вы ищете или на каком языке говорите, мы надеемся, что вы сможете отказаться от некоторых ключевых слов и искать естественным образом. для тебя. Но время от времени вы все равно будете ставить Google в тупик. Даже с BERT мы не всегда понимаем это правильно. Если вы ищете «какой штат находится к югу от Небраски», лучшим предположением BERT будет сообщество под названием «Южная Небраска».