Google язык поисковых запросов: Язык поисковых запросов Google, операторы, синтаксис: как правильно искать

Содержание

Язык поисковых запросов Google — ITandLife.ru

Содержание

  • 1 Операторы языка поисковых запросов Google
    • 1.1 Логическое «И»
    • 1.2 Логическое «ИЛИ»
    • 1.3 Точное совпадение
    • 1.4 Выделение важных слов
    • 1.5 Исключение нежелательных слов
    • 1.6 Поиск по конкретному сайту
    • 1.7 Похожие страницы
    • 1.8 Ссылающиеся страницы
    • 1.9 Использование синонимов
    • 1.10 Поиск документов конкретного типа
    • 1.11 Числовые диапазоны
    • 1.12 Поиск определений
    • 1.13 Поиск в Кэше
    • 1.14 Поиск ключевых слов в URL
    • 1.15 Текст ссылок
    • 1.16 Учет заголовка веб-документа
    • 1.17 Все ключевые слова запроса в одном документе
    • 1.18 Регион поиска
    • 1.19 Информация о странице
    • 1.20 Составные запросы
  • 2 Итоги

Каждый из нас постоянно сталкивается с различными проблемами. Чтобы их решить нужно собрать достаточно информации для принятия дальнейших решений или действий. Иногда поиск нужной информации занимает больше времени, чем последующие физические действия по решению проблемы. Я уже много лет пользуюсь поисковой машиной Google, но до сих пор не использовал его возможности на 100%. Поэтому я решил, что нужно изучить этот инструмент, который почти каждый день приходит мне на помощь (я взял за правило искать информацию по любой проблеме возникающей в моей жизни, будь то выбор зимней обуви или поиск описания WinAPI-функции; это очень помогает).
На первый взгляд такая тривиальная задача как поиск информации в Google не должна представлять проблем. Но не стоит забывать что Google это не простой поисковик, он оснащен специальными сервисами, призванными значительно упростить различные задачи. Также, разработчики, стремясь облегчить поиск, создали специальный язык поисковых запросов Google — специальные операторы и функции обработчика поисковых запросов.
О поисковых машинах и поиске информации я уже писал —  правила поиска информации.

Язык поисковых запросов Google

Операторы языка поисковых запросов Google

Логическое «И»

Оператор AND

По умолчанию к каждому введенному ключевому слову поисковая система применяет операцию логического «И». Это значит, что на запрос «UserandLinux журнал ноябрь» Google выдаст только те страницы, которые одновременно будут содержать и слово «UserandLinux», и «журнал», и «ноябрь». Стоит заметить, что в 90% случаев результат такого запроса приводит к искомой странице (может поэтому рядовые пользователи не заморачиваются с языком поисковых запросов?).

Логическое «ИЛИ»

Оператор OR

Допустим нам необходимо найти журнал UserandLinux или Хакер за ноябрь, то тогда запрос будет выглядеть следующим образом — «UserandLinux or Хакер журнал ноябрь».

Точное совпадение

Оператор «текст запроса«

Сложные алгоритмы поиска Google учитывают морфологию языка, различные особенности построения веб-документа и вовсе не предполагают, что найденные страницы будут содержать в точности ту фразу, которая указана в строке запроса. Слова могут быть разбросаны по всей странице и даже иметь другую форму, что в большинстве случаев очень удобно. Но что если требуется именно точное совпадение? Скажем, нужно найти текст песни по одной известной строке? В этом случае надо заключить нужные слова в кавычки.

Выделение важных слов

Оператор +

Чтобы сделать акцент на одно или несколько слов нужно использовать «+». Это поможет системе понять, какие из ключевых слов наиболее важные, и сформулировать результаты поиска более точно.

Пример:  UserandLinux +журнал

Исключение нежелательных слов

Оператор —

Полученные результаты нередко засоряет какая-то лишняя информация. Чтобы не тратить время на ее просмотр, советую наложить на результаты поиска фильтр. Просто нужно перед нежелательными слова поставить «-«.

Пример UserandLinux журнал +декабрь -ноябрь

Поиск по конкретному сайту

Оператор site:

Очень полезный оператор. Язык поисковых запросов Google и стоит изучать ради таких операторов. Если известно, что необходимая информация есть на определенном сайте, то можно ограничить поиск рамками только этого сайта. Для это используется модификатор site:somesite.com. Этот прием очень удобен, если нужно найти информацию на каком-то ресурсе у которого плохо или вообще не работает внутренний поиск.

Пример: site:rutor.org Тайны Смолвиля 10 Сезон +Smarts Studios

Похожие страницы

Оператор related:

Используя модификатор related: можно находить похожие страницы. Это очень удобно для владельцев сайтов для определения дружественных или конкурирующих сайтов.

Пример related:microsoft.com

Ссылающиеся страницы

Оператор link:

Мощь Google можно использовать для проверки популярности ресурса. Чем больше ссылающихся страниц, тем больше популярность проекта.

Пример link:habrahabr.ru

Использование синонимов

Оператор ~

Если нужно чтобы в поисковую выдачу вошли синонимы определенного слова, то нужно передним поставить символ «~».

Пример почтовые ~клиенты

Поиск документов конкретного типа

Оператор filetype:

Модификатор filetype: позволяет искать только конкретный тип документа по его расширению.

Пример smallville +»season 10″ filetype:torrent

Числовые диапазоны

Оператор 2002..2005

Если поиск нужно производить по определенному периоду (например за определенные годы), то этот оператор очень полезен.

Пример Ария дискография 2000..2006

Поиск определений

Оператор define:

Очень полезный модификатор! Позволяет найти определение неизвестного слова или понятия.Теперь с помощью языка поисковых запросов Google, найти нужное определение не составит труда.

Например  define:ДНК

Поиск в Кэше

Оператор cache:

Этот модификатор предназначен для поиска в так называемом кэше, т.е. в сохраненных поисковым роботом страницах. Его использование очень полезно если целевой ресурс, содержащий информацию недоступен. Стоит отметить, что в выдаче есть специальная ссылка, «пройдя» по которой, можно открыть страницу кеша. На ней будут выделены цветом ключевые слова поискового запроса.

Пример cache:ora.com

Поиск ключевых слов в URL

Оператор allinurl:

Этот модификатор позволяет искать страницы адрес которых содержит все слова поискового запроса.

Пример  allinurl: Java Eclipse Userguide

Оператор inurl:

Этот модификатор похож по функциональности с предыдущим, но в выдаче попадут страницы, в URL которых содержатся ключевые слова (в любом порядке, в любом количестве). Посмотрите выдачу, и увидите разницу.

Пример inurl: Java Eclipse Userguide

Текст ссылок

Оператор inanchor:

Ищет ключевые слова в анкорах (тексте) ссылок.

Пример «изучение SQL» inanchor:blog

Учет заголовка веб-документа

Оператор allintitle:

Находит страницы, в заголовках которых есть все искомые ключевые слова (один из самых полезных операторов языка поисковых запросов Google).

Пример allintitle:программирование на ActionScript

Оператор intitle:

Намного большей эффективности поиска удается добиться, если с помощью модификатора intitle указать слова, которые обязательно должны входить в заголовок документа (т. е в тег title).

Пример: intitle:статьи site:rsdn.ru

Все ключевые слова запроса в одном документе

Оператор allintext:

Поиск страниц с ключевыми словами в теле документа.

Пример  allintext:как настроить веб-сервер

Регион поиска

Оператор :

Ищет информацию по регионам

Пример rootkit`s +:ru

Информация о странице

Оператор info:

Интерфейс для нескольких операторов. Показывает информацию о странице

Пример info:securitylab.ru

Составные запросы

Все описанные выше операторы языка поисковых запросов Google можно комбинировать для достижения более релевантных результатов. Вот, например, мне недавно нужно было найти пример практической работы по физике. Вот как я это сделал (первая ссылка — необходимый результат).

Пример  allintext:определение ускорения свободного падения с помощью оборотного маятника +»практическая работа»

Итоги

Поисковая система Google это очень мощный инструмент поиска информации. Знание всех возможностей этого инструмента очень облегчает жизнь. Поэтому нужно запомнить эти команды (можно сделать закладку страницы) и начать их применять в повседневной поисковой рутине. Результат не заставит себя долго ждать. Итак, сводная страница наиболее используемых операторов языка поисковых запросов Google:

ОператорНазначение
ANDПоиск 1-го, 2-го и N-го слова (логическое «И», используется по умолчанию)
ORПоиск 1-го или 2-го слова (логическое «ИЛИ»)
» «Поиск точной фразы, заключенной в » «
+Выделение главных ключевых слов в запросе
Исключение нежелательных слов в результатах поисковой выдачи
site:Поиск по конкретному сайту
related:Поиск похожих страниц (обычно этот оператор применяется для поиска похожих сайтов)
link:Поиск ссылающихся страниц
~Включение в выдачу синонимов выделенного слова
filetype:Поиск документов по расширению
define:Поиск определений
cache:Обращение к странице, сохраненной в кеше поисковой машины
allinurl:Поиск страниц, содержащих в своем адресе все слова из поискового запроса
inurl:Поиск страниц, содержащих в своем адресе слова из поискового запроса в любом порядке и в любом количестве
inanchor:Поиск в тексте ссылок
allintitle:Поиск страниц, содержащих в своем заголовке все слова из поискового запроса
intitle:
Поиск страниц, содержащих в своем заголовке слова из поискового запроса в любом порядке и в любом количестве
allintext:Поиск страниц, содержащих все слова поискового запроса
:Задает регион поиска
info:Показывает информацию о странице
.

RFID технологии

Работают ли электромобили в зимних условиях?

Язык запросов Google — языки запросов различных браузеров

Язык запросов Google

Простой поиск

Google автоматически вставляет между ключевыми словами оператор «AND», поэтому в списке найденных документов присутствуют только те, которые содержат все заданные слова. В начале списка находятся документы, в которых ключевые слова расположены рядом.
Поддерживается поиск по фразе. Фраза заключается в кавычки.
Google ищет документы с точными соответствиями заданных слов. Поэтому поиск документов на слово «hotel» и «hotels» даст разные результаты. То же правило относится и к словам, заданым во фразе.
Не поддерживает поиск по части ключевого слова.
Google не делает различия между строчными и прописными буквами.
Чтобы исключить документы, содержащие какое-то слово, нужно в запросе поставить перед этим словом знак «-» (без пробела). Возможна постановка знака также и перед фразой.
Google не поддерживает логический оператор «OR». Нельзя задать поиск документов, в которых содержалось бы или первое, или второе слово. Вместо этого предлагается сделать несколько запросов, варьируя ключевые слова.
Помимо кавычек Google учитывает следующие знаки препинания, служащие для связи слов: дефисы (mother-in-law), косые черты, знаки равенства, апострофы (Bill’s birthday). При поиске слова, связанные этими знаками, воспринимаются как фраза.
При поиске Google игнорирует некоторые слова и знаки, т.н. стоп-слова. Сюда входят одиночные цифры и буквы, а также слова типа http, the, to и проч. В тех случаях, когда учет стоп-слов является необходимым для поиска, перед ними ставится знак «+».
На данный момент Google поддерживает один специальный поисковый оператор «link». Это дает возможность выявить документы со ссылкой на данный URL. Например, на запрос link:www.nlr.ru будут получены документы со ссылками на домашнюю страницу РНБ. Такой запрос нельзя комбинировать с обычными ключевыми словами. Имеется возможность поиска документов на определнном языке.
Памятка по использованию языка запросов

 

Для эффективного поиска в Интернет через поисковик Google надо использовать различные команды-операторы (поисковые запросы), задающие условия поиска. Только в этом случае у Вас будет не миллион страниц в результате, а список документов, которые полностью удовлетворяют условиям поиска.

В таблице приведён перечень наиболее популярных операторов (команд) из языка поисковых запросов компании Google.

Оператор

Назначение

« »

Пробел — логическое «И», даёт команду для Гугла на поиск всех слов, разделённых пробелом.

OR

Логическое «ИЛИ» позволяет найти несколько вариантов слов или выражений. Ему соответствует символ«|».

+

Знак Плюс заставит Google обязательно учесть слово, перед которым он стоит, при обработке запроса.

Минус — логическое «НЕ». Даёт поисковику команду на исключение этого слова из результатов поиска

«»

Двойные кавычки позволяют найти только то выражение, которое в них содержится.

~

 Спецсимвол «~» дает Google команду искать не только указанное слово, но и его синонимы

*

Знак умножения заменяет одно слово. Можно указать сколько может быть разных слов между искомыми.

..

Две точки применяются при поиске числовых значений. Производится поиск диапазонов между числами «от — до»

filetype:

Оператор даёт возможность указать тип файла, в  котором должны находится слова выбранные для поиска.

site:

Ограничивает поиск слов, которые стоят перед оператором, указанным доменом или сайтом.

movie:

 Этот запрос даёт команду для поиска различной информации о видеофильмах.

daterange:

Поиск страниц, проиндексированных за указанный промежуток дней, указанных в Julian Day Number,конвертер даты

safesearch:

Безопасный поиск. В результатах будут исключены ссылки на сайты с содержимым для взрослых (адалт контент)

allintitle:

В результате поискового запроса будет выдан список страниц, у которых есть данные слова в заголовке.

intitle:

Первое слово будет содержаться в заголовке, а все остальные в любом месте страницы.

allinurl:

В результате запроса будет выдан список страниц, у которых есть данные слова в адресе страницы, в её URL.

inurl:

Аналогичен оператору allinurl, только производит поиск в адресах страниц одного слова.

allintext:

Используется для поиска слов только в тексте документов. Игнорирует ссылки, URL-адреса и названия.

intext:

Аналогичен оператору allintext, только производит поиск по тексту документа одного слова.

allinanchor:

При этом запросе поиск будет производиться по тексту ссылок, все слова должны быть в ссылке

inanchor:

Аналогичен оператору allinanchor, только производит поиск по тексту ссылок одно слово.

define:

Покажет страницы на которых есть описание значения введенного слова. Своего рода — толковый словарь.

related:

Поисковик выдаст страницы, которые похожи по тематике с указанной в строке поиска.

info:

Информация о странице, для просмотра дополнительных сведений необходимо пройти по ссылкам.

cache:

Этот оператор покажет последнюю сохраненную в кеше Google копию страницы и дату её сохранения.

link:

Покажет все страницы, которые ссылаются на страницу с указанным адресом.

Язык поисковых запросов | Google Issue Tracker

Язык поискового запроса — это синтаксис, который вы используете для поиска проблем. в системе отслеживания проблем Google. Вы можете использовать язык в поисковых запросах, которые вы введите в строку поиска. Вы также можете использовать конструктор поиска для графического выберите критерии, которые затем преобразуются в язык запросов, когда конструктор поиска закрыт.

Язык запросов позволяет выполнять поиск по следующим критериям:

  • Ключевые слова
  • Пары поле/значение

Поиск, который вы выполняете, может содержать несколько критериев, включая комбинацию ключевых слов и пар поле/значение. Синтаксис языка запросов позволяет указать взаимосвязь и порядок, в котором критерии рассматриваются с помощью логические операторы, круглые скобки и кавычки.

Поиск по ключевым словам

Ключевые слова — это текстовые строки, которые можно использовать для поиска по определенным полям в проблемы. Эти поля:

  • Заголовок
  • Комментарии
  • Имена вложений
  • Поля, содержащие пользователей (например, Правопреемник или CC )
  • Поля, содержащие внутренний идентификационный номер (например, те, которые указывают компонент или горячие списки, которые содержат проблему)
  • Поля, содержащие номера версий
  • Пользовательские поля

Примером критериев поиска по ключевым словам является строка свойств конфигурации . Когда вы вводите этот критерий в поиск, средство отслеживания проблем выполняет глобальный поиск проблем. во всех компонентах и ​​возвращает те, чьи поля выше содержат оба ключевых слова, в соответствии с вашим контролем доступа разрешения. Ключевые слова могут быть в разные поля или одни и те же поля.

Система отслеживания проблем рассматривает пробел, разделяющий критерии поиска, как неявный оператор И . Вы можете использовать кавычки ( " ) для укажите, что строка из нескольких слов должна рассматриваться как одно ключевое слово. Все поиск в системе отслеживания ошибок не зависит от регистра, независимо от того, используете ли вы кавычки или нет. Метки.

Поиск пары поле/значение

Вы также можете указать критерии поиска в виде пары поле/значение. Базовый синтаксис [поле]:[значение] . Для текстовых полей этот синтаксис соответствует задачам, в которых указанное поле содержит значение . Для других типов полей он соответствует проблемы, где значение поля равно эквивалентно .

Например, поиск title:latency соответствует задачам со словом latency в поле Заголовок . Поиск priority:p0 находит задачи с приоритетом из p0 .

Обратите внимание, что для полей времени и количества можно использовать другие относительные символы кроме символа двоеточия. См. Реляционные операторы ниже.

Поиск по специальным значениям с использованием any и none

Дополнительные поля могут быть запрошены со специальными значениями any и none . любой соответствует любому ненулевому значению. нет соответствует нулевым значениям. Для списка всех поддерживаемые метки полей на языке поискового запроса, см. Справочник по поисковым запросам.

Логические операторы

Логические операторы позволяют указать более одного критерия и указать отношения между ними. Как отмечалось выше, символы пробела вне кавычек действуют как неявные 9Операторы 0039 И . Трекер проблем поддерживает следующие дополнительные явные логические операторы:

Оператор Альтернативный символ Описание Пример
И {пробел} Соответствует, если задача содержит оба критерия звезда: истина И идентификатор компонента: 46046
ИЛИ | Соответствует, если проблема содержит любой критерий тип:(Ошибка|feature_request)
НЕ Соответствует, если задача не содержит критериев -правопреемник: Джим
«. ..» Соответствует, если в выпуске есть цитируемая фраза (слова в кавычках идут в том же порядке) комментарий:"У нас проблема"
( ) Группирует значения или критерии поиска вместе статус: открыто И (приоритет: (p0|p1) ИЛИ серьезность: (s0|s1))

Обратите внимание на следующее:

  • Вы должны использовать все заглавные буквы для И , ИЛИ и НЕ .

  • Оператор NOT имеет то же значение, если он предшествует имени поля или значение поля. Это означает, что -assignee:jim и assignee:-jim являются эквивалент.

  • Свободно используйте круглые скобки, чтобы четко группировать термины в поисковом запросе. К по умолчанию средство отслеживания проблем связывает НЕ с термином, следующим сразу за это только и группирует ИЛИ с двумя терминами, которые заключают его в скобки. Например, поисковый запрос title:(a OR b NOT c AND d) эквивалентен title:((a OR b) И (НЕ в) И г) .

Дефисы

Символ дефиса ( - ) имеет разные значения в зависимости от контекста поиска. запрос:

  • Система отслеживания проблем обрабатывает тире перед словом в поиске как НЕ оператор. Например, критерии поиска - правопреемник: нет или правопреемник: - нет возвращает все задачи, у которых есть правопреемник.

  • Система отслеживания ошибок рассматривает строки, соединенные дефисом, как заключенные по кавычкам. Например, критерий поиска современный эквивалентно "современный" .

  • Средство отслеживания проблем обрабатывает слова, написанные через дефис в поле задачи, как независимые слова разделены пробелом. Это означает, что если в задаче есть слово ультрасовременный в названии и вы выполняете поисковый запрос название:(состояние техники) или название:("состояние техники") , выпуск возвращается как часть результатов поиска.

Реляционные операторы

Базовый синтаксис для критериев поиска поля/значения: [поле]:[значение] , где символ двоеточия ( : ) указывает, что данное поле должно быть равно или содержать указанное значение для того, чтобы проблема возвращалась в поиске Результаты.

Поля, содержащие значение времени ( создано , изменено , разрешено , проверено и некоторые настраиваемые поля) или значение счетчика ( дубликатов , голосов , commentcount и cccount ) поддерживают следующие дополнительные реляционные операторы:

Символ Описание
< Соответствует проблеме, если ее значение меньше или раньше вашего поискового значения.
<= Соответствует проблеме, если ее значение меньше/ранее или равно вашему поисковому значению.
> Соответствует проблеме, если ее значение больше или меньше вашего значения поиска.
>= Соответствует проблеме, если ее значение больше/после или равно вашему поисковому значению.

Поиск по времени

Язык поискового запроса предоставляет специальный синтаксис для сопоставления полей, которые содержат значение времени. Это позволяет системе отслеживания проблем выполнять поиск в диапазоне раз или относительное время по мере необходимости.

Формат абсолютного времени

Формат для указания времени:

[гггг]-[ММ]-[дд]Т[ЧЧ]:[мм]:[сс] .

В этом формате [гггг] — это 4-значный год, [ММ] — 2-значный месяц, [дд] — это двузначный день, [ЧЧ] — двузначный час в 24-часовом формате, [мм] — минуты, а [сс] — секунды. Все время указано в формате UTC.

Вы можете указать желаемый уровень конкретности при поиске проблем созданные в, до или после определенного времени. Например, вы можно указать created:2014-06 , чтобы найти задачи, созданные в любое время в июне. 2014 года. Для большей конкретики вы можете выполнить поиск created:2014-06-03T04 найти выпуски, которые были созданы 3 июня 2014 года в 4-й час (между 4 и 5 утра, УНИВЕРСАЛЬНОЕ ГЛОБАЛЬНОЕ ВРЕМЯ).

Диапазоны времени

Вы можете использовать два символа точки ( .. ), чтобы указать диапазон времени в поле/значении критерий поиска. Синтаксис: [поле]:[время начала]..[время окончания] . Начало и времена окончания могут иметь любую требуемую степень специфичности. Например, Verified:2013..2015 возвращает все проблемы, проверенные в 2013, 2014 или 2015 году.

Относительный формат времени

Вы также можете указать время в днях до сегодняшнего дня. Для этого используйте формат [дней]d , где [дней] — количество дней в прошлом, которое вы хотите для включения в результаты поиска. Например, вы можете использовать модифицированный:5d , чтобы найти вопросы, измененные за последние пять дней.

При использовании формата относительного времени оператор должен быть символом двоеточия. ( : ) как создано: 5d . Если вы хотите найти проблемы, которые не попадают в диапазон, вы можете использовать НЕ или - оператор.

Например, -verified:10d возвращает проблемы, которые не были проверены в последние 10 дней. Если вы хотите найти проблемы, которые были проверены, но не за последние 10 дней вы можете использовать (-verified:10d) И status:verified .

Понимание поиска лучше, чем когда-либо прежде

Поиск

25 октября 2019 г.

мин. чтение

Панду Наяк

Почетный сотрудник и вице-президент Google, Поиск

Если и есть что-то, чему я научился за 15 лет работы над поиском Google, так это тому, что человеческое любопытство безгранично. Каждый день мы видим миллиарды поисковых запросов, и 15% из этих запросов мы не видели раньше, поэтому мы создали способы возврата результатов для запросов, которые мы не можем предвидеть.

Когда такие люди, как вы или я, приходят в Поиск, мы не всегда уверены, как лучше сформулировать запрос. Мы можем не знать, какие слова использовать или как правильно написать что-то, потому что часто мы приходим к Поиску, чтобы учиться — у нас не обязательно есть знания для начала.

В основе поиска лежит понимание языка. Наша работа — выяснить, что вы ищете, и найти полезную информацию из Интернета, независимо от того, как вы пишете или комбинируете слова в своем запросе. Хотя мы продолжали улучшать наши возможности понимания языка на протяжении многих лет, иногда мы все еще не совсем правильно понимаем, особенно со сложными или диалоговыми запросами. На самом деле, это одна из причин, почему люди часто используют «ключевое слово», набирая строки слов, которые, как они думают, мы поймем, но на самом деле они не так, как обычно задают вопрос.

Благодаря последним достижениям нашей исследовательской группы в области понимания языка, которые стали возможными благодаря машинному обучению, мы значительно улучшили понимание запросов, что представляет собой самый большой скачок вперед за последние пять лет. один из самых больших скачков вперед в истории поиска.

Применение моделей BERT к поиску
В прошлом году мы представили и открыли исходный код метода на основе нейронной сети для предварительного обучения обработки естественного языка (NLP) под названием «Представления двунаправленного кодировщика от преобразователей», или, как мы его называем, — BERT. , для краткости. Эта технология позволяет любому обучить свою собственную современную систему ответов на вопросы.

Этот прорыв стал результатом исследования Google трансформеров: моделей, которые обрабатывают слова по отношению ко всем другим словам в предложении, а не по одному по порядку. Таким образом, модели BERT могут учитывать полный контекст слова, рассматривая слова, идущие до и после него, что особенно полезно для понимания целей поисковых запросов.

Но это возможно не только благодаря достижениям в области программного обеспечения: нам также требовалось новое оборудование. Некоторые из моделей, которые мы можем построить с помощью BERT, настолько сложны, что расширяют границы того, что мы можем делать с использованием традиционного оборудования, поэтому мы впервые используем новейшие облачные TPU для обслуживания результатов поиска и быстрого предоставления вам более актуальной информации. .

Взлом ваших запросов
Итак, это много технических подробностей, но что все это значит для вас? Что ж, применяя модели BERT как к ранжированию, так и к избранным фрагментам в Поиске, мы можем значительно улучшить работу , помогая вам находить полезную информацию. На самом деле, когда дело доходит до результатов ранжирования, BERT поможет Поиску лучше понимать один из 10 поисковых запросов в США на английском языке, и со временем мы перенесем это на большее количество языков и регионов.

В частности, для более длинных, более разговорных запросов или запросов, в которых предлоги, такие как «для» и «к», имеют большое значение для значения, Поиск сможет понять контекст слов в вашем запросе. Вы можете искать так, как вам кажется естественным.

Чтобы запустить эти улучшения, мы провели много тестов, чтобы убедиться, что изменения на самом деле более полезны. Вот несколько примеров, демонстрирующих наш процесс оценки, которые демонстрируют способность BERT понимать намерение, стоящее за вашим поиском.

Вот поисковый запрос «Путешественнику из Бразилии в США в 2019 году нужна виза». Слово «кому» и его связь с другими словами в запросе особенно важны для понимания смысла. Речь идет о бразильце, путешествующем в США, а не наоборот. Раньше наши алгоритмы не понимали важность этой связи, и мы возвращали результаты о гражданах США, путешествующих в Бразилию. С помощью BERT поиск может уловить этот нюанс и узнать, что очень распространенное слово «кому» на самом деле имеет здесь большое значение, и мы можем предоставить гораздо более релевантный результат для этого запроса.

Давайте посмотрим на другой запрос: «много ли стоят на работе косметологи». Раньше наши системы применяли метод сопоставления ключевых слов, сопоставляя термин «автономный» в результате со словом «стоять» в запросе. Но это неправильное использование слова «стоять» в контексте. Наши модели BERT, с другой стороны, понимают, что «стоять» связано с концепцией физических требований работы, и отображают более полезную реакцию.

Вот несколько других примеров, когда BERT помог нам уловить тонкие нюансы языка, которые компьютеры понимают не так, как люди.

Улучшение поиска на других языках
Мы также применяем BERT, чтобы сделать поиск лучше для людей во всем мире. Мощной характеристикой этих систем является то, что они могут извлекать знания из одного языка и применять их к другим. Таким образом, мы можем взять модели, основанные на улучшениях английского языка (язык, на котором существует подавляющее большинство веб-контента), и применить их к другим языкам. Это помогает нам лучше выдавать релевантные результаты на многих языках, на которых доступен поиск.

Для избранных фрагментов мы используем модель BERT для улучшения избранных фрагментов в двух десятках стран, где доступна эта функция, и видим значительные улучшения на таких языках, как корейский, хинди и португальский.

Поиск — это не решенная проблема
Независимо от того, что вы ищете или на каком языке говорите, мы надеемся, что вы сможете отказаться от некоторых ключевых слов и искать естественным образом. для тебя. Но время от времени вы все равно будете ставить Google в тупик. Даже с BERT мы не всегда понимаем это правильно. Если вы ищете «какой штат находится к югу от Небраски», лучшим предположением BERT будет сообщество под названием «Южная Небраска».

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *