Алгоритм яндекса палех – Палех Яндекс что это за новый алгоритм палех? Адаптивный дизайн переход на https что еще нужно?

Содержание

что это за поисковый алгоритм?

«Палех» – алгоритм поисковой выдачи для низкочастотных запросов, анонсированный Яндексом в 2016 году. Он назван в честь поселка в Ивановской области, где гербом является жар-птица.

Именно с хвостом жар-птицы ассоциируются низкочастотные запросы, их сложность. Вот схематическое изображение, которое предоставил сам Яндекс.

Алгоритм Палех

Клюв – это высокочастотные запросы. Туловище – среднечастотные.

Дело в том, что из 280 миллионов ежедневных запросов 100 миллионов являются низкочастотными. В последнее время веб-мастера все чаще и чаще стали использовать НЧ-запросы, так как они не имеют большой конкуренции и по ним проще выйти в топ.

Низкочастотные запросы бывают разными, угадать все невозможно. Суть данного алгоритма заключается в том, что ранжирование стало осуществляться не только по введенному запросу, но и по другим фразам со схожим смыслом. То есть теперь Яндекс пытается не просто найти совпадения в запросе и странице, а понять смысл и найти ответ на ваш вопрос.

Искусственные нейронные сети

Кроме НЧ-запросов, существует множество уникальных, которые вводятся по одному разу. Они сложны для обработки поисковой системой, ведь по ним нет подробной и детальной статистики. Поэтому разработчики Яндекса решили использовать искусственные нейронные сети. Именно ИНС легли в основу алгоритма «Палех». Главная особенность таких сетей – способность самообучаться. Они созданы по подобию человеческого мозга и могут поглощать огромное количество информации. На ее основе ИНС проводит анализ и выдает правильный результат.

Зачем был создан «Палех»

Яндексу важно понимать, удовлетворил ли он потребности пользователя. То есть нашел ли человек то, что искал. Когда пользователь вводит запрос, переходит на первый сайт и больше не возвращается к поиску, Яндекс понимает, что показал правильный результат. В дальнейшем он покажет его и другим людям. В случае с высокочастотными запросами таких данных много и, следовательно, легко подобрать верную выдачу.

С низкочастотными же запросами все гораздо сложнее. Яндексу требовалось много времени, чтобы подобрать оптимальный вариант выдачи по тому или иному НЧ-запросу. И сами пользователи далеко не с первого раза могли найти то, что искали. Именно для решения подобных проблем и был создан алгоритм «Палех».

Поисковый алгоритм Яндекса «Палех»

«Палех» – новый поисковый алгоритм Яндекса

Эволюция поисковых интернет-машин за последние 16 лет проделала огромный путь. Начиная когда-то развитие с простого обнаружения слов, сегодня крупные поисковики пришли к алгоритму так называемого «умного поиска» при помощи нейронных сетей.

Не отстаёт от актуальных мировых трендов и российский Яндекс – в начале ноября 2016 года в корпоративном блоге интернет-компании появилась статья с анонсом запуска нового поискового алгоритма «Палех».

Что такое нейронные сети – краткий ликбез, понятный и гуманитарию

Само понятие нейронных сетей появилось ещё на заре тотальной компьютеризации и зарождения интернета, однако, актуализировалось только в последние годы. Название программистами было выбрано по аналогии с научным термином биологических нейронов, которые, как известно, организуют работу нервной системы человека (и в том числе головного мозга). Ключевая задача каждого нейрона заключается в организации электрохимического импульса, – с его помощью один нейрон осуществляет взаимосвязь со всеми другими нейронами.

И этот же принцип общего одновременного взаимодействия одной части поступающих запросов с другими частями большой сети лежит в основе работы компьютерных нейросетей.

Нейросети

Биология нейронных сетей в виде единого живого организма

К прорывной технологической особенности машинных нейронных сетей можно отнести их «умение» работать с образами. Привычная классика подхода к обработке информация заключается в последовательной (алгоритмической) обработке символов, тогда как нейронные сети способны уже параллельно друг другу распознавать образы.

В сфере поисковых систем под символами и образами понимаются те «слова», которые люди вбивают в строку браузеров. Символы отличаются от образов своей размерностью, – условный размер вторых может на несколько порядков превышать размер символов.

«Палех» – низкочастотный словесный хвост поискового трафика Яндекса

Наглядности схематичной работе современных компьютерных нейросетей могут добавить простые факты результативности работы: сегодня машины способны работать с изображениями, звуками, текстом и другими образчиками образного мышления (присущего, казалось бы, только человеку). Машину можно обучить различать на картинках любые объекты действительности: людей, машины, животных, еду и т. д.

Алгоритм "Палех"


Работа поискового алгоритма «Палех» настроена на различении смысла забиваемых в поисковик пользователями слов. Притом даже не простых, популярных в народе, а – сложных, многосоставных, неконкретных, имеющих очень далёкое отношение к тому, что человек пытается найти (то есть, по сути образных).

Почему, собственно, новый алгоритм называется «Палехом»? Разработчики Яндекса все пользовательские запросы разделили на три части, представив их в виде туловища мифологической Жар-птицы, частой героини, отображаемой на изделиях в стиле русского палехского ремесла. Список наиболее популярных запросов (таких как «вконтакте», «новости», «музыка») довольно мал, поэтому на условном изображении Жар-птицы им отдан только «клюв». Пользовательские запросы средней частотной длины составляют её тело. И, наконец, пышный роскошный «хвост» у этой птицы образуют большие низкочастотные запросы, занимающие большую часть поискового трафика. Продвинутым анализом этих запросов и занимается новый поисковый алгоритм «Палех».

Палехская Жар-птица

Палехская Жар-птица – мифологическое существо, как символ поискового потока Яндекса

Примеры фантастических, ассоциативно-образных многочастотных запросов

Примеры многочастотных образных запросов в Рунете бывают поистине причудливыми, если не сказать даже фантастическими. Ищущие фильм «Бойцовский клуб» люди, например, могут вбить в поисковик следующее: «офисный клерк и его воображаемый друг фильм». Интересующиеся днём Благодарения, но забывшие название торжества люди обращаются за помощью с запросом «праздник с курицами в Америке». А дети, подростки и вообще зачастую придумывают целые мини-«истории», – «как узнать сколько лет девушке Человека-паука в новом фильме?».

Сравнение с BM25

Понятно, что такие длинные и сложные по семантике запросы машинная система Яндекса встречает гораздо реже, чем короткие, одночастотные из «клюва» условной Жар-птицы. Соответственно, и чётко работающего алгоритма для понимания того, что всё же нужно человеку в каждом конкретном случае нет. Задача нередко осложняется тем, что человеческое слово многозначно: в поисковой выдаче вообще может выпадать с десяток ссылок на источники не имеющие отношения к искомой информации.

В решении этой сложной проблемы понимания образного, ассоциативного мышления человека и участвует нейронные системы нового поискового алгоритма «Палех».

Суть работы «Палеха» – немного простейшей математики

Для представления того, как функционирует нейросети русскоязычного поисковика при обработке многочастотных запросов, нужно понимать, что они накапливают внутри себя необходимую статистику правильности/неправильности соответствия выдачи страниц тому, что ищут люди. Эта статистика основывается на поведенческом факторе пользователей: если в выдаче нет сайтов с нужной информации, – человек ни по одной странице просто не кликнет. Или, кликнув и поняв, что на том или ином сайте необходимая информация отсутствует, он её тут же, в течение двух-трёх секунд закроет.

Понятно, что количество удачных (или неудачных) соответствий запросов с веб-страницами миллиарды. Нейронная сеть «Палех» позволяет для внутреннего математического удобства переводить это количество соответствий в группы, состоящие из трёхсот чисел каждая. Способ обработки запросов с близкими им вероятными ответами в трёхсотмерной системе координат называется семантическим вектором.

Семантика

Математика семантического вектора помогает человеку искать нужную информацию

Поисковая технология семантического вектора имеет в интернете огромный потенциал развития. Она позволяет, к примеру, работать, анализировать не только заголовки, но и сами тексты различных документов. Более того, в качестве семантического вектора можно представить всю совокупность сведений о пользователе в интернете – взятые со страничек соцсетей интересы, статистику предыдущих поисковых запросов и переходов по ссылкам, и это очень полезная информация не только для поисковиков, но и для маркетологов, веб-мастеров и других, связанных с интернет-бизнесом, людей.

Не исключено, что в перспективе алгоритмы нейронных поисковых систем по способу образного мышления, понимания запросов вплотную приблизятся к людям. И как знать, каким будет этот самый интернет в эпоху, когда поисковики будут понимать любого человека буквально с полуслова…

«Палех» – новый поисковый алгоритм Яндекса

Яндекс запустил новый поисковый алгоритм, который работает на основе нейронных сетей. «Палех» поможет Яндексу лучше подбирать ответы на редкие и уникальные поисковые запросы.

Впервые поиск использует нейронные сети для того, чтобы находить документы не по словам (которые используются в запросе и в самом документе), а по смыслу запроса и заголовка.

Предпосылки

При подборе ответов на запросы нельзя опираться только на слова: один и тот же смысл можно выразить совершенно по-разному. В этом случае нужны дополнительные данные, например, обезличенная статистика: на какие страницы перешли пользователи, задавшие такой же запрос. В случае с уникальными запросами статистики мало или нет вовсе — поэтому Яндексу трудно понять, какие страницы хорошо отвечают на запрос, а какие нет.

Поисковая модель на нейронных сетях, которую использует «Палех», умеет устанавливать смысловые соответствия между поисковым запросом и заголовками страниц. С её помощью можно выявить, что в запросе и на странице говорится об одном и том же, даже если у них нет общих ключевых слов. Так, поиск поймёт, что в запросе [

фильм про человека который выращивал картошку на другой планете] речь идёт о «Марсианине», хотя релевантные страницы могут и не содержать слов «картошка» или «планета».

Почему «Палех»

Редкие и уникальные запросы составляют почти треть всего потока поисковых запросов, поэтому иногда их называют «длинным хвостом» поиска. Новому алгоритму решили дать название «Палех» в честь Жар-птицы — сказочной птицы с длинным хвостом, которая часто появляется в сюжетах палехской миниатюры.

Более подробно об алгоритме «Палех» и особенностях поисковых запросов из «длинного хвоста» Яндекс рассказал своем блоге. О том, как разработчики поиска обучали нейронную сеть обрабатывать редкие и уникальные запросы, можно узнать в статье на «Хабрахабре».

Новый алгоритм Яндекса “Палех” — что это такое

Мы увеличиваем посещаемость и позиции в выдаче. Вы получаете продажи и платите только за реальный результат, только за целевые переходы из поисковых систем

Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».

Подпишись на рассылку и получи книгу в подарок!

Палех – это поисковой алгоритм Яндекса, основанный на работе нейронных сетей и семантического анализа, который вышел в ноябре 2016 года. Основной идеей алгоритма является возможность поиска не только по данным анализа всего текстового контента, но и по смысловой составляющей заголовков.

Больше видео на нашем канале — изучайте интернет-маркетинг с SEMANTICA

Зачем нужен Палех

Ежедневно Яндекс обрабатывает тысячи запросов, какие-то из них короткие, какие-то длинные, часть пользователи вводят очень часто, а другие уникальны и никогда не повторяются. Чтобы представить всю эту массу запросов, разработчики предлагают вспомнить Жар-птицу с палехских миниатюр. Её клюв – короткие и распространенные запросы, туловище – среднечастотные, а красивый развивающий хвост – те самые уникальные запросы, состоящие из нескольких слов и фраз.


Чтобы найти информацию по первым двум видам запросов, поисковик использует прошлый опыт пользователей на основании таких данных как время, проведенное на странице, добавление в закладки, оставленные комментарии и определяет ресурсы с нужными данными. С новыми запросами все не так просто, поисковик не может использовать прошлый опыт, потому что они настолько редкие или совершенно новые, что опыта просто не существует. Тут на помощь и приходит машинное обучение и семантический анализ. Цель Палеха – помочь пользователям находить необходимую информацию по запросам из «длинного хвоста».

Как работает Палех

Искусственные нейронные сети уже проявили себя в поиске картинок или музыки, теперь они учатся распознавать смысл текста. Это сложнее, ведь в данном случае необходимо, чтобы система анализировала накопленный опыт по простым запросам, определяла положительную и отрицательную статистики, самообучалась и совмещала информацию в тексте, который вбивает пользователь в поисковую строку и данные из заголовков документов.

Система переводит текст запроса и заголовки в 300 мерное пространство и присваивает им индивидуальный код, состоящий из 300 чисел.Это помогает определить семантический вектор.

Чтобы понять примерную механику работы алгоритма, разберем простой пример.

Вы открываете поисковик и начинаете вписывать в строку поиска текст нужного запроса, Палех переводит его в 300 мерное пространство, выстраивает свою систему координат и определяет документ, который больше всего подходит вашему запросу по смыслу, и выдает релевантный ответ.

Пока алгоритм работает не со всем текстом на страницах, а только с заголовками, в дальнейшем Яндекс планирует обрабатывать весь массив текстового контента, что приведет к более точным результатам и значительно улучшит выдачу по запросам «с длинным хвостом».

Работа нового алгоритма Яндекса Палех на примере

Отследить качество работы Палеха можно только на НЧ запросах. Например, вбивая в поисковик «фильм где герой убегает от людей судьбы в шляпах», вы получите сведения о картине «Меняющие реальность» 2011 года, а не сайты и форумы с ответами на вопрос.

Палех и SEO

Работа нового алгоритма не повлияет на коммерческие сайты, предлагающие услуги и товары, интернет-магазины. В ранжировании этих ресурсов ничего не изменится, ведь в данном случае на позиции влияют: коммерческие и поведенческие факторы, юзабилити, дизайн, ЧПУ и качество ссылочной массы.

Палех ориентирован на площадки с большим количеством текстового контента, его работа скажется на медиапорталах, на которых публикуется большое количество статей, например на сайтах строительной тематики, медицинских площадках, ресурсах об отдыхе и туризме и крупных информационных сайтах.

Новый алгоритм Яндекса «Палех» | Convertmonster

новый поисковый алгоритм яндекса

новый поисковый алгоритм яндекса

На днях Яндекс анонсировал запуск нового поискового алгоритма, который по традиции получил свое название в честь города в Ивановской области. Гербом города является жар-птица.

paleh-yandexpaleh-yandex

Герб города Палех

Именно она послужила основным аргументом к выбору названия.

И вот почему: хвост птицы символизирует сложные для понимания поиска низкочастотные запросы, туловище — среднечастотные, а высокочастотные — это клюв. Вот так схематично изображает это Яндекс:

алгоритм яндекса палехалгоритм яндекса палех

Палех — новый поисковый алгоритм ранжирования Яндекс

Почему именно длинный хвост был выбран символом низкочастотных запросов? Смотрите сами:

высокочастотные запросы яндексвысокочастотные запросы яндекс

Высокочастотные запросы в Яндекс.Метрике

Так выглядит верхняя строчка поисковых запросов я Яндекс.Метрике, за ней же тянется длиннющий хвост низкочастотных запросов, которые суммарно превосходят высокочастотные и среднечастотные запросы вместе взятые:

низкочастотные запросы яндекснизкочастотные запросы яндекс

Низкочастотные запросы в Яндекс.Метрике

Низкочастотные запросы, состоящие из нескольких слов, сложнее для обработки поисковой системой, так как по ним меньше статистики. Для решения этой непростой задачи Яндекс начал использовать метод машинного обучения: искусственные нейронные сети (ИНС).

Искусственные нейронные сети — просто о сложном

Простыми словами ИНС — это метод программирования, отличительной особенностью которого является способность к самообучению. Создан он по образу нейросетей человеческого мозга. В ходе обучения ИНС поглощает огромное кол-во информации и на базе этого опыта может анализировать и выдавать верный ответ на запрос. В нашем случае это связь между поисковым запросом и релевантным заголовком на странице сайта.

Искусственные нейронные сети ЯндексИскусственные нейронные сети Яндекс

Искусственные нейронные сети

Связь между запросом и заголовком искусственная нейронная сеть представляет в виде векторов, так как сложнее всего ИНС распознает именно текст, а проще всего картинки. Таким образом, переформатировав текст в векторы, нейронная сеть сравнивает их и похожие между собой векторы предлагает в качестве релевантной страницы под запрос.

Что принесет на хвосте «Палех» оптимизатору?

Для тех, кто занимается развитием и продвижением сайтов, внедрение нового алгоритма Яндекса это еще один веский аргумент в пользу продвижения по низкочастотным запросам.

Перспективы развития нового алгоритма Яндекса, лишь подтверждают верность выбранного направления, ведь в недалеком будущем речь пойдет об улучшенном распознавании не только заголовков но и всего текста в целом. Так что скорее переставайте клепать SEO текстики, открывайте Метрику, Аналитику и Вордстат, рисуйте подробную карту персонажей и вперед к топовым строчкам в выдаче!

Ну а если вы хотите сэкономить свое время и доверить работу профессионалам, то welcome!

Заказать SEO-продвижение!

Подпишись и следи за выходом новых статей в нашем монстрограмме.

Не нашли интересующую вас статью про SEO? Тогда присылайте идею для статьи на почту [email protected] и мы напишем её!

Получайте бесплатные уроки и фишки по интернет-маркетингу

Алгоритм Палех / Поисковые алгоритмы Яндекса

 

Почему Палех?

 

Каждый божий день неутомимый Яндекс находит ответ на более чем 280 000 000 пользовательских запросов. Высокочастотные запросы [новости], [погода] или [одноклассники] запрашиваются ежесекундно. Другие запросы абсолютно уникальные. Вполне возможно, что такие фразы задают один раз в год и больше они не повторяются. По статистике Яндекса подобные фразы составляют порядка 35% от общего количества запросов по всем частотностям. Для пущей наглядности Яндекс представил графическое частотное распределение запросов в виде сказочной Жар-Птицы. В клюве находятся самые распространённые высокочастотные фразы, в туловище – среднечастотные. Длинный хвост состоит исключительно из низкочастотных фраз, коих набирается каждый день свыше 100 миллионов.

 

 

 

 

Благодаря новому алгоритму «Палех» поиск Яндекса обладает лучшей релевантностью и способен давать корректный ответ на сложные фразы из нескольких слов. Низкочастотные запросы из «длинного хвоста» разделяются на группы. Например, для детей поиск Яндекса – это живой и понимающий собеседник, которому часто задают своеобразные вопросы: [дорогой яндекс посоветуй где найти новые игры про зубную фею]. Другой сегмент для тех, кто решил найти название кинофильма или книги по отдельному эпизоду [фильм где профессор отправился на автомобиле в будущее] («Назад в будущее») или [фильм где астронавты летят к солнцу] («Пекло»).

 

НЧ-запросы из хвоста птицы Палех представляют определённую сложность в плане выдачи релевантных ответов. Если по ВЧ-фразам накоплена объёмная пользовательская статистика о действиях посетителей сайтов, то для ультранизкочастотных и редких фраз из хвоста птицы, поведенческие данные могут вовсе отсутствовать. В этом случае Яндексу сложнее строить релевантную поисковую выдачу, так как смысл запроса в органическом поиске и на искомой страницы может отличаться. Чтобы получить достоверные результаты и представить корректную выдачу Яндекс использует возможности нейронных сетей.

 

 

Особенности алгоритма Палех

 

В основе работы алгоритма Палеха лежит нейронная сеть. Нейросеть обучилась работать с положительными и отрицательными примерами, заранее предсказывая релевантность документа по искомой ключевой фразе. Перед нейронной сетью поставлена главная цель – понять семантическую близость поисковых запросов и содержимого веб-страниц. С этим делом Палех справляется намного лучше, чем алгоритм ВМ25, особенно при подборе документов по нечётким запросам. Переформулировка ключевых фраз путает все карты для BM25 – фактор принимает нулевое значение на релевантных заголовках. Алгоритм Палех стойко выдерживает эксперименты с поисковыми запросами, придавая релевантным заголовкам высокое значение фактора, нерелевантным – низкое.

 

Таким образом, разработчики нового алгоритма Яндекса создали улучшенную модель ранжирования документов при поиске по нечётким фразам. Палех одинаково хорошо работает со всеми типами пользовательским запросов во всех регионах поиска и на всех языках (кроме поиска по цитатам). Недавние колебания органического трафика, которые заметили наблюдательные веб-мастера, могут быть связаны с запуском нового алгоритма.

 

 

Семантический анализ

 

В последние годы нейронные сети представляют одну из форм развития искусственного интеллекта на основе технологий машинного обучения Яндекса. Нейросети научились многому и добились выдающихся результатов в процессе анализа текстовой, графической и звуковой информации. Сегодня нейронная сеть быстро учится определять отдельные объекты на сложных изображениях. При обучении нейросеть анализирует значительные объёмы как положительных, так и отрицательных примеров. По итогам обучения достигается высокая вероятность распознавания заданных объектов на любых графических изображениях.

 

При работе алгоритма Палех с пользовательскими запросами вместо картинок используются заголовки и тексты на страницах сайтов. На основе поведения пользователей подбираются примеры с положительным и отрицательными ответом. При обучении подбираются пары «запрос – заголовок», чтобы нейронная сеть научилась «думать», как человек и понимать смысл между тем, что ищет пользователя и тем, что написано в заголовке текста.

 

 

Семантический вектор

 

Но нейронная сеть Палех «любит» работать с числами и для удобства поиска смысловых соответствий заголовки страниц трансформированы в группы, в каждой из которых находится триста чисел. Таким образом, каждый просканированный документ из базы данных Яндекс получил собственные уникальные координаты в гипотетическом пространстве из 300 измерений. Для обычного человека, далёкого от высшей математики, довольно сложно представить подобную систему координат. По аналогии с трехмерным пространством, где каждая точка имеет координаты по трём осям и, соответственно, точное расположение в пространстве из трех измерений, каждая веб-страница имеет собственные координаты в N-мерном пространстве, которые определяются по расположению точки на каждой из трехсот координатных осей.

 

Схожим образом алгоритм Палех переводит текст поисковой фразы в набор чисел. Проще говоря, запрос и текст веб-страницы размещаются в идентичном координатном пространстве. Этот способ анализа и обработки поисковых запросов с последующим сравнением с возможными ответами получил название «семантический вектор». Он выявляет те страницы, которые лучшим образом отвечают на пользовательские запросы. Семантический вектор умеет работать с НЧ-фразами и предоставляет релевантные страницы под сложные фразы из «длинного хвоста». Даже в самом трудном случае, когда запрос и текст не содержат идентичных слов, семантический вектор сможет сопоставить поисковую фразу и веб-страницу на предмет поиска общего смысла.

 

 

Дальнейшее развитие поиска

 

Семантический вектор нашел применение в органическом поиске Яндекса и прочих пользовательских сервисах поисковой системы. По этой технологии в Яндекс.Картинках происходит поиск изображений по точному тексту. Дальнейшее развитие технологии семантического вектора на основе сетей с искусственными интеллектом позволит анализировать тексты просканированных документов и предоставлять данные в трёхсотмерном цифровом пространстве. Другое направление – анализ поведения пользователей в сети Интернет и разработка профиля пользователя с учётом его интересов и намерений. Стратегическая цель развития нейросетей – создать поисковые модели, которые работают на технологиях искусственного интеллекта и понимают семантический смысл пользовательских запросов и текстового контента так же хорошо, как это делает обычный человек.

 

WM+

 

 

Алгоритм Яндекса Палех — принципы работы и особенности

К созданию алгоритма «Палех» разработчики отнеслись прямо-таки креативно. Творческий подход чувствуется уже в самом названии. Имя продукту дали по знаменитой деревне в Ивановской области, которая издавна славится ремесленным искусством. Кроме того, узнаваемость деревня получила благодаря изящному гербу: застывшая в полете жар-птица.

Содержание:

  1. Народное творчество и нейронные сети
  2. «Палех»: практическое назначение
  3. Как это работает

Народное творчество и нейронные сети

«Палех» — новый алгоритм от Yandex, который был анонсирован еще осенью 2016 года, в ноябре. Схема частотности запросов представлена в виде жар-птицы. Идея его разработки и запуска перекликается с продуктивным алгоритмом Гугла RankBrain. Функционал этого сервиса также позволяет обрабатывать запросы из «хвоста» птицы.

Схематически частотность запросов Наполнение

Клюв (высокочастотные запросы)

Здесь список не особенно большой, но запросы из него задают очень часто. Например, какие-либо сведения по социальной сети ВКонтакте запрашиваются практически каждую минуту. Также часто пользователей интересует информация о погоде в разных частях страны.

Туловище (среднечастотные запросы) Список в этой категории больше. Запросы из нее встречаются относительно часто. Как правило, это информация о новостях по регионам.
Хвост (низкочастотные запросы) В эту категорию входят запросы, которые встречаются реже всего, но при этом отличаются «многословием». В своем большинстве это попытка пользователей найти фильм, песню или товар по своему, «авторскому» описанию. Часто описание выглядит сколь схематично, столь же и неуклюже.

Типичные примеры низкочастотных запросов: минус на песню Фредди Меркьюри Шоу должно быть продолжено; кино где Аль Пачино молодой мафиози; посудомойка на большое количество комплектов посуды.

Задавшись целью создать новый алгоритм, разработчики отталкивались от беспристрастной статистики. Она утверждает, что из 200 млн запросов за одни только сутки более 100 млн относится к тем, которые принято называть низкочастотными. Эту особенность взяли на вооружение веб-мастера, поскольку именно низкочастотные запросы характеризуются минимальной конкуренцией. То есть, это тот сегмент поисковика, по которому можно легко «прорваться» в топ.

Бессмысленно пытаться как-то классифицировать низкочастотные запросы. Сколько пользователей, столько и предпочтений.

Алгоритм «Палех» от Яндекса ранжирует сайты не по вбитым в строку словам, а по фразам с идентичным содержанием. Другими словами, поисковик ищет сходство не только в лексических моментах, но и в общем смысле запроса.

Помимо низкочастотных, имеется много разнообразных (иногда — эксклюзивных) запросов, которые появляются в строке поиска буквально по одному разу. Как правило, это попытка пользователей получить сугубо специфичные сведения профессионального, технического или искусствоведческого характера.

Такие запросы обрабатывать очень трудно даже машине. Скрупулезная статистика по ним попросту отсутствует. Именно поэтому авторы нового алгоритма прибегли к искусственным нейронным сетям.

Таким образом, функционал «Палеха» базируется на ИНС, которые имеют уникальное свойство: они могут самосовершенствоваться и самообучаться. Они сформированы по образу мозга человека, что обусловило их способность впитывать и обрабатывать большой объем информации. То есть, получив длинный и замысловатый вопрос, ИНС, прежде всего, проводят серьезно аналитическую работу по его внутреннему содержанию. Затем пользователю предлагается максимально верный и точный результат.

«Палех»: практическое назначение

Поисковая сеть устроена очень сложно и умно. Яндекс самостоятельно способен проанализировать степень удовлетворенности потребительского запроса. Если пользователь находит нужную информацию на первой строке и сразу же переходит на нужный сайт, то поисковик определяет это как реальную помощь и удовлетворение потребностей. То есть, пользователю был предложен верный результат.

Машина «запомнит» этот путь и в дальнейшей практике будет предлагать его другим людям. В сегменте высокочастотных запросов поисковику легче сориентироваться, поскольку здесь данных очень много. Верная выдача подбирается практически мгновенно.

Для НЧ ситуация другая. На переработку низкочастотных запросов требуется больше времени. Подобрать единственно верный ответ труднее, поскольку на него есть меньше аналогов в памяти машины. Поэтому в данном сегменте типичной является ситуация, когда пользователь ищет, и никак не может найти желаемое. Он пытается перефразировать запрос, не понимая, что машина быстрее ориентируется по коротким формулировкам.

Алгоритм «Палеха» изначально задумывался для того, чтобы низкочастотные запросы удовлетворялись так же быстро, как и любые другие.

Как это работает

Все технологии, основанные на нейронных сетях, специалисты определяют как искусственный интеллект. Алгоритм «Палех» способен обучаться. Он использует не только сведения, загруженные в базу, но и анализирует поведение пользователей. Машина со временем самостоятельно определяет, какие страницы «любят» пользователи, а какие — нет.

Нейронные сети сформированы по образу человеческого мозга, они способны перерабатывать разноплановые сведения:

  • распознавать речь;
  • вспоминать образы на картинках;
  • запоминать длинные предложения;
  • искать аналоги в разных семантических комбинациях.

По сути, машина работает всего с двумя текстами: запросом пользователя и документом. Документ выдается после достаточно серьезной аналитической работы машины.

В настоящее время искусственные нейронные сети способны анализировать даже звуки и образы, и находить их аналоги в заданном сегменте.

Почему это свойство разработчики взяли на вооружение только сейчас? Дело в том, что со смыслом и содержанием работать гораздо сложнее, чем с конкретными лексемами или картинками. Новый алгоритм генерирует похожие векторы в близких по смыслу текстах. Он актуализировался, когда инвертированного индекса (простого поиска по слову) и даже поиска с учетом ссылок стало недостаточно.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *