Поисковая система что это такое: Что такое поисковая система?

Содержание

что это, виды, как устроена

Поисковая система (ПС) — это набор алгоритмов, позволяющих проводить поиск в интернете. Характерная особенность ПС — мгновенное нахождение информации по конкретной фразе или определенному слову. Благодаря процессу индексирования она способна сканировать и затем извлекать данные из миллионов документов. И все это — за считанные миллисекунды.

Присоединяйтесь к нашему Telegram-каналу!

  • Теперь Вы можете читать последние новости из мира интернет-маркетинга в мессенджере Telegram на своём мобильном телефоне.
  • Для этого вам необходимо подписаться на наш канал.

История поисковых систем

Первой ПС принято считать W3Catalog — она появилась в 1993 году. W3Catalog представлял из себя не классическую поисковую машину (ПМ), а скорее обычный каталог, содержащий списки сайтов / адресов. Полноценная ПМ в интернете появилась в 1994 году: и это была вовсе не Google, а Aliweb 🙂 

W3Catalog доступен и в 2022 году. Пример сайтов — в разделе Media and Entertainment

Aliweb первой в мире начала обрабатывать контент сайтов: сканировать, индексировать его, перемещая в собственный индекс.

Так выглядел Aliweb в 1995 году

Но даже у Aliweb еще не было краулеров в привычном для нас понимании, т. е. для автоматического сканирования всех новых страниц. Информацию о новых сайтах добавляли сами вебмастеры: они указывали названия и ключевые слова для каждой страницы в общую базу данных (БД), которую позже и сканировал Aliweb.

За несколько десятилетий было создано свыше тысячи разнообразных ПС. Лишь десятки из них сумели дойти до наших дней и остаются работоспособными сегодня. Самыми популярными поисковыми системами в России уже долгие годы остается Google и «Яндекс». 

Самые популярные ПС в мире. Динамика с 2014 по 2021 годы 

Как устроены поисковые системы

Если проводить аналогию с нецифровым миром, ПС — это картотека в библиотеке, где у каждой книги есть свой уникальный номер.

По этому номеру ее можно найти в каталоге. 

Упрощенный алгоритм работы таков: 

  1. Пользователь указывает поисковый запрос. 
  2. ПС анализирует весь ранее собранный индекс и находит документы, которые ему максимально релевантны. 
  3. Наиболее релевантные документы сортируются: от наиболее близких поисковому запросу к наименее.
  4. Результаты выводятся на странице поисковой выдачи.

Что такое краулер поисковой системы

Краулер — это специальная программа, используемая ПС для перехода по URL, которые он обнаруживает на веб-странице. Затем краулер помечает такие ссылки специальным образом.

Благодаря найденным URL поисковый робот находит все новые и новые страницы (о которых ПС не знала ранее)

Последовательность работы ПС: этапы обработки документа

Поисковая система состоит из трех компонентов:

Далее поговорим о том, как индексирование документов помогает функционировать поисковым системам.

Зачем поисковым системам нужен индекс

Индекс по своей сути — это просто база данных, необходимая для ускорения поискового процесса: извлечения данных о документах, обработки и представлении результатов поиска пользователю. Любые данные из индексной БД «вынимаются» за миллисекунды, ведь в индексе ПС уже хранится информация обо всех страницах в интернете. 

Индексация — извлечение важных для ПС данных и дальнейшая их конвертация в понятные поисковой системе форматы

Кэш поисковой системы нужен для ускорения экстракции данных (по аналогии, например, с разархивированием архива в WinRar) с ранее посещенных веб-страниц.

ПС хранят индекс не просто так: они обращаются к нему в дальнейшем, при работе с запросами. Так что хранить эту базу данных где-то, в любом случае, нужно.

Читайте также:

Индексация в поисковых системах: что это простыми словами

Как поисковые системы хранят индекс на своей стороне

Google хранит документы фрагментарно или полностью на своих серверах. Само хранение происходит в кэше (это отдельная память, обладающая высокой скоростью доступа). Другие поисковики хранят только определенные фразы или каждое слово и связывают его с документом в дальнейшем.

Как ПС обновляют свой индекс и базы данных

В среде SEO-специалистов обновления индекса систем называются апдейтами выдачи. У каждой поисковой системы такие апдейты происходят по-разному. Google добавляет новые документы в свой индекс ежедневно, причем несколько раз в сутки. «Яндекс» действует по-другому — новые страницы попадают в индекс произвольно (апдейт происходит 2 раза в неделю, например).

Самыми важными факторами является суммарная релевантность ключевой фразы и подобранного документа, проработанность индекса и особенности морфологических параметров языка пользователя.

Виды поисковых систем

Выделим три классификации:

  1. По особенностям использования индекса.
  2. По типу индекса.
  3. По области поиска.

I По особенностям использования индекса

Безиндексные ПС

Это мультипотоковые системы, которые функционируют через крупные поисковые системы. Безиндексные системы просто агрегатируют их результаты поиска и проводят собственную сортировку.

Примеры: Bing (Microsoft Bing), AskNet, Quintura, Ixuick, MetaCrawler.

«Нигма» — самая известная российская метапоисковая система (ныне не существует)
Классические поисковые машины  

Еще говорят «поисковый движок», «поисковые машины с индексом». Пауки ПС сканируют все страницы в интернете, затем формируют собственный индекс (базы данных) с информацией о веб-документах. Поиск по БД в случае классической поисковой машины, условно, состоит из трех этапов: 

  1. Нахождение наиболее релевантного поисковой фразе документа.
  2. Ранжирование остальных документов исходя из их суммарной релевантности.
  3. Кластеризация документов.

Кроме этих функций, маркер классической ПМ — разные методы поиска ссылок в ручном и автоматическом режимах. В первом случае их добавляют в поисковую машину сами вебмастеры, во втором — краулеры сканируют сеть самостоятельно.

Google имеет черты гибридной ПС

Примеры: Google и «Яндекс».

Гибридные ПС

Относятся к классическим поисковым машинам, однако с неким допущением можно выделить их и в отдельную категорию.

Индекс здесь собирается не только за счет сканирования краулером ПС, но и благодаря пользовательским источникам данных: реестрам документов, каталогам, справочникам.

Примеры: Yahoo, «Яндекс», Google.

«Яндекс» — поисковая машина гибридного типа

Читайте также:

Отличия SEO под Яндекс и Google

Каталожные поисковые системы

Это пользовательские БД, где все данные добавляются вручную. Качество результатов поиска в таких ПС в теории должно быть заметно выше, чем в автогенерируемых системах.

Они могут выглядеть как рубрикатор заданной иерархии с большим количеством категорий и подкатегорий. Для каждого сайта указывается описание контента, заголовок и ссылка на страницу.  

ПС Open Directory Project (также известная как dmoz). Больше не существует

Примеры: Russia on the Net, AtRus, Yahoo!, Directory (сейчас некоторые уже не существуют).

II По типу индекса

В 2022 году массово распространены два типа ПС: с инвертированным индексом и с индексом, имеющим предопределенное расположение ключевых слов. Разница между ними легко прослеживается. 

Инвертированный индекс (ИИ)

Для слов в наборе документов указаны все страницы в реестре, где они упоминались. В свою очередь, сам ИИ может быть двух видов: 

  1. Лист документов для каждого слова.
  2. Лист документов для каждого слова + позиция слова в каждом веб-документе.

Пример: Google.

Индекс с предопределенным расположением ключевых слов (устаревший)

Все фразы упорядочены и отсортированы уже изначально по иерархическому принципу. В настоящий момент не известно ни одной крупной поисковой машины с этим типом индекса.

III По области поиска

Локальная ПС

Отдельностоящее ПО либо веб-приложение, которое разворачивается на компьютере пользователя и позволяет искать информацию, например, на жестком диске или в в пределах домашней сети.

Spotlight для операционной системы Mac OS — локальная поисковая система

Примеры: Tracker, Copernic Desktop Search.

Глобальная ПС

Веб-сайт / веб-приложение / сервис для поиска документов во всем интернете (или, например, в пределах конкретной доменной зоны).

«Спутник» — национальная поисковая система. Ныне закрыта

Примеры: Google, Bing, Yandex, Baidu.

При этом они могут содержать в себе элементы локальных поисковых систем: например, поиск в определенной доменной зоне или поддержка китайского языка по умолчанию, как Baidu. Есть также национальные ПС, созданные для использования в конкретной стране — наши «Спутник» и «Поиск Mail.ru».

Также существуют поисковые системы для поиска информации только в определенных каналах. Например:

  • на новостных сайтах;
  • внутри FTP-хранилищ.
  • в RSS-каналах;
  • в библиотечных ресурсах;
  • в интернет-магазинах;
  • в юзнете.

Юзнет — это глобальная компьютерная сеть для интернет-дискуссий и публикации файлов, состоит из набора групп новостей, организованных по темам. Пользователи размещают статьи или сообщения в этих группах новостей. Затем эти материалы публикуются уже на других платформах.

Что нужно знать о поисковых системах вебмастеру и пользователю

Поисковая система — это сложный набор алгоритмов, которые работают внутри единой компьютерной программы.  

Чтобы новая страница сайта отображалась в результатах поиска, она должна попасть в индекс. Краулеры ПС автоматически обходят все страницы в интернете, добавляя их в специальную базу данных. Обрабатывается также и содержимое страниц. 

Читайте также:

Факторы ранжирования Google и «Яндекс»: что это и как работает

Поисковая выдача зависит от суммарной релевантности документа по отношению к запросу. У каждой ПС свои методы определения релевантности, и подробно о них узнать нельзя. Известно лишь об общих принципах оценки:

  1. Семантический анализ слов в запросе, включая слова в поисковых фразах вместе и по отдельности.
  2. Идентифицирование типа запроса.
  3. Интерпретация орфографических ошибок.
  4. Определение синонимичности запроса.
  5. Сопоставление поисковой фразы с особенностями языковой модели.
  6. Определение актуальности информации.
  7. Определение региональности запроса.

СДЕЛАЕМ САЙТ, КОТОРЫЙ НРАВИТСЯ ПОИСКОВЫМ СИСТЕМАМ

Сайт

Телефон

Поисковая система: что это такое, как она работает

Поисковая система (поисковик) — это специальная программа, которая автоматизирует поиск информации в интернете. Благодаря индексации этот процесс происходит очень быстро, а в результате ранжирования пользователь получает упорядоченный список ресурсов, на которых содержится необходимая информация.

Искать информацию в интернете без поисковых систем было бы крайне сложно. Просмотреть триллионы страниц, расположенных хаотично, без всякой закономерности и структуры невозможно без использования специальных алгоритмов. Для этого и нужны поисковики. Они выстраивают четкую иерархию в этой системе и делают интернет доступным и удобным.

Самыми популярными поисковыми системами в России, по данным Яндекс.радар, являются «Яндекс» (61,7%) и Google (37,0%), доля Mail.ru и Rambler вместе взятых не превышает 1%.

Если обратиться к мировой статистике, то здесь лидирует Google (84,8%), а «Яндекс» (1,06%) уходит на 6-е место.

Доля рынка наиболее часто используемых поисковых систем по всему миру по состоянию на сентябрь 2022 г. Источник

Принципы работы поисковых систем

Принципы работы любой поисковой системы примерно одинаковы и их условно можно разделить на несколько этапов.

Составление списка страниц

Для того чтобы поисковая система смогла найти нужную фразу в большом количестве сайтов, эти сайты должны быть ей известны, то есть прочитаны и сохранены в памяти.

 

Можно сравнить с библиотекой: если вы не знаете, какие книги стоят на полках и никогда не заглядывали в них, то вероятность того, что вы быстро сориентируетесь и найдете нужную цитату, равна нулю.

Поисковая система узнает о содержимом сайтов с помощью специального робота — краулера, или паука. Название происходит от английского crawler (ползающее насекомое, ползунок). Робот обходит все страницы, переходит по ссылкам и постепенно охватывает миллиарды веб-страниц в сети, сохраняет их и отправляет на индексацию.

Индексация

Следующий этап — добавление данных о странице в базу поисковой системы. Обычно поисковик собирает и хранит информацию о содержимом страниц: ключевых словах, которые там используются, а также размещенном контенте (статьях, документах, изображениях, аудиофайлах). Пока страница не проиндексирована, для поисковика она не существует.

 

По аналогии с библиотекой это работает так: недостаточно знать, в каких примерно книгах содержится похожая фраза. Важно найти релевантную страницу с текстом. Тогда вы сможете воспользоваться этой информацией.

Искать фразу или слова, перелистывая страницы книги или просматривая весь сайт, неудобно. Но если у вас есть предметный указатель, например такой, который используется в технической литературе, учебниках или инструкциях к приборам, вы сможете без труда найти любой термин.

В предметном указателе к инструкции все термины расставлены по алфавиту и обозначены страницы, на которых они встречаются

Тот же принцип лежит в основе поисковой индексации.

Индексный робот получает информацию о странице от краулера и упорядочивает ее. Удаляет ненужные элементы, выбирает слова и запоминает, где эти слова были обнаружены. Получается подробный список адресов страниц и размещенных на них слов.

Ранжирование и поисковая выдача

Поиск и ранжирование — наиболее приближенная к пользователям и значимая для них часть процесса. Если предыдущие этапы проходят в автоматическом режиме и фактически являются подготовительными, то на этом этапе появляется видимый результат — поисковая выдача, ради которой и создаются поисковые машины.

Когда человек вводит текст в поисковую строку, машина с помощью алгоритмов выбирает все страницы, имеющие отношение к запросу. Их очень много и в таком количестве они не нужны, поэтому необходимо их отсортировать, упорядочить и выбрать релевантные страницы. То есть самые правильные и имеющие отношение к делу.

Этот процесс называется ранжированием. Он проходит в несколько этапов, на каждом из которых фильтрация становится сложнее, а список ресурсов сужается. Невозможно точно определить, какие алгоритмы влияют на ранжирование, потому что все поисковики используют свои формулы, которые постоянно обновляются и развиваются. 

Результаты поисковой выдачи различаются:

  • в разных поисковиках, так как используются различные критерии фильтрации;
  • в разных регионах, так как в запросах учитывается местонахождение пользователя;
  • на разных устройствах — в десктопной и мобильной версии;
  • по одинаковым запросам у разных пользователей, так как учитывается индивидуальная история поиска. 

По запросу «Муми тролли» «Яндекс» и Google выдают разные результаты, на первой странице совпадает только один сайт из шести

На выходе получается привычный для нас список ресурсов. Чем выше место веб-ресурса в этом списке, тем более актуальную информацию он содержит. Такая структура удобна пользователям и полезна владельцам страниц. Первые получают самую необходимую информацию в порядке значимости, вторые используют поисковую выдачу для продвижения своего сайта.

Апдейт и границы индексирования

Поисковая система использует данные только тех ресурсов, которые были проиндексированы. Это значит, что существуют страницы, которые не попадают в поисковую выдачу. 

Формальных ограничений нет, но на практике они возможны:

  • Языковые границы. Например, разные приоритеты индексации «Яндекс» и Google. «Яндекс» больше нацелен на русскоязычную аудиторию и ее интересы, хотя и не ограничивается только ими, Google индексирует сайты со всего мира.
  • Технические ошибки разработчиков.
  • Не все форматы данных одинаково хорошо индексируются, так как изначально поисковые машины были рассчитаны на обработку веб-страниц, то есть формат HTML.
  • Плохая работа сервера или сайт загружается с перебоями.
  • Дубли страниц и копипаст с других ресурсов.
  • Низкий трафик.
  • Слишком большая глубина сайта, размер документа — файлы более 10Мб не индексируются.
  • Другие причины, иногда такие экзотические, как «Adult-фильтр» — блокировка сайтов за взрослый контент. 

Но главная причина того, что страница не появляется в выдаче — она новая, и поисковый робот просто не успел ее проиндексировать. В зависимости от характеристик сайта обновление или апдейт страниц может занять от нескольких минут до недель. Проверить индексирование страницы можно в Яндекс.Вебмастере раздел «Индексирование», а в Google Search Console «Проверка URL».

Яндекс.Вебмастер помогает понять, виден ли сайт в поисковой выдаче

Апдейт не только обновляет базы данных поисковиков, но и приводит к пересортировке поисковой выдачи. Поэтому сайт, который находился на вершине ранжирования, может в один момент исчезнуть из зоны видимости. А так как критерии ранжирования засекречены, то снова вернуться в верхние строчки может быть довольно сложно.

Виды поисковых систем

Поисковые системы делятся на четыре категории в зависимости от типа обработки данных:

  1. Системы на основе поисковых роботов — краулеров. Принципы работы такой системы описаны выше и большинство популярных поисковых систем работает по этой технологии. Задача поисковика — обойти и просканировать сеть, чтобы создать структурированный архив веб-документов и список слов. А целью является создание ранжированного списка ресурсов.
    Примеры: Google, «Яндекс», Baidu (крупнейшая китайская поисковая система).
  2. Системы, управляемые человеком. Каталог сайтов полностью формируется вручную. Владелец сайта отправляет описание веб-мастеру и указывает категорию каталога, в которую его нужно включить. Сайт проверяет человек и включает в список, если он проходит модерацию. Это гарантирует более качественный контент, чем в первом варианте, но значительно замедляет ранжирование и обновление данных.
    Примеры: каталог Yahoo, dmoz
  3. Гибридные системы. Сочетание автоматических поисковых роботов и процессов, управляемых человеком. Например, восстановление в каталоге удаленного сайта, нарушившего правила. Владелец страницы в этом случае вносит исправления и отправляет запрос в поддержку. Решение о повторном включении ресурса в поисковую систему принимает эксперт.
    Примеры:  MSN. Сюда же условно можно отнести Google, «Яндекс» и другие популярные поисковики, функционал которых не исключает ручную корректировку каталогов.
  4. Метакраулеры. В отличие от поисковых систем, метакраулеры сами не сканируют веб-страницы для создания списков. Вместо этого они позволяют отправлять запросы нескольким поисковым системам одновременно.
    Примеры: dogpile, DuckDuckGo

Есть и другие специализированные сервисы, которые можно использовать для поиска информации. Некоторые из них более удобны для поиска книг, фотографий, а какие-то обеспечивают большую конфиденциальность при работе и не запрашивают данные пользователей.

Главные мысли

Что такое поисковая система?

К

  • Бен Луткевич, Технический писатель

Что такое поисковая система?

Поисковая система — это скоординированный набор программ, которые ищут и идентифицируют элементы в базе данных, соответствующие заданным критериям. Поисковые системы используются для доступа к информации во всемирной паутине.

Как работают поисковые системы?

Google — наиболее часто используемая поисковая система в Интернете. Поиск Google происходит в следующие три этапа:

  1. Ползание. Поисковые роботы обнаруживают, какие страницы существуют в Интернете. Поисковая система постоянно ищет новые и обновленные страницы, чтобы добавить их в свой список известных страниц. Это называется обнаружением URL . Как только страница обнаружена, сканер проверяет ее содержимое. Поисковая система использует алгоритм, чтобы выбрать, какие страницы сканировать и как часто.
  2. Индексация. После обхода страницы текстовое содержимое обрабатывается, анализируется и помечается атрибутами и метаданными, которые помогают поисковой системе понять, о чем содержание. Это также позволяет поисковой системе отсеивать дубликаты страниц и собирать информацию о содержании, например о стране или регионе, в котором находится страница, и об удобстве использования страницы.
  3. Поиск и ранжирование. Когда пользователь вводит запрос, поисковая система ищет в индексе соответствующие страницы и возвращает результаты, наиболее релевантные на странице результатов поисковой системы (SERP). Механизм ранжирует контент по ряду факторов, таких как авторитетность страницы, обратные ссылки на страницу и ключевые слова, содержащиеся на странице.

Специализированные поисковые системы более избирательны в отношении тех частей Интернета, которые они сканируют и индексируют. Например, Creative Commons Search — это поисковая система для контента, предоставленного для повторного использования в соответствии с лицензией Creative Commons. Эта поисковая система ищет только этот конкретный тип контента.

Поисковые системы для конкретной страны могут отдавать приоритет веб-сайтам, представленным на родном языке страны, по сравнению с веб-сайтами на английском языке. Отдельные веб-сайты, такие как крупные корпоративные сайты, могут использовать поисковую систему для индексации и извлечения контента только с сайта этой компании. Некоторые крупные компании, занимающиеся поисковыми системами, лицензируют или продают свои поисковые системы для использования на отдельных сайтах.

Поисковые системы сканируют, индексируют и ранжируют контент в Интернете, используя алгоритмы для определения места на страницах результатов.

Как поисковые системы ранжируют результаты

Не все поисковые системы ранжируют контент одинаково, но у некоторых есть схожие алгоритмы ранжирования. Поиск Google и другие поисковые системы ранжируют релевантные результаты на основе следующих критериев:

.
  • Значение запроса. Поисковая система просматривает пользовательские запросы, чтобы установить намерение искателя, т. е. конкретный тип информации, которую ищет пользователь. Для этого поисковые системы используют языковые модели. Языковые модели — это алгоритмы, которые считывают вводимые пользователем данные, понимают, что они означают, и определяют тип информации, которую ищет пользователь.
  • Актуальность. Ключевые слова из поисковых запросов сопоставляются с ключевыми словами в содержании. Ключевые слова, которые появляются в нескольких местах в содержании, означают большую релевантность, чем другие.
  • Качество. Поисковые системы ищут в содержании индикаторы компетентности, авторитетности и надежности. Если другие известные веб-сайты ссылаются на контент, он считается более надежным.
  • Удобство использования. Поисковые системы оценивают доступность контента и удобство для пользователей в целом и награждают контент более удобным просмотром страницы. Одним из примеров удобства использования страницы является удобство для мобильных устройств, которое является мерой того, насколько легко использовать веб-страницу на мобильном устройстве.
  • Данные пользователя. Предыдущая история поиска пользователя, настройки поиска и данные о местоположении — это лишь некоторые из типов данных, которые поисковые системы используют для определения рейтинга контента, который они выбирают.

Поисковые системы могут использовать другие показатели производительности веб-сайта, такие как показатель отказов и время, проведенное на странице, чтобы определить место веб-сайта на странице результатов. Поисковые системы могут возвращать разные результаты для одного и того же термина при поиске текстового контента по сравнению с поиском изображения или видео.

Поисковые системы часто предоставляют ссылки на видео на своих страницах результатов поиска.

Создатели контента используют поисковую оптимизацию (SEO), чтобы воспользоваться преимуществами вышеуказанных процессов. Оптимизация контента на странице для поисковых систем повышает ее видимость для поисковых систем и ее рейтинг в поисковой выдаче. Например, создатель контента может вставить ключевые слова, релевантные заданному поисковому запросу, чтобы улучшить результаты по этому запросу. Если создатель контента хочет, чтобы люди, которые ищут собак, попадали на его страницу, они могут добавить ключевые слова 9.0033 кость , поводок и собака . Они также могут содержать ссылки на страницы, которые Google считает авторитетными.

Какова цель поисковых систем?

Основная цель поисковой системы — помочь людям искать и находить информацию. Поисковые системы предназначены для предоставления людям нужной информации на основе набора критериев, таких как качество и релевантность.

Поставщики веб-страниц и веб-сайтов используют поисковые системы, чтобы зарабатывать деньги и собирать данные, такие как данные о посещениях, о пользователях, выполняющих поиск. Это второстепенные цели, которые требуют от пользователей уверенности в том, что контента, который они получают в поисковой выдаче, достаточно для взаимодействия с ним. Пользователи должны видеть, что информация, которую они получают, является правильной.

Доверие пользователей можно заслужить разными способами, включая следующие:

  • Органические результаты. Неоплачиваемые органические результаты считаются более надежными, чем платные результаты на основе рекламы.
  • Власть. Google пытается установить полномочия веб-страницы, чтобы идентифицировать ее как источник достоверной информации.
  • Конфиденциальность. DuckDuckGo — это поисковая система, которая использует защиту конфиденциальности для установления доверия. Он защищает конфиденциальность пользователей и позволяет избежать искаженных результатов поиска, которые могут быть получены из-за использования личной информации для таргетинга пользователей или помещения их в ограниченные категории поиска, известные как 9. 0033 пузырьки фильтра .
Поисковые системы возвращают как обычные, так и платные результаты; они различаются по нескольким параметрам.

Как поисковые системы зарабатывают деньги?

Поисковые системы зарабатывают деньги несколькими способами, включая следующие:

  • Объявления с оплатой за клик. Рекламодатели или сторонние рекламные сети размещают рекламу в поисковой выдаче и в самом контенте. Чем больше просмотров или кликов получает ключевое слово, связанное с поиском, тем больше рекламодатели платят за то, чтобы его реклама была связана с ним.
  • Данные пользователя. Поисковые системы также зарабатывают деньги на данных пользователей, которые они собирают. Примеры включают историю поиска и данные о местоположении. Эти данные используются для создания цифрового профиля для данного искателя, который поставщики поисковых систем могут использовать для показа целевой рекламы этому пользователю.
  • Контекстная реклама. Поисковые системы также извлекают выгоду из контекстной рекламы, которая напрямую связана с текущим поиском пользователя. Если поисковая система включает в себя функцию покупок на платформе, она может отображать контекстную рекламу продуктов, связанных с поиском пользователя, на боковой панели веб-сайта, где отображаются рекламные объявления. Например, если интернет-магазин продает книги, в углу страницы может появиться реклама очков для чтения.
  • Пожертвования. Некоторые поисковые системы предназначены для помощи некоммерческим организациям в сборе пожертвований.
  • Партнерские ссылки. Некоторые системы включают партнерские ссылки, когда поисковая система имеет партнерство, в котором партнер платит поисковой системе, когда пользователь щелкает ссылку партнера.

Как поисковые системы персонализируют результаты?

Поисковые системы персонализируют результаты на основе цифровых профилей поисковых систем, созданных на основе пользовательских данных. Пользовательские данные собираются из приложения или устройства, с помощью которого пользователь получает доступ к поисковой системе. Собранные пользовательские данные включают следующее:

  • история поиска
  • дата и время поиска
  • информация о местоположении
  • аудиоданные
  • идентификатор пользователя
  • идентификация устройства
  • IP-адрес
  • диагностические данные устройства
  • списки контактов
  • история покупок

Файлы cookie используются для отслеживания истории просмотров и других данных. Это небольшие текстовые файлы, отправленные с веб-сайтов, которые пользователь посещает, в свой веб-браузер. Поисковые системы используют файлы cookie для отслеживания пользовательских предпочтений и персонализации результатов и рекламы. Они могут запоминать настройки, такие как пароли, языковые настройки, фильтры содержимого, количество результатов на странице и информацию о сеансе.

Использование настроек приватного просмотра или просмотра в режиме инкогнито защищает пользователей от отслеживания, но только на уровне устройства. История поиска и другая информация, накопленная в ходе поиска, не сохраняется и удаляется после сеанса поиска. Однако интернет-провайдеры, работодатели и владельцы доменов посещаемых веб-сайтов могут отслеживать цифровую информацию, оставленную во время поиска.

Популярные поисковые системы

Google — самая популярная поисковая система, охватывающая более 9По данным службы анализа веб-трафика StatCounter, занимает 2% доли рынка поисковых систем по всему миру. Yahoo и Microsoft Bing занимают второе и третье места с почти 4% и чуть более 1% рынка соответственно.

DuckDuckGo приобрела некоторую популярность из-за своей направленности на защиту личных поисковых данных пользователей. Некоторые пользователи могут предпочесть использовать Bing или Yahoo для своих других интегрированных предложений.

Другими популярными поисковыми системами в мире являются следующие:

  • Байду
  • BoardReader
  • Храбрый поиск
  • Поиск Creative Commons
  • Экозия
  • Экору
  • Гибиру
  • Гигабласт
  • Дайте воду
  • Айстак
  • Моджик
  • МетаГер
  • Навер
  • Единый поиск
  • Поиск лука
  • Разведчик
  • Поиск Шифровать
  • SearX
  • Разумная гипероптимизированная сеть доступа к данным (Shodan)
  • Стартовая страница
  • Swisscows
  • Количество
  • Wiki.com
  • Вольфрам Альфа
  • Яндекс

Некоторые из этих систем, такие как Ecosia и Startpage, используют свои собственные поисковые роботы, но для индексации полагаются на более крупные и популярные поисковые системы, такие как Google и Bing. Другие, такие как Mojeek, используют собственные поисковые роботы и ведут собственный индекс.

Альтернативные поисковые системы, такие как HaystakOnion Search и Recon, позволяют пользователям просматривать темную сеть с помощью браузера Tor, который шифрует пользовательский трафик для дополнительной конфиденциальности и безопасности. Даркнет — это скрытая часть Интернета, недоступная для традиционных браузеров.

Другие поисковые системы фокусируются на конкретных типах информации. Например, Wolfram Alpha — это поисковая система в Интернете по научным и математическим темам. Shodan — это инструмент для поиска устройств, подключенных к Интернету.

Браузеры обычно имеют поисковую систему по умолчанию. Например, Google Chrome и Safari для iOS используют Google.

Будущее поисковых систем

Поисковые системы и компании, которые их разрабатывают, скорее всего, будут использовать новые технологии для повышения точности, релевантности и качества ответов, предоставляемых поисковыми системами. Они также будут использовать передовые технологии, такие как искусственный интеллект, для улучшения взаимодействия с пользователем в будущем. Например, когда-нибудь пользователь сможет загрузить изображение компьютера в Google и спросить: «Этот компьютер подходит для игр?» и получите вдумчивый, развернутый ответ.

Google, скорее всего, сохранит большую часть поискового рынка. Учитывая это, SEO-компании могут ожидать, что Google будет периодически обновлять свой основной алгоритм поисковой системы. Google делает это, чтобы эти компании не оптимизировали контент для определенного алгоритма.

Однако в будущем могут появиться новые нишевые движки, обеспечивающие специфичность и конфиденциальность, которых, по мнению многих пользователей, не хватает Google. Пользователи могут тяготеть к поисковым инструментам, которые обеспечивают повышенную конфиденциальность или лучшее качество, индексируя только часть Интернета.

Некоторые эксперты также считают, что использование поисковых систем сокращается, поскольку в будущем поиск информации будет осуществляться в других приложениях и на сайтах социальных сетей, таких как Facebook, TikTok и LinkedIn.

Хотя Google держит свой алгоритм в секрете, создатели контента могут иметь некоторый контроль над производительностью контента. Узнайте, как улучшить свой рейтинг в поисковых системах.

Последнее обновление: ноябрь 2022 г.

Продолжить чтение О поисковой системе
  • Поиск вне поисковых систем
  • Основные проблемы SEO-маркетинга
  • Советы по созданию SEO-стратегии контент-маркетинга
  • Как аналитика может улучшить управление контентом?
  • Как таксономия тегов контента улучшает корпоративный поиск
враждебный ML

Состязательное машинное обучение — это метод, используемый в машинном обучении для обмана или введения в заблуждение модели с помощью злонамеренных входных данных.

Сеть

  • межсоединение центра обработки данных (DCI)

    Технология соединения центров обработки данных (DCI) объединяет два или более центров обработки данных для совместного использования ресурсов.

  • Протокол маршрутной информации (RIP)

    Протокол маршрутной информации (RIP) — это дистанционно-векторный протокол, в котором в качестве основного показателя используется количество переходов.

  • доступность сети

    Доступность сети — это время безотказной работы сетевой системы в течение определенного интервала времени.

Безопасность

  • кража учетных данных

    Кража учетных данных — это тип киберпреступления, связанный с кражей удостоверения личности жертвы.

  • суверенная идентичность

    Самостоятельная суверенная идентификация (SSI) — это модель управления цифровой идентификацией, в которой отдельные лица или предприятия владеют единолично …

  • Сертифицированный специалист по безопасности информационных систем (CISSP)

    Certified Information Systems Security Professional (CISSP) — это сертификат информационной безопасности, разработанный . ..

ИТ-директор

  • рассказывание историй о данных

    Рассказывание историй о данных — это процесс перевода анализа данных в понятные термины с целью повлиять на деловое решение…

  • оншорный аутсорсинг (внутренний аутсорсинг)

    Оншорный аутсорсинг, также известный как внутренний аутсорсинг, — это получение услуг от кого-то вне компании, но в пределах …

  • FMEA (анализ видов и последствий отказов)

    FMEA (анализ видов и последствий отказов) представляет собой пошаговый подход к сбору сведений о возможных точках отказа в …

HRSoftware

  • самообслуживание сотрудников (ESS)

    Самообслуживание сотрудников (ESS) — это широко используемая технология управления персоналом, которая позволяет сотрудникам выполнять множество связанных с работой . ..

  • платформа обучения (LXP)

    Платформа обучения (LXP) — это управляемая искусственным интеллектом платформа взаимного обучения, предоставляемая с использованием программного обеспечения как услуги (…

  • Поиск талантов

    Привлечение талантов — это стратегический процесс, который работодатели используют для анализа своих долгосрочных потребностей в талантах в контексте бизнеса …

Служба поддержки клиентов

  • виртуальный помощник (помощник ИИ)

    Виртуальный помощник, также называемый помощником ИИ или цифровым помощником, представляет собой прикладную программу, которая понимает естественный язык …

  • жизненный цикл клиента

    В управлении взаимоотношениями с клиентами (CRM) жизненный цикл клиента — это термин, используемый для описания последовательности шагов, которые проходит клиент. ..

  • интерактивный голосовой ответ (IVR)

    Интерактивный голосовой ответ (IVR) — это автоматизированная система телефонии, которая взаимодействует с вызывающими абонентами, собирает информацию и маршрутизирует …

Что такое поисковая система? — Определение из Techopedia

Что означает поисковая система?

Поисковая система — это служба, позволяющая пользователям Интернета осуществлять поиск содержимого через всемирную паутину (WWW). Пользователь вводит ключевые слова или ключевые фразы в поисковую систему и получает список результатов веб-контента в виде веб-сайтов, изображений, видео или других онлайн-данных, которые семантически соответствуют поисковому запросу.

Список контента, возвращаемый пользователю через поисковую систему, известен как страница результатов поисковой системы (SERP).

Реклама

Techopedia объясняет поисковую систему

Поисковая система выполняет ряд шагов, чтобы выполнить свою работу. Сначала паук/веб-краулер просматривает сеть в поисках контента, который добавляется в индекс поисковой системы. Эти небольшие боты могут сканировать все разделы и подстраницы веб-сайта, включая такой контент, как видео и изображения.

Гиперссылки анализируются для поиска внутренних страниц или новых источников для сканирования, когда они указывают на внешние веб-сайты. Чтобы помочь ботам выполнять сканирование более эффективно, более крупные веб-сайты обычно отправляют в поисковую систему специальную карту сайта в формате XML, которая действует как дорожная карта самого сайта.

После того, как все данные получены ботами, сканер добавляет их в обширную онлайн-библиотеку всех обнаруженных URL-адресов. Этот постоянный и рекурсивный процесс известен как индексация и необходим для отображения веб-сайта в поисковой выдаче. Затем, когда пользователь запрашивает поисковую систему, соответствующие результаты возвращаются на основе алгоритма поисковой системы.

Чем выше рейтинг сайта в поисковой выдаче, тем более релевантным он должен быть для запроса пользователя. Поскольку большинство пользователей просматривают только лучшие результаты, для веб-сайта особенно важно иметь достаточно высокий рейтинг для определенных запросов, чтобы обеспечить его успех с точки зрения трафика.

За последние несколько десятилетий была разработана целая наука, чтобы убедиться, что веб-сайт или, по крайней мере, некоторые его страницы «масштабируют» рейтинг, чтобы достичь первых позиций. Эта дисциплина известна как поисковая оптимизация (SEO).

Ранние результаты поисковых систем в основном основывались на содержании страницы, но по мере того, как веб-сайты научились играть с системой с помощью передовых методов SEO, алгоритмы стали намного сложнее, и возвращаемые результаты поиска могут основываться буквально на сотнях переменных.

Теперь каждая поисковая система использует собственный алгоритм, который взвешивает множество сложных факторов, таких как релевантность, доступность, удобство использования, скорость страницы, качество контента и намерения пользователя, чтобы сортировать страницы в определенном порядке.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *