Pagerank pr: PageRank разобрали на формулы / Хабр

PageRank разобрали на формулы / Хабр

Примерно 95% текста в 25 млрд документов, проиндексированных Google, составлены из маленького словаря в десять тысяч слов. Это значит, что почти любой поисковый запрос выдаст миллионы документов. Таким образом, вычисление релевантности документа представляет собой нетривиальную математическую задачу. Для этого используется комбинация сложнейших математических методов. К тому же, содержимое веба постоянно изменяется, так что показатель релевантности нужно постоянно пересчитывать. Центральное место в системе ранжирования Google занимают алгоритмы PageRank.

Все мы знаем, что конечным результатом работы PageRank является некий показатель «важности» страницы PR, который принимает значения от PR0 до PR10 и вычисляется путем анализа входящих ссылок. Их количество и качество говорит о важности данной страницы для интернет-сообщества.

Тот уровень PR, который мы видим, является сильно округленным значением, а точный показатель известен только программистам Google.

Показатель PR изменяется по логарифмической шкале, то есть значение PR5 на порядок больше, чем PR4.

Какие же формулы используются для вычисления PR? Об этом рассказывается в подробной статье на сайте Американского математического общества.

Вот как работает PageRank. Предположим, что на странице Pj размещено lj ссылок. Если одна из этих ссылок ведет на страницу Pi, то Pj передаст 1/lj своей «важности» странице Pi (примерно по такому же алгоритму работает передача кармы на «Хабре»).

Уровень важности (то есть, PR) страницы Pi есть сумма всех таких значений со всех входящих ссылок. Если представить набор страниц, ссылающихся на страницу Pi, как Bi, то «важность» Pi вычисляется по следующей формуле:

Все это похоже на проблему курицы и яйца. Чтобы узнать PR страницы, нам нужно сначала знать PR всех страниц, которые на нее ссылаются. Впрочем, математические методы позволяют решить и эту проблему.

Для этого создается матрица гиперссылок , в которой строка i столбца j будет иметь следующий вид:

Это стохастическая матрица, то есть матрица, в которой все столбцы и/или строки — ряды неотрицательных действительных чисел, дающих в сумме единицу.

Сформируем вектор , элементами которого являются значения PR, то есть «важность» всех страниц. По нашим условиям вектор получается стационарным.

Рассмотрим ситуация на примере небольшой матрицы из восьми веб-страниц, гиперссылки между которыми отображаются стрелками.

Этой ситуации соответствует такая матрица

и стационарный вектор

Расчет показывает, что страница 8 выигрывает конкурс по популярности. Вот та же самая картинка, где наиболее «авторитетные» страницы окрашены более светлым цветом.

Примерно так работает PageRank, с математической точки зрения. Это только базовые принципы работы алгоритма. С подробностями можно ознакомиться в оригинале статьи.

Что такое PR сайта, и как его узнать. Влияние PR на продвижение сайта

Google PageRank (PR) – один из показателей авторитетности сайта. Был введен специалистами компании Google как один из параметров оценки сайта для последующего определения места сайта в поисковой выдаче. В отличие от тИЦ, PR рассчитывается отдельно для каждой страницы сайта.

Различают два типа PR сайта – внешний и внутренний. Внутреннее значение скрыто, и установить его невозможно. В сети можно найти формулу для расчета скрытого PR, который еще называют реальный PR сайта, однако никто не может поручиться за то, что эта формула соответствует действительности. О связи реального PR и внешнего также известно мало, и потому дальше мы будем говорить о внешнем PR.

 Как рассчитывается PR сайта?

 Максимальный показатель Google Page Rank – 10. PR со значением 3-5 считается отличным показателем, к которому и нужно стремиться. При расчете PageRank поисковая машина Google принимает во внимание несколько факторов. Первый, и самый значимый – полезность контента на странице сайта. Оценивается уникальность и естественность текста, контент, созданный исключительно для поисковых роботов проверку не пройдет.

Еще один немаловажный фактор, который оценивает поисковый робот Google – количество и качество внешних ссылок с других сайтов на страницу. Google умеет отличать покупные ссылки от естественных, и потому ссылки с сайтов, занимающихся их размещением на коммерческой основе, поисковой системой не учитываются.

Для тех, кто хочет более детально понимать алгоритм расчета Page rank я подготовил формулу:

 Оказывает ли влияние на продвижение PR сайта?

 Если показатель тематического индекса цитирования учитывается поисковой системой компании Яндекс лишь при ранжировании сайтов внутри Яндекс-каталога, то Google PageRank влияет непосредственно на выдачу. Это не основной параметр оценки, потому не стоит гнаться за повышением PageRank в ущерб остальным показателям. Тем не менее, шансы попасть в ТОП Google у сайта с PR 1-5 выше, чем у аналогичного ресурса с нулевыми показателями.

 Как именно PR влияет на выдачу?

 Алгоритм поиска Google работает следующим образом:

  1. Поисковая машина перебирает все страницы, которые могут содержать запрос пользователя.
  2. Проводится предварительное ранжирование на основе анализа текста по специальным алгоритмам Google.
  3. Производится сканирование ссылок с других сайтов, отфильтровываются страницы с покупными ссылками.
  4. Полученный список страниц ранжируется с учетом PageRank каждой страницы сайта и выдается пользователю.

 Как узнать PR сайта?

 Узнать PR сайта можно с помощью многочисленных сервисов для анализа сайтов. Я бы посоветовал sbup.com. Вводите свой сайт и через пару секунд вы получите множество полезной информации. В том числе PR и реальный PR.

Так же стоит воспользоваться популярным плагином для браузера – RDS Bar. Помимо показателей тИЦ и PR плагин предоставляет массу полезной информации.  

 Частота обновления PR

 Вышеперечисленными сервисами и инструментами для проверки Google PageRank не придется особенно часто пользоваться, так как Google обновляет этот параметр не чаще одного-двух раз в год. Зато время между обновлениями можно посвятить улучшению и оптимизации сайта, чтобы после следующего апдейта увидеть заветную цифру в параметрах своего сайта.

Что мне еще стоит почитать?

Рекомендую к прочтению

  • ТОП-13 SEO-курсов в Минске: кто научит продвигать сайты?

  • Как дать гостевой доступ к Яндекс Метрике

  • Как дать гостевой доступ к Яндекс Вебмастеру

  • ASO — основы продвижения мобильных приложений в ТОП App Store и Google Play

  • Что такое конверсия сайта и как ее посчитать: формулы, средние значения и типы конверсий в интернете

  • Фильтр за накрутку поведенческих факторов

Принесу пользу вашему проекту

  • Продвижение сайтов

  • Привлечение трафика

  • Улучшение позиций

  • Сбор семантического ядра

  • Аудит сайта

  • Консультирование

Что такое Google PageRank, как он зарабатывается и имеет ли значение?

Когда пользователь вводит поисковый запрос, главной целью поисковой системы является предоставление результатов, которые являются высококачественными, релевантными и могут наилучшим образом дать им то, что они хотят. Одним из более чем 200 факторов SEO, которые Google принимает во внимание, чтобы определить, какие веб-страницы лучше всего соответствуют требованиям, является PageRank.

Что такое PageRank?

PageRank (PR) – это вычисление, изобретенное основателями Google Ларри Пейджем и Сергеем Брином, которое оценивает качество и количество ссылок на веб-страницу, чтобы определить относительную оценку важности и авторитетности этой страницы по шкале от 0 до 10.

Несколько доменов PageRank 10, включая USA.gov, Twitter.com и Adobe Reader Download, имеют самый высокий объем входящих ссылок среди всех сайтов в Интернете.

Верхние сайты, так сказать, устанавливают планку, и 10-балльная шкала резко падает оттуда.

Веб-сайты с PageRank 5 имеют большое количество входящих ссылок, сайты с PR 3 и PR 4 имеют достаточное количество, а совершенно новые веб-сайты без каких-либо входящих ссылок, указывающих на них, начинаются с PageRank 0.

ПРИМЕЧАНИЕ. PR сайта или вашего конкурента. Но Google больше не показывает показатель PageRank для веб-сайтов. Раньше он отображался в верхней части веб-браузеров прямо на панели инструментов Google, но не более того. Кроме того, PR-данные больше не доступны разработчикам через API. Однако, несмотря на то, что сейчас он скрыт от всеобщего обозрения, PageRank остается важным компонентом секретных алгоритмов ранжирования Google .

Поскольку Google хочет возвращать результаты первой страницы, которые являются высококачественными, релевантными и заслуживающими доверия, он может возвращать веб-страницы с более высокими показателями PageRank, которые находятся выше в поисковой выдаче, хотя PageRank является лишь одним из многих принимаемых во внимание факторов ранжирования.

Поскольку PageRank является лишь одним из факторов в алгоритме ранжирования Google, важно помнить, что высокий PageRank не гарантирует высокий рейтинг, но может существенно помочь.

ПРИМЕЧАНИЕ: С ростом использования мобильного Интернета особенно важно также учитывать, как обновление Google Mobilegeddon повлияет на рейтинг поиска.

Что такое «ссылочный сок» и что такое «баллы» PageRank?

Когда Сайт А ссылается на вашу веб-страницу, Google рассматривает это как одобрение или голосование Сайта А за вашу страницу. Google учитывает все эти голоса за ссылки (т. е. ссылочный профиль веб-сайта), чтобы сделать выводы об актуальности и значимости отдельных веб-страниц и вашего веб-сайта в целом. Это основная концепция PageRank.

Когда веб-сайт ссылается на ваш сайт или когда вы создаете внутреннюю ссылку с одной из ваших страниц на другую, эта ссылка проходит баллы PageRank. Эта передача баллов PageRank также обычно называется « ссылочным весом » или переносом «ссылочного капитала».

Количество передаваемых ссылок зависит от двух факторов: количества баллов PageRank веб-страницы, содержащей ссылку, и общего количества ссылок на веб-странице, которые проходят PageRank. Здесь стоит отметить, что, хотя Google присвоит каждому веб-сайту общедоступный рейтинг PageRank от 1 до 10, «баллы», которые каждая страница накапливает за счет ссылочного веса, передаваемого ценными входящими ссылками, могут — и действительно — значительно превышают десять. . Например, веб-страницы на самых мощных и значимых веб-сайтах могут передавать сотни или тысячи точек ссылочного веса. Чтобы рейтинговая система была краткой, Google использует много математических расчетов, чтобы сопоставить очень большие (и очень маленькие) значения PageRank с аккуратной и чистой шкалой оценок от 0 до 10.

Как передается ссылочный вес

Подумайте об этом так: каждая веб-страница имеет ограниченное количество ссылочного веса, которое она может передать, и верхушка этого предела — это общее количество очков PageRank, накопленных страницей. Таким образом, веб-страница с 20 накопленными баллами PageRank не может передать более 20 баллов ссылочного веса на страницу.

Если страница с 20 баллами PageRank ссылается на другую страницу, эта ссылка перенесет весь ссылочный вес на эту другую веб-страницу. Но если страница с 20 баллами PageRank ссылается на пять веб-страниц (внутренних или внешних), каждая ссылка будет передавать только одну пятую часть ссылочного веса.

Google применяет значение затухания к каждому проходу, поэтому фактические числа будут немного меньше, чем показано на нашей диаграмме ниже. Но чтобы просто объяснить концепцию PageRank, формула представляет собой количество баллов PR, деленное на количество ссылок на странице, или, в данном случае, 20, деленное на 5:

. ссылается на пять других веб-страниц, каждая из которых, соответственно, получает приблизительно четыре балла PageRank.

Что делать, если вы хотите сослаться на несколько ресурсов, чтобы облегчить взаимодействие с пользователем, но у вас есть стратегическая причина воздержаться от передачи PageRank этим страницам?

Вы можете запретить Google передавать PageRank, добавив в некоторые ссылки атрибут rel=»nofollow». Ссылка nofollow не сканируется поисковыми системами, и сигналы PageRank или анкорного текста не передаются.

Однако Google по-прежнему считает ссылки nofollow частью общего количества ссылок на странице. Таким образом, снижается значение PageRank, доступное для прохождения по оставшимся ссылкам.

Так, например, если у вас есть веб-страница со 100 баллами PR, на которой есть четыре ссылки, и три из этих ссылок имеют теги rel=»nofollow», одна ссылка, которая не имеет rel=»nofollow», вероятно, все равно будет передавать только одну четверть, или 25 баллов, ссылочного веса. (Узнайте, когда nofollow необходим, ниже.)

Перенос PageRank/Link Juice с помощью внутренних ссылок

Вы можете помочь Google рассматривать страницы вашего веб-сайта как авторитетные, разместив ссылки на свои важные страницы из связанных статей.

Например, если у вас есть статья под названием «Как провести исследование ключевых слов», вы можете помочь Google повысить релевантность этой страницы для темы/фразы «исследование ключевых слов», дав ссылку из статьи, посвященной инструменту исследования ключевых слов, на ваша статья «Как провести исследование ключевых слов». Эта стратегия связывания является частью эффективного разделения, которое помогает прояснить основные темы вашего веб-сайта.

Когда Nofollow необходим

Добавление rel=”nofollow” к ссылке может не сохранить PageRank в том виде, в котором его когда-то использовали SEO-специалисты – для формирования потока ценности PR через сайт (т.н. «моделирование ссылок»). Тем не менее, nofollow необходим для некоторых типов ссылок:

  • Платные ссылки и реклама
  • Ссылки, которые снижают актуальность вашей темы
  • Ссылки на ненадежные страницы

Платные ссылки и реклама на вашем сайте ДОЛЖНЫ иметь атрибут nofollow (см. политику Google в отношении nofollow). Если у вас есть платные ссылки, по которым вы переходите, поисковые системы могут заподозрить, что вы пытаетесь манипулировать результатами поиска, и наложить на ваш сайт штраф в рейтинге. Алгоритм Google Penguin съедает манипулятивные платные ссылки на обед, поэтому держитесь подальше от меню, добавляя атрибуты nofollow, где это применимо.

Во-вторых, nofollow также важен для ссылок на страницы не по теме, независимо от того, являются ли они внутренними или внешними по отношению к вашему сайту. Вы хотите, чтобы поисковые системы не поняли, о чем ваши страницы. Связывание релевантных страниц вместе повышает актуальность вашей темы. Таким образом, чтобы сохранить четкость разрозненности тем, можно применять стратегическое использование атрибута nofollow при связывании страниц, не относящихся к теме.

Третий случай использования nofollow, который Google дает, относится к ненадежным сайтам. Конечно, вы не хотели бы передавать PageRank ненадежному сайту.

Предостережение: Теперь, когда вы в общих чертах понимаете, как работает PageRank, мы не хотим дать вам неправильное представление. Для получения дополнительной информации об эффективных стратегиях создания ссылок см. обсуждение «Как повысить популярность ссылок в SEO».

В современном мире КАЧЕСТВО важнее количества. Штрафы Google заставили многих владельцев веб-сайтов не только прекратить построение ссылок, но и начать их сокращение. Ссылки плохого качества (т. е. ссылки со спамных или не по теме сайтов) подобны яду и могут убить ваш рейтинг в поисковых системах. Только ссылки с качественных сайтов и страниц, имеющих отношение к вашему веб-сайту, будут выглядеть естественными и не подлежат наказанию. Поэтому никогда не пытайтесь покупать или запрашивать ссылки — заработайте их естественным образом или не заработайте вообще.

Хотите узнать больше? Узнайте больше об удалении ссылок, действиях, которые вы предпринимаете, когда ссылки со страниц низкого качества дают Google неверное представление о вашем веб-сайте .

Примечание редактора: эта статья была первоначально опубликована в 2013 году, но обновлена, чтобы отразить последнее понимание SEO Google PageRank.

Челси Адамс Брукс — велосипедистка на длинные дистанции, начинающая строитель глинобитных домов, одержимая схемами/аналитикой/алгоритмами и бывшая старшая писательница в Bruce Clay Inc.

Посетите страницу автора Chelsea, чтобы найти ссылки для связи в социальных сетях.

Как работает PageRank и почему первоначальная формула PR может быть ошибочной

Взгляды автора полностью принадлежат ему (за исключением маловероятного случая гипноза) и могут не всегда отражать взгляды Моза.

ВВЕДЕНИЕ От Rand: Хотя мой дедушка, Си Фишкин, посещал множество отраслевых мероприятий, освещал и помогал с премиальными вопросами и ответами, а также с некоторыми из наших консультационных работ, это его первая запись в блоге SEOmoz. Си был в городе на празднике Благодарения и щедро посвятил некоторое время блогу. Пожалуйста, приветствуйте его!


На прошлой неделе Рэнд опубликовал видео и несколько диаграмм, которые, как мне кажется, могут быть неверно истолкованы или могут ввести в заблуждение. Чтобы помочь сделать PageRank более ясным, я заручился его помощью, чтобы построить несколько диаграмм, которые помогут кратко объяснить проблему.

Во-первых, простое и общее объяснение PageRank:

Для тех, кому любопытно, исходная формула PageRank задокументирована здесь, и мне также нравится объяснение PageRank Яна Роджерса здесь. Ниже я показал, как страницы получают PageRank:

Далее рассмотрим способность страниц проходить PageRank:

Для более глубокого понимания PageRank рассмотрим несколько примеров, переходя от простого к более сложному:

В исходной формуле PageRank , вес ссылки делится поровну между количеством ссылок на странице. Сегодня это может быть не так, но все же важно понять первоначальный замысел. Далее, более сложный пример, показывающий поток PageRank между страницами, которые ссылаются друг на друга:

Наконец, пример, показывающий, как можно «слить» PageRank. Эта диаграмма более точно иллюстрирует концепцию, которую пытался описать Рэнд. Утечка происходит не из-за сценария «дырявого ведра», а скорее из-за того, что PageRank, который мог передаваться на страницы сайта, теперь потерян для Википедии: алгоритм, как только он стал общедоступным. Подобно ящику Пандоры, как только те, кто создает страницы для ранжирования в Google, изучат основополагающие принципы PageRank, они поймут, что ссылки с их собственных сайтов принесут больше вреда, чем пользы. Если большое количество веб-сайтов примут эту философию, это может негативно повлиять на концепцию «ссылки как голоса» и фактически навредить потенциалу Google.

Рэнд и я оба склонны полагать, что, вероятно, Google много раз изменял и совершенствовал алгоритм PageRank.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *