Что мы знаем о нем? / Хабр
dobriykotВремя на прочтение 7 мин
Количество просмотров9.1K
Перевод
Автор оригинала: Smashing magazine
UPD. Статья уже переведена уважаемым Jenek и находится по адресу: designformasters.info/posts/google-page-rank
По просьбам здесь начал переводить статью «Google PageRank: What Do We Know About It?». Пока только то, что успел за вчерашний вечер. Если это кому-нибудь нужно продолжение — напишите, я переведу и выложу все остальное. Вычитка и замеченые ошибки приветствуются, т.к. специально переводить мне еще не приходилось. 🙂
Его использует каждый, но почти никто не знает, как он в действительности работает.
В этой статье будут только голые факты.
Несколько недель мы производили интенсивные исследования и выбрали массу фактов и предположений о PageRank, которые похожи на действительность. Кроме того, мы собрали научные статьи, относящиеся к поисковой выдаче – таких, как предложения для лучших результатов поиска (например, PageRank, чувствительный к теме). Вы прочитаете про математическую составляющую PageRank, также как и про 16 полезных инструментов для работы с PageRank, которые вы можете использовать для анализа и слежения за вашими веб-проектами.

Кратко: как он работает?
- PageRank – один из многочисленных методов, которые использует Google для определения релевантности или важности страницы.
- Google интерпретирует ссылку со страницы А на страницу В как «голос» А за В. Он следит не только за объемом голосов, анализируются более сотни иных аспектов страницы, которая этот голос дает.
- PageRank базируется на входящих ссылках, но не только на их число – также имеют значение их релевантность и качество.
- PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn)). Это формула, которая считает PageRank.
- Не все ссылки имеют одинаковый «вес»,
- Если у вас есть сайт с PR=8 и 1 ссылка с него на другую страницу, то она получит определенную добавку к своему PR. Но если у вас есть 100 ссылок на эту страницу, то каждая из них будет давать сотую часть этой добавки.
- Битые входящие ссылки не влияют на PR.
- При подсчете популярности учитывается возраст сайта, релевантность обратных ссылок и их длительность. При подсчете Page Rank — нет.
- При подсчете PR контент не учитывается.
- PageRank не определяется для всего сайта сразу, а для каждой страницы по отдельности.
- Каждая ссылка на ваш сайт важна для результата. Исключая забаненые сайты, которые исключаются из подсчета.
- PageRank не определяется от 1 до 10. Это число с плавающей точкой. Также, изначально значение PR немного больше 0.
- Каждый следующий уровень Page Rank достичь труднее с прогрессивной зависимостью. Мы полагаем, что он считается по логарифмической шкале.
- Google считает PR каждой страницы раз в несколько месяцев.
- Google пытается найти такие страницы, которые релевантны и «уважаемы» им одновременно.
Коротко: влияние на Google PageRank
- Частое обновление контента не означает автоматическое улучшение Page Rank.
- Высокий Page Rank не означает высокие позиции в результате поиска.
- Нахождение в каталогах DMOZ и Yahoo! не означает автоматическое улучшение Page Rank.
- Расположение сайта на доменах .edu или .gov не означает автоматическое улучшение Page Rank
- Вложенные каталоги не обязательно имеют более низкий Page Rank, чем корневые каталоги.
- Ссылки с Википедии не означают автоматическое улучшение PageRank (но страницы, которые используют ее материалы могут улучшить PR).
- Ссылки с атрибутом nofollow не помогают работе PageRank.
- Эффективные ссылки внутри сайта влияют на PageRank.
- Релевантные сайты с высоким рангом имеют преимущество при подсчете.
- Текст якоря ссылки часто намного более важен, чем просто ссылка на странице с высоким PR.
- Исходящие или входящие ссылки на качественные релевантные сайты имеют значение на PR.
- Множество ссылок в определенное место с одной страницы означают столько же, сколько одна ссылка на это же место с этой же страницы.
- Сайт может быть исключен (забанен) за ссылки на исключенные (забаненые) сайты.
1.1. Почему PageRank?
- «PageRank – [только] один из методов, которые использует Google, чтобы определить релевантность или важность страницы.» [PageRank Explained Correctly]
- «Google использует множество факторов ранжирования. Поэтому алгоритм PageRank может быть наиболее известным. PageRank выражается в двух вещах: 1. как много существует ссылок с других сайтов на данный; 2. качества этих сайтов. Ссылки с пяти или шести высококачественных сайтов (таких, как cnn.com, nytimes.com) будут означать больше, чем вдвое больше ссылок с менее известных сайтов.» [Google Librarian Central]
- «PageRank – это только приблизительная оценка качества веб-страницы и ни в коем случае не мера ее тематической релевантности.
Тематическая релевантность зависит от содержания ссылок и таких факторов, как соотносимость контента и ключевых слов, заголовка и т.п.» [PageRank: An Essay]
1.2. Как он работает?
- Никто полностью не уверен. «Никто точно не знает, как в данный момент Google считает PR.» [Google PageRank Explained]
- PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn)). «Эта формула показывает, каким образом вычисляется PageRank. Здесь ‘t1 — tn’ — это страницы, ссылающиеся на страницу А, ‘C’ — это количество исходящих ссылок на странице, а ‘d’ — регулирующий фактор, обычно равный 0.85.»
- Мы можем записать проще: PageRank = 0.15 + 0.85 * («долю» каждой страницы, ссылающейся на данную). «Доля» равна PR’у ссылающейся страницы, деленному на количество исходящих с нее ссылок. A page “votes” an amount of PageRank onto each page that it links to. The amount of PageRank that it has to vote with is a little less than its own PageRank value (its own value * 0.
85). This value is shared equally between all the pages that it links to.” [Google’s Page Rank]
- “Суть алгоритма Google PageRank в распределении собственного PR между исходящими ссылками. Если у вас есть страница с PR=8 и одна ссылка на другую страницу, то эта страница получит полный «вес» вашего PR. Но если у вас есть не одна, а сотня ссылок, то каждая ссылка будет иметь равную с остальными часть «веса» вашего PR (иначе говоря 1/100 его).» [The Importance of PageRank]
- «Отсюда следует, что страница с PR=4 и пятью ссылками будет значить больше, чем страница с PR=8 и сотней ссылок. PageRank страницы, ссылающейся на вашу важен, но так же важно и количество ссылок на ней. Чем больше ссылок на странице, тем меньше «веса» PR несет каждая их них.» [Google’s Page Rank]
- «PageRank [..] использует структуру ссылок как индивидуальный индикатор каждой страницы. Google интерпретирует ссылку со страницы А на страницу В как «голос» страницы А за страницу В.
Google учитывает гораздо больше факторов, чем просто количество таких «голосов» или ссылок на страницу; он также анализирует страницу, от которой был получен «голос». Голоса от «важных» страниц значат намного больше, чем от остальных, и помогают другим страницам увеличить свой «вес». [Google: Technology]
- «Не все ссылки «весят» одинаково, когда это касается PR. Т.о. «важные» страницы дают больше пользы для вашего PR, чем «менее важные» (по версии Google конечно). […] Сила распространения PR – это количество исходящих ссылок на «голосующей» странице. Т.о. Страница с PR=4 и одной ссылкой может дать больше веса, чем страница с PR=5 и сотней исходящих ссылок на ней. Типичным примером в данном случае может быть знаменитая страница-на-миллион-долларов (milliondollarhomepage). PR этой страницы равен 7, но сотни ссылок на ней дают очень мало веса страницам, на которые ссылаются.» [Google PageRank Explained]
- Каждый следующий уровень PR намного сложнее достичь (в прогрессии).
«PageRank считается с помощью логарифмов. Точно так же, в экспоненциальной зависимости, измеряются землетрясения по шкале Рихтера, т.е. за словом PageRank стоят математические вычисления. Требуется один шаг от PR=0, до PR=1, немного больше шагов от 1 до 3, намного больше до 4, еще больше до 5 и т.д.» [Google Page Rank FAQ]
[via einfach-persoehnlich]
- «PageRank не определяет сайты целиком, а считает каждую страницу по отдельности. Далее, PageRank страницы А рекурсивно определяется рангами других страниц, ссылающихся на страницу А.» [The Page Rank algorithm]
- «Google объединяет PageRank с тонкой технологией текстового поиска для того, чтобы найти одновременно важные и релевантные страницы для пользователя. Google анализирует все детали контента страницы (и контентов страниц, ссылающихся на данную) для того, чтобы добиться наилучших результатов поиска.» [What Is Google PageRank?]
- «Google считает PR каждой страницы один раз в несколько месяцев (обновление PR).
После того, как обновление завершено, все страницы получают от Google новый PR, который будет у них до тех пор, пока не придет время нового обновления. Ранг новых сайтов равен 0 до тех пор, пока не произойдет обновление и им не будет присвоен определенный уровень PR.» [Google PageRank Explained]
- Значение PageRank не изменяется от 0 до 10. PageRank – это число с плавающей точкой. «Более точным будет считать PR числом с плавающей точкой. Конечно, наши внутренние вычисления PR имеют намного больше знаков, чем значение от 0-10, показанное на панели инструментов.” [Matt Cutts]
- «Мы уверены, что их кривая подобна экспоненциальной, где каждый новый уровень труднее достичь, чем предыдущий. Я лично провел несколько исследований на эту тему и результатом стала экспоненциальная база, равная 4. Итак, PR=6 в 4 раза труднее достичь, чем PR=5. [..] Разница между верхней границей PR=6 и нижней границей PR=6 может быть в сотнях и тысячах ссылок.» [Top 10 Google Myths Revealed]
- «Полагается, что PageRank считается по логарифмической шкале.
Это значит, что разница между PR=4 и PR=5 приблизительно в 5-10 раз выше, чем разница между PR=3 и PR=4. Так, вероятно, что существует в 100 раз больше страниц с PR=2, чем с PR=4. Это значит, что если вы достигли PageRank равный 6 или выше, вы находитесь в рейтинге выше, чем 0.1% всех остальных сайтов.» [Importance of Google PageRank]
- «PageRank базируется на входящих ссылках, но не просто на их количестве. Вместо этого, ваш PageRank зависит от «веса» входящих ссылок. Чтобы найти «вес» входящей ссылки, поделите PR страницы с этой ссылкой на общее количество ссылок на ней. Очень возможно получить PR равный 6 или 7 от малого количества входящих ссылок, обладающих достаточным весом.» [Top 10 Google Myths Revealed]
- «Google пытается найти страницы, одновременно авторитетные и релевантные. Если две страницы имеют примерно одинаковый уровень авторитетности и соответствия информации поисковому запросу, то выбирается та страница, на которую ссылается больше авторитетных сайтов.
Но, не смотря на это, мы часто повышаем в результатах поиска страницы с меньшим количеством ссылок или меньшим PR, если другие факторы показывают, что страница более релевантная. Для примера, страница, целиком посвященная гражданской войне, будет намного более полезна, чем статья, мимоходом ее упоминающая, но располагающаяся на таком авторитетном сайте, как Time.com.» [Google Librarian Central]
- Ссылки не отдают свой PR кому-либо, они дают «голос». «Когда страница «голосует» своим значением PageRank за другие страницы, ее собственное значение PR не уменьшается. Собственный PR не раздается и не может закончиться в результате «голосований». Также, не существует передачи своего PR. Существует только «голосование», зависящее от PageRank каждой страницы.» [Page Rank Explained]
- «Из материала «Анатомия крупных гипертекстовых поисковых систем» («The Anatomy of a Large-Scale Hypertextual Web Search Engine») мы знаем, что PageRank страницы – это число, получающееся в результате работы рекурсивного алгоритма, в котором страница получает общий PR каждой страницы, ссылающейся на данную.
» [Google PageRank]
- Робот Google не анализирует сайт мгновенно. «В большинстве случаев требуется два месячных обновления, чтобы все ссылки на ваш сайт были найдены, подсчитаны и показаны.» [Google FAQ]
Теги:
- перевод
- pagerank
Хабы:
- Чулан
Всего голосов 26: ↑24 и ↓2 +22
Комментарии 32
Axm @dobriykot
Разработчик
PR=0 Что это? Обнуление PR?
Содержание
- Моя история
- Уведомление Инструментов Google для веб-мастеров об обнаружении неестественных ссылок на сайте //www.fortress-design.com/
Об отмене тулбарного PR есть подтверждение об официальном заявлении Гугла: //searchengineland.com/google-has-confirmed-they-are-removing-toolbar-pagerank-244230UPD: 19 апреля 2016 г. Google на всех сайтах обнулил PR, на мейл ру обнулили тоже )). Даже себя обнулил Теперь пред Гуглом все равны. Обнулили у всех сайтов и всё.
Конец истории Page Rank. Это сильный удар по площадкам, торгующим ссылками. Следующий ход Яндекса.
PR не обновлялся уже 2 года, то есть на кнопочках ерунда была. Некоторые (по глупости или религиозным соображениям), учитывали эти циферки на биржах, но третий год пошел, сколько можно…
2 года назад прекратили обновлять, а сегодня и показывать тулбарный PR. Но его никто не отменял. Он как был раньше, так и будет, просто посмотреть теперь негде…
Глобальная перемена! Сейчас будет хаос на рынке. Похоже, ссылочному бизнесу действительно приходит конец.
Моя история
Ниже моя история как Гугл в 2011 году обнулил, а потом вернул обратно PR 3.
PR=0 — это какая-то злая шутка или новая формула в определении авторитености ресурса? Сегодня я обнаружил нехорошую цифру — оба плагина для Google Chrome iSEO и RDS показывают PR 0. К чему бы это? После апа PR от 8 ноября 2001 было 3! Да и раньше, 27 июня, ап PR принес моему блогу троечку.
Проверьте-ка себя. Что бы вы почуствовали, если бы узнали, что у вашего любимого блога вместо ПР 3, стал 0? Я проверил сайт по всем датацентрам Гугла — так и есть — всё по нулям. Хотя апдейта не было. Это еще раз указывает, что на самом деле дела плохи.
Мда… Нехорошо как-то получается. Это, что наказание такое или временный глюк на дата-центрах? Вроде апа PR не было? По крайней мере Сеобюджет его не зафиксировал.
Ой, как-то не хорошо всё это. Я надеюсь, что это досадная ошибка. И готов простить, даже без возмещения за нанесение морального ущерба, в случае отката на прежнее место. А если и не так, то… ничего уж тут не поделаешь. Разве, что еще ссылочек надо докупить.
P. S. (через полчаса) Ну, конечно же я догадывался в чем может быть причина, но не хотелось говорить это в слух. На самом деле, обнуление PR — это не глюк и не шутка. Как раз дела обстоят очень серьезно. Хорошо еще, что я «вовремя» заметил, пока Гугл окончательно не забанил, исключив из индекса весь блог.
Забив в Гугле фразу «за что гугл может обнулит pr» я почитал о том, что пишут на форумах и блогах: обнулить PR могут за продажу ссылок. Кто-то писал, что может отвалилось много бэков. Это маловероятно для моего блога, потому что временными ссылками я не продигал его. Так, вот, решил я зайти в «Инструменты для веб-мастеров» и посмотреть, что там делается с сайтом.
И к своему удивлению обнаруживаю одно непрочитанное сообщение. Дата 16 декабря 2011 г.
—————————————————————————————
Уведомление Инструментов Google для веб-мастеров об обнаружении неестественных ссылок на сайте //www.fortress-design.com/
Уважаемый владелец или веб-мастер сайта //www.fortress-design.com/!
Мы обнаружили, что на некоторых страницах Вашего сайта используются методы, противоречащие нашим рекомендациям в руководстве Google для веб-мастеров.
Проверьте, нет ли на Вашем сайте искусственных ссылок, призванных намеренно завысить показатель PageRank. Сюда относится продажа ссылок, учитывающихся в PageRank, или участие в схемах обмена ссылками.
Мы советуем изменить сайт в соответствии с нашими рекомендациями по качеству. После этого Вы можете отправить заявку на пересмотр, чтобы улучшить положение своего сайта в результатах поиска Google.
Вопросы о способах устранения этой проблемы можно задать на справочном форуме для веб-мастеров.
С уважением,
команда качества поиска Google
—————————————————————————————
Всё, прощай, Sape и TrustLink — я удалил все ссылки и дал запрос на пересмотр сайта!
Когда сайт работал только с ТрастЛинк, вроде было все нормально. Даже ГГЛ ничего не замечал. Стоило добавиться в Сапу, так ГГЛ сразу обозначил маркером, что сайт торгует ссылками. А через месяца три получил от Гугла фильтр продажности со всеми вытекающими последствиями (обнулением ПР и потере некоторого дохода).
Да уж, вот не думал, что Гугл первый применит санкции. Ведь до сих пор буржуйский Гугл и кириллический — разные поисковики. В русском — отключены некоторые фильтры, в связи с чем продвижение спамом всё ещё актуально. Это Яндекс активно борется с SEO-ссылками, пытаясь их полностью нейтрализовать.
Что-то мне с Гуглом не очень везет. Летом он забанил мой аккаунт Adsense, но там я не делал никаких нарушений.
Оказывается у Деваки была та же история с обнулением PageRank. Причем дважды.
Вот, что он об этом пишет:
Мне в одно время тоже пришлось ссылки снимать для того, чтобы выйти из-под фильтров, при этом терялся какой-то весомый доход. Пришлось ждать месяца 3 (переиндексация тысячи страниц), но потом ссылки стал проставлять заново. Сейчас тому сайту опять PR обнулили. Выход ищите сами, не получится так, чтобы и овцы целы и волки сыты…
Фильтр — это как болезнь, если человек выздоравливает, но при этом возвращается к прежнему образу жизни, болезнь не заставит долго себя ждать, вернется быстро.
Вероятнее всего, вебмастера вернутся к ручной продаже и покупке ссылок, так как количество желающих заработать на своих сайтах ничего не делая с каждым месяцем все равно только растет, люди не видят других хороших возможностей своих сайтов в плане заработка.
В итоге получается, что серьезное продвижение сайта специалистами, которые пользуются основным инструмента оптимизатора, Сапой, постепенно вырабатывают траст сайта, снижая доверие поисковых систем и наложения соотвествующих санкций. В лучшем случае, происходит обнуление PR.
Google PageRank — PR 0
PR0 — Google PageRank 0 Штраф
К концу 2001 года поисковая система Google ввела новый вид наказания для веб-сайтов, использующих сомнительную тактику поисковой оптимизации: PageRank, равный 0. На форумах по поисковой оптимизации он называется PR0, и этот термин также будет использоваться здесь. Характерным для PR0 является то, что все или, по крайней мере, многие страницы веб-сайта имеют PageRank 0 на панели инструментов Google, даже если они имеют высококачественные внешние ссылки. Эти страницы не удаляются полностью из индекса, но всегда находятся в конце результатов поиска, поэтому их трудно найти.
PageRank, равный 0, не всегда означает штраф. Иногда веб-сайты, которые должны быть оштрафованы, просто не имеют входящих ссылок с достаточно высоким PageRank. Но если на страницах веб-сайта, которые ранее хорошо размещались в результатах поиска, вдруг появляется страшная белая полоса PageRank, и если не произошло каких-либо существенных изменений в отношении внешних ссылок этого веб-сайта, это означает, согласно преобладающему мнению, — конечно штраф Google.
Нам не остается ничего, кроме как строить догадки о причинах PR0, потому что представители Google редко публикуют новую информацию об алгоритмах Google. Но, тем не менее, мы хотим дать теоретический подход к тому, как может работать PR0 из-за его серьезного влияния на поисковую оптимизацию.
Предыстория PR0
Спам всегда был одной из самых больших проблем, с которыми приходилось сталкиваться поисковым системам. Когда поисковые системы обнаруживают спам, обычной процедурой является удаление этих страниц, веб-сайтов, доменов или даже IP-адресов из индекса. Но удаление веб-сайтов из индекса вручную всегда означает большое количество персонала. Это приводит к затратам и определенно противоречит целям масштабируемости Google. Таким образом, представляется необходимым автоматически фильтровать спам.
Фильтрация спама автоматически сопряжена с риском наказания невиновных веб-мастеров, поэтому фильтры должны реагировать на возможный спам достаточно разумно. Но тогда через фильтры может пройти много спама и могут потребоваться дополнительные меры. Чтобы эффективно фильтровать спам, может быть полезно взглянуть на ссылки.
То, что Google использует анализ ссылок для обнаружения спама, было более или менее ясно подтверждено на форуме новостей Google WebmasterWorld сотрудником Google, который разместил сообщение как «GoogleGuy». Снова и снова он советует веб-мастерам избегать «ссылки на плохие районы». В дальнейшем мы хотим указать «ссылки на плохие окрестности» и, если быть более точным, мы хотим обсудить, как идентификация спама может быть реализована путем анализа структур ссылок. В частности, будет показано, как можно обнаружить целые сети спам-страниц, которые могут быть даже расположены на множестве разных доменов.
BadRank как противоположность PageRank
Теоретический подход к PR0 в том виде, в котором он представлен здесь, первоначально был предложен Рафом Левиен (www.advogato.org/person/raph). Мы хотим представить метод, который, как и PageRank, анализирует структуру ссылок, но в отличие от PageRank не определяет общую важность веб-страницы, а скорее измеряет ее негативные характеристики. Для простоты этот метод будет называться «BadRank».
BadRank в принципе основан на «связи с плохими соседями». Если одна страница ссылается на другую страницу с высоким BadRank, первая страница сама получает высокий BadRank по этой ссылке. Сходство с PageRank очевидно. Разница в том, что BadRank основан не на оценке входящих ссылок веб-страницы, а на ее исходящих ссылках. В этом смысле BadRank представляет собой реверсию PageRank. В прямой адаптации алгоритма PageRank BadRank будет определяться следующей формулой:
BR(A) = E(A) (1-d) + d (BR(T1)/C(T1) + … + BR(Tn)/C(Tn))
где
BR(A) — BadRank страницы A, | |
BR(Ti) — BadRank страниц Ti, являющихся исходящими ссылками страницы A, | |
К(Ти) здесь количество входящих ссылок страницы Ti и | |
d снова необходимый коэффициент демпфирования. |
В рассмотренных ранее модификациях алгоритма PageRank E(A) представляет собой специальную оценку определенных веб-страниц. Что касается алгоритма BadRank, это значение отражает, была ли страница обнаружена спам-фильтром или нет. Без значения E(A) алгоритм BadRank был бы бесполезен, потому что это был бы не что иное, как еще один анализ структур ссылок, который не учитывал бы никаких дополнительных критериев.
С помощью алгоритма BadRank в первую очередь можно оценить спам-страницы. Фильтр присваивает им числовое значение E(A), которое может быть основано, например, на степени спама или даже лучше на их PageRank. Таким образом, опять же, сумма всех E(A) должна равняться общему количеству веб-страниц. В ходе итеративного вычисления BadRank передается не только страницам, которые ссылаются на спам-страницы. На самом деле, BadRank может определить области сети, где спам имеет тенденцию появляться относительно часто, точно так же, как PageRank определяет области сети, которые имеют общее значение.
Конечно, BadRank и PageRank имеют существенные различия, особенно из-за использования исходящих и входящих ссылок соответственно. В нашем примере показан простой веб-сайт с иерархической структурой, который довольно хорошо отражает общие структуры ссылок. Каждая страница ссылается на каждую страницу, которая находится на более высоком иерархическом уровне и на своей ветви древовидной структуры веб-сайта. Каждая страница ссылается на страницы, расположенные иерархически непосредственно под ними, и, кроме того, страницы той же ветки и того же иерархического уровня ссылаются друг на друга.
В следующей таблице показано распределение входящих и исходящих ссылок для иерархических уровней такого сайта.
Уровень | входящие ссылки | исходящие ссылки |
0 | 6 | 2 | 1 | 4 | 4 |
2 | 2 | 3 |
Как как и следовало ожидать, в отношении входящих ссылок имеет место иерархическая градация от главной страницы вниз. Напротив, мы находим наибольшее количество исходящих ссылок на среднем уровне веб-сайта. Мы можем увидеть аналогичные результаты, когда добавим еще один уровень страниц на наш веб-сайт, в то время как описанные выше правила связывания остаются прежними.
Уровень | входящие ссылки | исходящие ссылки |
0 | 14 | 2 | 2 | 4 |
Опять же, на среднем уровне сайта наблюдается концентрация исходящих ссылок. Но самое главное, исходящие ссылки распределены гораздо более равномерно, чем входящие.
Если мы присвоим E(A) индексной страницы значение 100 в нашем исходном примере, в то время как все остальные значения E равны 1, а коэффициент демпфирования d равен 0,85, мы получим следующие значения BadRank:
Стр. | |
D/E/F/G | 12.21 |
Прежде всего, мы видим, что BadRank распространяется со страницы индекса на все остальные страницы сайта. Сочетание PageRank и BadRank будет подробно рассмотрено ниже, но, независимо от того, как будет реализовано сочетание, очевидно, что оба могут очень хорошо нейтрализовать друг друга. В конце концов, мы можем предположить, что PageRank страницы также уменьшается, чем ниже уровень иерархии, так что PR0 может быть легко достигнут для всех страниц.
Если мы теперь предположим, что иерархически подчиненная страница G ссылается на страницу X с постоянным BadRank BR(X)=10, при этом ссылка со страницы G является единственной входящей ссылкой для страницы X, и если все значения E для нашего примера сайте, равном 1, получаем при коэффициенте демпфирования d, равном 0,85, следующие значения:
Стр.![]() | |
C | 14,50 |
D | 4,22 |
E | 4,22 |
F | 11,22 |
G | 17,18 |
В этом случае мы видим, что распределение BadRank менее однороден, чем в первом сценарии. Тем не менее, происходит распределение BadRank по всем страницам сайта. Действительно, относительно низкий BadRank индексной страницы А примечателен. Может возникнуть проблема с нейтрализацией его PageRank, который должен быть выше по сравнению с остальными страницами. Этот эффект не очень желателен, но он отражает опыт многих веб-мастеров. Довольно часто мы можем наблюдать явление, когда все страницы, кроме главной страницы веб-сайта, показывают PR0 на панели инструментов Google, в результате чего индексная страница часто имеет PageRank панели инструментов между 2 и 4. Следовательно, мы, вероятно, можем предположить, что это особое вариант PR0 не связан с обнаружением соответствующего сайта спам-фильтром, а скорее сайт получил штраф за «ссылки на плохие окрестности». Действительно, также возможно, что этот вариант PR0 возникает, когда только иерархически подчиненные страницы веб-сайта попадают в ловушку спам-фильтра.
Комбинация PageRank и BadRank для PR0
Если мы предположим, что BadRank существует в представленной здесь форме, возникает вопрос, каким образом можно объединить BadRank и PageRank, чтобы наказать как можно больше спамеров и в то же время наказать как можно меньше невиновных веб-мастеров.
Интуитивно кажется, что внедрение BadRank непосредственно в фактические вычисления PageRank имеет смысл. Например, можно сначала рассчитать BadRank, а затем разделить PageRank страницы на ее BadRank каждый раз в ходе итеративного расчета PageRank. Преимущество этого заключается в том, что страница с высоким BadRank может передавать только небольшой PageRank или вообще не передавать его страницам, на которые она ссылается. В конце концов, можно утверждать, что если одна страница ссылается на подозрительную страницу, все остальные ссылки на этой странице также могут быть подозрительными.
Действительно, такая прямая связь между PageRank и BadRank очень рискованна. Прежде всего, фактическое влияние BadRank на PageRank невозможно оценить заранее. Следует учитывать, что мы создадим множество страниц, которые не смогут передать PageRank страницам, на которые они ссылаются. На самом деле эти страницы являются оборванными ссылками, и, как уже говорилось в разделе об исходящих ссылках, абсолютно необходимо избегать оборванных ссылок при расчете PageRank.
Итак, было бы целесообразно иметь отдельные итерационные расчеты для PageRank и BadRank. Их последующее объединение может быть основано, например, на простых арифметических операциях. В принципе, вычитание имело бы желательное последствие, состоящее в том, что относительно небольшие значения BadRank едва ли могут иметь большое влияние на относительно высокие значения PageRank. Но, безусловно, возникнет проблема с достижением PR0 для большого количества страниц с помощью вычитания. Мы бы предпочли снижение PageRank для многих страниц.
Достижение эффектов, которые мы знаем как PR0, кажется, легче реализовать, разделив PageRank на BadRank. Но это означало бы, что BadRank получает чрезвычайно большое значение. Однако, поскольку средний BadRank равен 1, большая часть значений BadRank меньше 1, поэтому необходима нормализация. Вероятно, нормализация и масштабирование BadRank до значений от 0 до 1, чтобы «хорошие» страницы имели значения, близкие к 1, а «плохие» страницы имели значения, близкие к 0, и, впоследствии, умножение этих значений на PageRank даст наилучшие результаты.
Очень эффективной и простой в реализации альтернативой может быть простая пошаговая оценка PageRank и BadRank. Было бы разумно, если бы BadRank превышал определенное значение, это всегда приводило бы к PR0. То же самое может произойти, когда отношение PageRank к BadRank ниже определенного значения. Кроме того, имело бы смысл, если BadRank и/или отношение BadRank к PageRank ниже определенного значения, BadRank вообще не оказывает никакого влияния.
Только в том случае, если ни один из этих случаев не возникает, может потребоваться фактическая комбинация PageRank и BadRank — например, путем деления PageRank на BadRank. Таким образом можно избежать всех нежелательных эффектов.
Критический взгляд на BadRank и PR0
То, как Google будет реализовывать комбинацию PageRank и BadRank, имеет довольно второстепенное значение. Действительно, отдельное вычисление и последующее их сочетание приводят к тому, что фактический эффект от высокого BadRank может быть невозможно увидеть, взглянув на панель инструментов. Если страница имеет высокий PageRank в первоначальном смысле, влияние ее BadRank может быть незначительным. Но если на него ссылается другая страница, это может иметь довольно серьезные последствия.
Еще более серьезной проблемой является прямое изменение алгоритма PageRank, как мы его здесь представили: точно так же, как дополнительная входящая ссылка для одной страницы не может ничего сделать, кроме увеличения PageRank этой страницы, дополнительная исходящая ссылка может только увеличить ее BadRank. Это связано с добавлением значений BadRank в формулу BadRank. Таким образом, не имеет значения, сколько «хороших» исходящих ссылок имеет страница — одной ссылки на спам-страницу может быть достаточно, чтобы привести к PR0.
Действительно, эта проблема может появиться только в исключительных случаях. Благодаря нашей прямой реверсии алгоритма PageRank BadRank страницы делится на ее входящие ссылки, а отдельные ссылки на страницы с высоким BadRank передают только часть этого BadRank в каждом случае. Комментарий Мэтта Каттса из Google по этому поводу: «Если кто-то случайно сделает ссылку на плохой сайт, это может не повредить ему, но если он сделает двадцать, это проблема». (searchenginewatch.com/sereport/02/11-searchking.html)
Однако пока все ссылки имеют одинаковый вес при вычислении BadRank, возникает другая проблема. Если две страницы сильно различаются по PageRank и обе имеют ссылку на одну и ту же страницу с высоким BadRank, это может привести к тому, что страница с более высоким PageRank будет гораздо меньше страдать от переданного BadRank, чем страница с низким PageRank. Остается надеяться, что Google знает, как бороться с такими проблемами. Тем не менее, следует отметить, что в представленной здесь процедуре исходящие ссылки не могут принести ничего, кроме вреда.
Конечно, все заявления о том, как работает PR0, являются чистыми предположениями. Но в принципе анализ ссылочных структур по аналогии с методикой PageRank должен быть таким, как только Google понимает, как бороться со спамом.
PageRank и Google являются товарными знаками Google Inc., Маунтин-Вью, Калифорния, США. PageRank защищен патентом США 6 285 999.
Содержание этого документа может быть воспроизведено в Интернете при условии включения уведомления об авторских правах и наличия прямой HTML-гиперссылки на соответствующую страницу на pr.efactory.de в прямом контексте.
Урлауб Гиптен
(c) 2002/2003 eFactory GmbH & Co. KG Internet-Agentur — написано Маркусом Собеком
Что такое Google PageRank, как он зарабатывается и имеет ли значение?
Когда пользователь вводит поисковый запрос, главной целью поисковой системы является предоставление результатов, которые являются высококачественными, релевантными и могут наилучшим образом дать им то, что они хотят. Одним из более чем 200 факторов SEO, которые Google принимает во внимание, чтобы определить, какие веб-страницы лучше всего соответствуют требованиям, является PageRank.
Что такое PageRank?
PageRank (PR) – это вычисление, изобретенное основателями Google Ларри Пейджем и Сергеем Брином, которое оценивает качество и количество ссылок на веб-страницу, чтобы определить относительную оценку важности и авторитетности этой страницы по шкале от 0 до 10.
Несколько доменов PageRank 10, включая USA.gov, Twitter.com и Adobe Reader Download, имеют самый высокий объем входящих ссылок среди всех сайтов в Интернете.
Верхние сайты, так сказать, устанавливают планку, и 10-балльная шкала резко падает оттуда.
Веб-сайты с PageRank 5 имеют большое количество входящих ссылок, сайты с PR 3 и PR 4 имеют достаточное количество, а совершенно новые веб-сайты без каких-либо входящих ссылок, указывающих на них, начинаются с PageRank 0.
ПРИМЕЧАНИЕ. PR сайта или вашего конкурента. Но Google больше не показывает показатель PageRank для веб-сайтов. Раньше он отображался в верхней части веб-браузеров прямо на панели инструментов Google, но не более того. Кроме того, PR-данные больше не доступны разработчикам через API. Однако, несмотря на то, что сейчас он скрыт от всеобщего обозрения, PageRank остается важным компонентом секретных алгоритмов ранжирования Google .
Поскольку Google хочет возвращать результаты первой страницы, которые являются высококачественными, релевантными и заслуживающими доверия, он может возвращать веб-страницы с более высокими показателями PageRank, которые занимают более высокие позиции в поисковой выдаче, хотя PageRank является лишь одним из многих учитываемых факторов ранжирования.
Поскольку PageRank является лишь одним из факторов в алгоритме ранжирования Google, важно помнить, что высокий PageRank не гарантирует высокий рейтинг, но может существенно помочь.
ПРИМЕЧАНИЕ: С ростом использования мобильного Интернета особенно важно также учитывать, как обновление Google Mobilegeddon повлияет на рейтинг поиска.
Что такое «ссылочный сок» и что такое «баллы» PageRank?
Когда Сайт А ссылается на вашу веб-страницу, Google рассматривает это как одобрение или голосование Сайта А за вашу страницу. Google учитывает все эти голоса за ссылки (т. е. ссылочный профиль веб-сайта), чтобы сделать выводы об актуальности и значимости отдельных веб-страниц и вашего веб-сайта в целом. Это основная концепция PageRank.
Когда веб-сайт ссылается на ваш сайт или когда вы создаете внутреннюю ссылку с одной из ваших страниц на другую, эта ссылка проходит баллы PageRank. Эта передача баллов PageRank также обычно называется « ссылочным весом » или переносом «ссылочного капитала».
Количество передаваемых ссылок зависит от двух факторов: количества баллов PageRank веб-страницы, содержащей ссылку, и общего количества ссылок на веб-странице, которые проходят PageRank. Здесь стоит отметить, что, хотя Google будет присваивать каждому веб-сайту общедоступный рейтинг PageRank от 1 до 10, «баллы», которые каждая страница накапливает за счет ссылочного веса, передаваемого ценными входящими ссылками, могут — и действительно — значительно превышают десять. . Например, веб-страницы на самых мощных и значимых веб-сайтах могут передавать сотни или тысячи точек ссылочного веса. Чтобы рейтинговая система была краткой, Google использует много математических расчетов, чтобы сопоставить очень большие (и очень маленькие) значения PageRank с аккуратной и чистой шкалой оценок от 0 до 10.
Как передается ссылочный вес
Подумайте об этом так: каждая веб-страница имеет ограниченное количество ссылочного веса, которое она может передать, и верхушка этого предела — это общее количество очков PageRank, накопленных страницей. Таким образом, веб-страница с 20 накопленными баллами PageRank не может передать более 20 баллов ссылочного веса на страницу.
Если страница с 20 баллами PageRank ссылается на другую страницу, эта ссылка перенесет весь ссылочный вес на эту другую веб-страницу. Но если страница с 20 баллами PageRank ссылается на пять веб-страниц (внутренних или внешних), каждая ссылка будет передавать только одну пятую часть ссылочного веса.
Google применяет значение затухания к каждому проходу, поэтому фактические числа будут немного меньше, чем показано на нашей диаграмме ниже. Но чтобы просто объяснить концепцию PageRank, формула представляет собой количество баллов PR, деленное на количество ссылок на странице, или, в данном случае, 20, деленное на 5:
. ссылается на пять других веб-страниц, каждая из которых, соответственно, получает приблизительно четыре балла PageRank.Что делать, если вы хотите сослаться на несколько ресурсов, чтобы облегчить взаимодействие с пользователем, но у вас есть стратегическая причина воздержаться от передачи PageRank этим страницам?
Вы можете запретить Google передавать PageRank, добавив в некоторые ссылки атрибут rel=»nofollow». Ссылка nofollow не сканируется поисковыми системами, и сигналы PageRank или анкорного текста не передаются.
Однако Google по-прежнему считает ссылки nofollow частью общего количества ссылок на странице. Таким образом, снижается значение PageRank, доступное для прохождения по оставшимся ссылкам.
Так, например, если у вас есть веб-страница со 100 баллами PR, на которой есть четыре ссылки, и три из этих ссылок имеют теги rel=»nofollow», одна ссылка, которая не имеет rel=»nofollow», вероятно, все равно будет передавать только одну четвертую или 25 точек ссылочного веса. (Узнайте, когда nofollow необходим, ниже.)
Перенос PageRank/Link Juice с помощью внутренних ссылок
Вы можете помочь Google рассматривать страницы вашего веб-сайта как авторитетные, разместив ссылки на свои важные страницы из связанных статей.
Например, если у вас есть статья под названием «Как провести исследование ключевых слов», вы можете помочь Google повысить релевантность этой страницы для темы/фразы «исследование ключевых слов», дав ссылку из статьи, посвященной инструменту исследования ключевых слов, на ваша статья «Как провести исследование ключевых слов». Эта стратегия связывания является частью эффективного разделения, которое помогает прояснить основные темы вашего веб-сайта.
Добавление rel=»nofollow» к ссылке может не сохранить PageRank в том виде, в котором его когда-то использовали SEO-специалисты — для формирования потока ценности PR через сайт (т.н. «моделирование ссылок»). Тем не менее, nofollow необходим для некоторых типов ссылок:
- Платные ссылки и реклама
- Ссылки, которые снижают актуальность вашей темы
- Ссылки на ненадежные страницы
Платные ссылки и реклама на вашем сайте ДОЛЖНЫ иметь атрибут nofollow (см. политику Google в отношении nofollow). Если у вас есть платные ссылки, по которым вы переходите, поисковые системы могут заподозрить, что вы пытаетесь манипулировать результатами поиска, и наложить на ваш сайт штраф в рейтинге. Алгоритм Google Penguin съедает манипулятивные платные ссылки на обед, поэтому держитесь подальше от меню, добавляя атрибуты nofollow, где это применимо.
Во-вторых, nofollow также важен для ссылок на страницы не по теме, независимо от того, являются ли они внутренними или внешними по отношению к вашему сайту. Вы хотите, чтобы поисковые системы не поняли, о чем ваши страницы. Связывание релевантных страниц вместе повышает актуальность вашей темы. Таким образом, чтобы сохранить четкость разрозненности тем, можно применять стратегическое использование атрибута nofollow при связывании страниц, не относящихся к теме.
Третий случай использования nofollow, который Google дает, относится к ненадежным сайтам. Конечно, вы не хотели бы передавать PageRank ненадежному сайту.
Предостережение: Теперь, когда вы в основном понимаете, как работает PageRank, мы не хотим дать вам неправильное представление. Для получения дополнительной информации об эффективных стратегиях создания ссылок см. обсуждение «Как увеличить популярность ссылок в SEO».
В современном мире КАЧЕСТВО важнее количества. Штрафы Google заставили многих владельцев веб-сайтов не только прекратить построение ссылок, но и начать их сокращение. Ссылки плохого качества (т. е. ссылки со спамных или не по теме сайтов) подобны яду и могут убить ваш рейтинг в поисковых системах.