Понятие Google PageRank является одним из ключевых моментов в работе поисковой машины Google. Наряду с другими параметрами, влияющими на выдачу (сортировку) сайтов в результатах поиска, знание модели PageRank необходимо как для понимания процесса поиска, так и для использования оптимизаторами при продвижении своих сайтов в поисковой системе.
Истории появления этого параметра будет посвящена другая статья. Здесь я, как автор, хочу лишь изложить математические основы вычисления PageRank, используемые повсеместно. Для начала, примем за аксиому, что при расчете Google PR, не будет учитываться “рассовая” принадлежность ссылок, их “языковая группа” или “внешний вид”, а будем полагать, что все страницы в сети Интернет равны (как мы с вами), и вес ее будет определяться лишь весом ссылающихся страниц-доноров.
Представьте себе, что вы Учитель (или свою профессию – сапожник, программист, оптимизатор, доктор с пиявками …), и что вам надо делать свою работу. Перед вами стоит задача: как найти тех людей, которым вы нужны, и которые будут рады воспользоваться вашими услугами?! Для этого можно либо сделать себе рекламу (баннеры, adsense, директ и др.), либо устроиться в какую-нибудь контору, которая будет поставлять вам клиентов (фриленсерские сайты, статьи, социальные закладки). Единственное, когда клиенты сами будут к вам приходить, это если другие скажут им о вас, посоветуют, расхвалят и т.д. Здесь вы не тратите средства на рекламу, и это самые эффективные клиенты, которым действительно нужна ваша помощь.
Говоря другими словами, мы подошли к понятию PageRank, который отражает вес вашей страницы по ссылкам (“слухам”) с других страниц. И понятно, что чем больше ссылающихся на вас страниц, тем больше у вас вес.
PageRank (далее просто PR) это числовая величина — мера “важности” страницы в поисковой системе Google. Зависит от числа внешних ссылок на данную страницу и от их веса (важности). Другими словами от количества и качества ссылающихся страниц. А если говорить математическим языком, то PR это алгоритм расчёта авторитетности страницы, используемый поисковой системой Google. PR не является основным, но является одним из вспомогательных факторов при ранжировании сайтов в результатах поиска.
Следует отметить, что при расчете PR Google учитывает не все ссылки, а отфильтровывает ссылки с сайтов, специально предназначенных для скопления ссылок. Некоторые ссылки могут не только не учитываться, но и отрицательно сказаться на ранжировании ссылающегося сайта (такой эффект назвается поисковой пессимизацией).
Документ (на англ. языке), подробно описывающий модель PageRank, введеной Сергеем Брином и Ларри Пейджем, можно скачать по ссылке: The_PageRank_Citation_Ranking.pdf [299.73KB].
Основная формула, описывающая PR выглядит следующим образом.
![]()
где d — демпфирующий коэффициент, отражающий какую долю веса может передать страница-донор на страницу-акцептор. Обычно его принимают равным 0.85, что означает, что страница может передать 85% веса (распределяется между всеми акцепторами, на которые ссылается донор). В других источниках d является вероятностью, с которой пользователь перейдет на один из акцепторов, а не закроет браузер, что, в принципе, то же самое. Какое числовое значение у этого параметра в Google знают только там, остальные принимат его равным 0.85 (видимо из эксперементальных данных);
n — количество страниц, ссылающихся на страницу-акцептор (на которые не наложен фильтр);
Ti — i-ая ссылающаяся страница;
C — количество внешних ссылок на странице-доноре.
Поскольку ссылающихся страниц может быть много, и общее количество страниц в поисковой системе Google достаточно велико (около десятка биллионов штук) а также их количество постоянно растет, то представлять вес страницы в абсолютных значениях для вебмастеров было бы весьма неправильно. Для этого ввели понятие TLPR — ToolBar PageRank, который имеет значение от 0 до 10 (зелененькая шкала в Google Toolbar).
Для того, чтобы уложить все веса страниц между значениями от 0 до 10 используют логарифмическую шкалу.
TLPR = Logbase(PR) * a
где base — основание логарифма, которое зависит от количества страниц в поисковой машине (возможно и от ряда других факторов). Некоторые принимают его равным 7;
a — некий коэффициент приведения, который удовлетворяет неравенству 0 < a ≤ 1. Оптимизаторам его можно принять равным единице для упрощения расчетов.
Из вышесказанного неверно делать выводы, что нулевой TLPR означает нулевой реальный PageRank. По первой формуле видно, что даже при n = 0, мы получим минимальный PRmin = (1-d) = 0.15. Это значение соответствует TLPR ≈ -1. При таких (отрицательных) значениях тулбарного PR считается что PR = N/A (или еще не определен), однако он также оказывает влияние на распределение веса между ссылками-акцепторами. Также следует заметить, что тулбарное значение предназначено только для отображения вебмастерам в Google Toolbar и никак не влияет на выдачу в серпе. На выдачу в серпе влияние оказывает реальный PR страницы!
Исходя из принципов расчета Google PageRank, можно теперь легко расчитать, с каких ссылок нужно ссылаться и сколько нужно ссылок, чтобы получить тот или иной PR. Также можно прогнозировать PR. Один из важных выводов, который я для себя сделал заключается в следующем. Если мы имеем новый сайт со страницами более 10,000 (число страниц зависит от количества ссылок с них на другие страницы), они правильно перелинкованы и каждая ссылается на главную страницу, то главная страница получит хороший вес от этих ссылок. Вот немного математики по этому поводу.
PRmin = 0.15;
PR = 0.15 + 0.85 * 20000/10; (при учете в среднем 10 ссылок на странице)
TL*PR* = Log(1700.15, 7) = 3.823 ≈ 4
Вот вам и пример хорошего PR без единой внешней ссылки с других сайтов :)
Теперь понятно, почему у таких систем как Digg.com, Del.icio.us и других подобных весьма большой PageRank.
На вышеизложенной теории построен JavaScript калькулятор для расчета PR (правда без учета ссылок с PR0). Калькулятор можно разместить на своем сайте. Код прилагается.
Существует множество способов повышения веса своих страниц, но главная идея — это качественные ссылки с других сайтов. Для этого можно использовать каталоги, социальные закладки, статьи, форумы, блоги и другие типы сайтов. Однако не следует глупо расставлять множество ссылок на других сайтах, так как помимо PageRank существует множество других ранков, влияющих на выдачу страницв в результатах поиска (например TrustRunk).
Нет, не бывает. Реальный PR минимум равен 0.15, минимальный тулбарный PR равен нулю.
Ссылки на своем сайте на другие сайты ставить необходимо, так как своими ссылками вы увеличиваете PR страниц-акцепторов и тем самым, по первой формуле, к вам возвращается еще больший вес из огромной системы ссылок.
Апдейты для тулбарного PR происходят раз в 2-4 месяца, для реального PR я уверен, что апдейты происходят чаще. В Google каталоге Dmoz можно посмотреть TLPR на текущий момент для вашего сайта, если он размещен в каталоге.
Ни коим образом язык на передачу веса PR не влияет. Влияет только качество и количество ссылающихся на вас страниц.
Нет, не влияет. На значение PageRank влияет только количество и качество ссылающихся ресурсов.
С картинок PageRank “перетекает”, только если они являются ссылками, по которым пользователь может перейти на другой ресурс.
Найдите нужного исполнителя через каталог seo-компаний Рунета.
22 Ответов
сентября 30, 2008 at 07:22
1спасибо за калькулятор, очень полезная штука
декабря 28, 2008 at 12:53
2Проверял калькулятор, подставляя данные из таблиц по подсчету ПР, так по калькулятору и таблице разные значения. В основном на 2 пункта расходятся…
декабря 28, 2008 at 01:01
3Калькулятор и таблицы сделаны разными людьми :)
А если математически подходить, то там просто коэффициенты для логарифма чуть отличаются.
февраля 11, 2009 at 06:14
4“Бывает ли отрицательный PR?
Нет, не бывает. Реальный PR минимум равен 0.15, минимальный тулбарный PR равен нулю.”
Откуда такая уверенность? Как можно проверить этот тезис? Ибо в этом же блоге написано, что:
“де d — демпфирующий коэффициент, отражающий какую долю веса может передать страница-донор на страницу-акцептор. Обычно его принимают равным 0.85, что означает, что страница может передать 85% веса (распределяется между всеми акцепторами, на которые ссылается донор). В других источниках d является вероятностью, с которой пользователь перейдет на один из акцепторов, а не закроет браузер, что, в принципе, то же самое. Какое числовое значение у этого параметра в Google знают только там, остальные принимат его равным 0.85 (видимо из эксперементальных данных);”
Если бы я был директором гугла, то я бы сделал d ступенчатой функцией, которая бы при отстутствии внешних ссылок на страницу принимала бы значение 1. Ну или почти один ;)
февраля 11, 2009 at 06:17
5Хотя нет, если бы я был директором Гугола, я бы купил яхту, затарил много жратвы и пива, всех друзей существенных бы собрал и поехал в кругосветку))))
Но вот если бы я отвечал за ранжирование….)))) Почти 1 – это чтобы не искать тот самый первый сайт с ненулевым ПР.))) Хотя как я щас по-быстрому могу прикинуть, совсем 1 тоже подходит – функция же ступенчатая))
февраля 12, 2009 at 04:46
6Урал, во-первых, это теория, которая работает с самого начала основания Google. Во-вторых, если бы вы отвечали за ранжирование в Гугли, тогда вы бы понимали, что факторов ранжирования более 250, и PageRank не является среди них весомым. Поэтому, все, что вы придумали со ступенчатым d это конечно хорошо, однако, изначально, модель PageRank отражает серфинг пользователей в сети Интернет от узла к узлу, ничего более.
февраля 12, 2009 at 09:29
7А никто и не говорил, что PR главный фактор. Как я понимаю, для нас с вами это одиин из немногих параметров обратной связи черного ящика типа Гугол.
Формула, безусловно, интересная. Возможно, как нибудь попробую. Воспользоваться этим знанием. ))
февраля 18, 2009 at 03:49
8В формуле расчета PR во втором слагаемом множитель 0,15 не пропущен? Тот, что PR каждой внутренней страницы определяет.
марта 1, 2009 at 03:58
9Здравствуйте спасибо за информацию была очень полезна.
Но у меня остался один вопрос: Отдает ли страница часть своего PR внешней ссылке. Или PR остается и не тратися?
марта 14, 2009 at 10:59
10Насчёт минимального pr- некоторые проги показывали не 0.15, а даже 0.1
апреля 15, 2009 at 06:38
11Вот прошу подтвердить или отвергнуть мое понимание “трастовости ссылок” и всего прочего: если у меня сайт о музыке, то я могу сколько угодно много ставить ссылки на этот сайт ТОЛЬКО в сайтах (блогах, форумах, каталогах) по тематике “музыка” – и PR и все остальное будет только расти?! Или все же соблюдение тематичности – не единственный критерий??!
апреля 15, 2009 at 07:09
12То что некоторые проги показывают, это одно, минимальный пр несущественен и вам от этого толку явно не будет, так что лучшу думать куда глубже
мая 30, 2009 at 03:41
13Насчет ПР без внешних ссылок Вы совершенно правы. Я был очень удивлен когда у одного из проектов который только создал и добавили гуглу в аддурилу при апе ПР стал 3, а ведь я вообще не размещал ни где внешних ссылок :)
июня 15, 2009 at 02:35
14digi: +1! Внутренними ссылками набил PR2 для морды.
июля 20, 2009 at 03:20
15Посмотрел я на эту формулу. (первую не тулбарный ПР) И вот что подумал:
Представим сайт без внешних ссылок(новый) Из 10 страниц. Морда и 9 страниц, с каждой страницы ссылка на морду, с морды ссылка на все. Как собственно расчет будет идти? Ведь это бесконечный цикл получается. Допустим расчет выполняется 1 раз, а при первом расчете нерасчитанные, еще PR принимаются минимальными(0,15). Но даже так, при каждом пересчете по формуле PR будет расти как у морды так и у остальных страниц. Например первый расчет PR(морды)= 1,3 PR(страниц)=0,26, при втором уже PR(морды)= 2,14 PR(страниц)=0,33. Парадокс :)
августа 4, 2009 at 10:59
16Юрий, формула расчета ПР – функция, которая с каждым кругом расчета теряет 0,15 передаваемого веса и стремится (в бесконечности) к определенному предельному значению.
Вычислять бесконечно не нужно т. к. поправки с каждым разом становятся менее существенными. Достаточно нескольких циклов, чтобы оценить результат :)
января 20, 2010 at 06:12
17Прошу прощения, я хотел поставить ваш калькулятор на свой сайт, скопировал код, только цвета поменял и “оп!” – калькулятор не работает. Скопировал код заново и поставил его в оригинальном виде – то же самое, при клике на “Вычислить” ничего не происходит :-(
Помогите пожалуйста. Вот страница – http://teemk.com/2010/01/im-back/
января 20, 2010 at 07:02
18Teem-k, у вас в коде вместо некоторых знаков стоит html сущности. Например, вместо знака “больше” (>) стоит < и т.д. Попробуйте скопировать код, потом разместить его где-нибудь в блокноте и проверить. Мне кажется вы вставляете сразу в форму (в браузере) из буфера, а браузер эти символы преобразует. Либо же вручную в коде замените сущности типа > на соответствующие символы.
января 20, 2010 at 07:59
19Спасибо за быстрый ответ.
Вставляю в html-режиме, проверяю – этих символов нет, но в записи они появляются.
Сначала я подумал, что в этом виноват плагин Типограф ( http://iskariot.ru/wordpress/typo/#typo-light ), отключил его – но < остался, тогда залез в /wp-admin/options-writing.php и убрал галочку с “WordPress должен исправлять некорректный XHTML-код автоматически.” – <, > и прочие ИСЧЕЗЛИ из вывода. Я подумал “Ура!” но не тут то было – калькулятор всё так же не работает :-((
Отключил почти все плагины, на странице настроек даже выключил “Преобразовывать смайлики наподобие :-) и :-P в картинки” – всё равно не работает.
Причём сохраняю – смотрю код страницы:
(\‘S\’)&&4.5
Проверяю в редакторе WP:
(\‘S\’)&&4.5 – то есть там всё нормально, но при выводе WP почему то заменяет некоторые символы.
Не подскажете в чём может быть причина? Буду очень благодарен!
января 20, 2010 at 08:03
20Teem-k, вынесите скрипт в отдельный файл calc.js и вместо кода вставьте тег script с указанием внешнего скрипта.
января 20, 2010 at 09:08
21Вынес, но блин всё равно не работает :-)
http://teemk.com/tools/pr_calc.js – вот проверьте пожалуйста, всё ли правильно? На странице вроде бы скрипт подгружается нормально
февраля 24, 2010 at 03:35
22Наконец-то прочёл нормальную статью про PR. Хорошо бы ещё кто-то систематизировал информацию о переходе PR при разного рода редиректах. Я вот по глупости потерял PR на главной из-за не правильно поставленного редиректа.
Ответить