Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

dimok.ru :: дизайн, верстка, оптимизация для поисковых систем - 22


Информационный Канал Subscribe.Ru

Что такое Google дэнс (Google Dance)?
Рассылка... выпуск 22. Этот и другие материалы вы можете найти на сайте dimok.ru

Приветствую всех! За сегодняшний материал выражаю искреннюю благодарность Дмитрию Тожокину.

В следующем выпуске обязательно будет интересный материал. Оставайтесь с нами!

Что такое Google дэнс (Google Dance)?

Автор: Phil Craven
http://www.webworkshop.net/google_dance.html
Перевод: Дмитрий Тожокин (Toking_DA@mail.ru)

Приблизительно раз в месяц Google обновляет свои индексы, пересчитывая PageRank для каждой страницы индекса. Этот период обновления индексов известен как Google Dance.

По своей природе расчет PageRank страницы проводится около 40 раз, и, благодаря большому размеру индекса, вычисления занимают несколько дней. В этот период результаты поиска колеблются (иногда каждую минуту). Эти колебания и объясняют появление термина "Google дэнс" ("танцы Гугла"). Дэнс обычно проходит где-то в последней трети каждого месяца.

Google имеет два других сервера, которые могут использоваться для поиска. Результаты поиска на них тоже меняются в период ежемесячного обновления и это часть Google дэнса.

В конце месяца иногда случаются колебания в результатах поиска, но они не должны быть перепутаны с настоящим дэнсом. Они происходят благодаря FRESH CRAWL (свежему обходу) Google и благодаря тому, что называется "Everflux" (этот термин используют, говоря о том, что кроме ежемесячных обновлений изменения можно наблюдать на протяжении всего периода между обновлениями – прим. dimok).

Проверка нового рейтинга во время дэнса Google

Кроме www.google.com Google имеет два других сервера www2.google.com и www3.google.com. Большую часть времени результаты поиска всех трех серверов одинаковы, но во время дэнса они отличаются.

На протяжении большей части дэнса рейтинги, которые можно увидеть на www2 и www3 - новые, которые будут переданы на www когда дэнс закончатся. Не смотря на то, что вычисления проводятся около 40 раз, окончательный рейтинг можно увидеть довольно быстро. Это происходит потому, что в течение первых нескольких итераций, вычисленные значения сливаются, чтобы быть близкими к их окончательному значению. Вы можете увидеть это с помощью Калькулятора PageRank страницы (Pagerank Calculator) поставив флажок в поле "Данные" (Data) (слева вверху) и выполнив некоторые вычисления. После первых нескольких итераций результаты поиска на www2 и www3 могут все еще изменяться, но только слегка.

Во время дэнса результаты на www2 и www3 иногда будут показаны на сервере www, но только частично. Также новые результаты на www2 и www3 могут исчезать на короткие периоды. Под конец дэнса результаты на www будут совпадать с результатами на www2 и www3.

Удобный инструмент для просмотра результатов со всех 3 серверов может быть найден по ссылке www.google-dance.com.

Проверка нового PageRank страницы во время Google дэнса

Google имеет 7 центров данных, каждый из которых может хранить PageRank каждой страницы. Когда дэнс в процессе, эти центры данных адаптируют (обновляют информацию) друг друга. Перед началом дэнса они все возвращают одинаковые значения, текущий PageRank для данной страницы, но в течение дэнса они адаптируют друг друга на новое значение PageRank. Проверка каждого центра в течение дэнса показывает новые значения PageRank страницы, т.к. значения постепенно распространяются по центрам. Если PageRank не собирается изменяться, центры, конечно же, показывают одинаковые значения повсюду.

Опрашивание центров данных

Для этого необходимо иметь установленную панель инструментов Google (Google Toolbar) и индикатор PageRank включенным. Каждый раз, когда страница принимается браузером, панель инструментов запрашивает PageRank с одного из центров данных Google. Информация возвращается как текстовый файл и хранится в папке Temporary Internet Files.

Адрес запроса панели инструментов включает адрес страницы, для которой желательно получить PageRank (страница-цель), и контрольную сумму, соответствующую этому адресу (URL). Конечно, контрольная сумма должна совпадать с контрольной суммой адреса страницы-цели.

Полный адрес типичного запроса панели инструментов:
http://216.239.33.102/search?client=navclient-auto&
ch=5150615727&features=Rank:FVN&
q=info:http%3A%2F%2Fwww%2Eexampledomain%2Ecom%2F

Если вы скопируете этот полный адрес в браузер, вы получите назад "запрещенную" страницу от Google. Это происходит потому, что контрольная сумма не совпадает - это просто пример запроса адреса.

Заметьте, что страница-цель в формате Ecs (escaped format) - некоторые символы представлены шестнадцатеричными кодами (например, %2F).

Для получения нового адреса для конкретной страницы вы должны сделать такой же запрос как делает это панель инструментов. Т.е. вам нужен полный адрес, который использует панель инструментов. И вы должны запросить рейтинг страницы у всех 7 центров данных Google. Этот метод длинный, но работает.

Как это сделать:

- Используйте ваш браузер для просмотра страницы. Это сделает нас уверенными, что страница и запрос панели инструментов о рейтинге страницы находятся в папке Temporary Internet Files. Вы просто должны сделать это один раз - не каждый раз.

- Откройте файл index.dat из Temporary Internet Files текстовым редактором и произведите поиск страницы-цели. Вы найдете вхождение полного адреса, похожего на указанный выше, для запроса панели инструментов.

Примечание: Т.к. полный адрес страницы-цели в формате Esc, проводите поиск только по части адреса, которая не в формате Esc, например, "exampledomain".

- Когда вы нашли полный адрес, скопируйте его в браузер и нажмите ввод или кликните Go. Если страница присутствует в каталоге Google, будет возвращена строка, включающая путь в каталоге. Последним элементом в первой части строки является значение рейтинга панели инструментов для страницы-источника.

Для просмотра нового рейтинга страницы всех центров во время танцев, используйте тот же полный адрес, но замените IP адрес для каждого из семи центров данных. Это также хороший путь для просмотра процесса танцев в целом.

Центры данных:
216.239.33.100
216.239.35.100
216.239.37.100
216.239.39.100
216.239.51.100
216.239.53.100
216.239.55.100

Совет: Если вы хотите проверить одинаковые страницы в течение будущих дэнсов, сохраните полные адреса в текстовом документе, и таким образом вам не нужно будет каждый раз искать их в папке Temporary Internet Files.


Перевод: Дмитрий Тожокин (Toking_DA@mail.ru)
ООО "Растр-технология": изготовление оборудования для производства упаковки из картона, ионно-плазменным напылением, лазерной и плоттерной резкой, фрезерованием и т.д.
www.r-tech.ru


Кстати, вы всегда можете встретить меня на форумах:
http://web-job.ru/
http://www.webclass.ru/

Если у кого-то из вас появились интересные идеи относительно всего вышесказанного, милости прошу на мой e-mail: dimok@tula.net

Архив рассылки      Сайт автора рассылки      Блог о поисковиках

Все права принадлежат Голополосову Дмитрию. 2000-2003. http://dimok.ru    dimok@tula.net


Rambler's Top100 Rambler's Top100



http://subscribe.ru/
E-mail: ask@subscribe.ru
Отписаться
Убрать рекламу

В избранное