Googleのサーバ・データセンター

Google File System(GFS)、インデックス、キャッシュ、Google Dance

Google対Yahoo!対MSN

[ 管理人編集 ]

Googleのサーバ・データセンター

Googleのサーバ

Google 会社情報: テクノロジーには、キーワード検索に対して、Google側の処理の仕組みが解説してある。

Google クエリのライフ サイクル
Google クエリのライフ サイクル

  1. ウェブ サーバー
    1. ユーザーの検索したいキーワードを受け取る
  2. インデックス サーバー
    1. 世界中のWebページをインデックス付けして格納
    2. キーワードごとの順位付けを生成
  3. ドキュメント サーバー
    1. Webページのスナップショットであるキャッシュを格納
    2. 検索結果画面に表示されるタイトルとスニペットを生成
  4. ウェブ サーバー
    1. 順位付けされた検索結果画面を表示
インデックスとキャッシュの違い

キャッシュはドキュメント サーバーにあって、検索結果画面に表示されるタイトルやスニペット(要約文)とセットになっている。

キャッシュが古いものに後戻りするケースが多いし、先日は文字化け事件も起こったが、あくまでもインデックスとは別物、つまり順位付けデータとは一線を画していると考えるべきである。
ドキュメント サーバーがトラブっても、順位には影響がなかったことから、判断されると思う。

インデックス サーバーこそがGoogle Danceの源

世界中のユーザーがアクセスするわけだから、負荷を分散しなければならない。

専門用語では、DNSラウンドロビンロードバランサなどという仕組みで、複数のデータセンターのどれかにランダムにアクセスするようになっている。

Googleのデータセンター

Google データセンター Webサーバーの IP アドレス一覧。Google Data center list.を参照させていただいている。

Googleデータセンター 一覧(2005-09-08現在)
98 99 103 104 105 106 107 147 DNS
216.239.37   .99   .104   .106 .107 .147 va
216.239.39   .99   .104   .106 .107   dc
216.239.53   .99   .104   .106 .107 in
216.239.57 .98 .99 .103 .104 .105 .106 .107 .147 cw
216.239.59   .99   .104 .105 .106 .107 .147 gv
216.239.63   .99   .104         bp
64.233.161   .99   .104 .105 .106 .107 .147 od
64.233.163   .99   .104     nz
64.233.167   .99   .104 .106 .107 py
64.233.171   .99   .104 .105 .106 .107 .147 rn
64.233.179   .99   .104 .106 .107 hs
64.233.183   .99   .104 nf
64.233.185   .99   .104 .106 .107 wr
64.233.187   .99   .104 jc
64.233.189       .104    
66.102.7   .99   .104 .105 .106 .107 .147 mc
66.102.9   .99   .104 lm
66.102.11   .99   .104 .106 .107 kr
66.249.81   .99   .104     bx
66.249.83   .99   .104 .106 .107 wx
66.249.85   .99   .104      
66.249.89   .99   .104 .106 .107  
66.249.93   .99   .104 .106 .107 ug
72.14.203   .99   .104 .106 .107 ro
72.14.205   .99   .104 .106 .107 qb
72.14.207   .99   .104 .106 .107 eh
98 99 103 104 105 106 107 147 DNS

上記表中の右、DNS欄の「va」とは、「gfe-va.google.com」の略。以下、左側に「gfe-」、右側に「.google.com」を加える。
ホスト名とIPアドレスの関係は、gfe-va.google.comは216.239.37.104、gfe-va2.google.comは216.239.37.99、gfe-va3.google.comは216.239.37.147、となっている。以下同様。

バックリンク系インデックス

最近のGoogleの更新、Google Danceとは、バックリンク(リンク元)をチェックしているが、この目に見えるバックリンク数は、現在では順位に関係がなくなっている。

またPageRankは、バックリンクや関連ページと同時、あるいは単独で更新されているが、これも目に見えるPageRankとして順位には関係がない。

  • バックリンク(リンク元)、PageRank、関連ページを、SEO塾ではバックリンク系インデックスと称する
  • バックリンク系インデックスは、同時あるいは別個に更新している
  • バンクリンク系インデックスの変化を、Google更新と呼び習わしてきている
  • バックリンク系インデックスの目に見える更新は、順位に関係していない
Google DanceからEverflaxへ

歴史的には、Googleの更新は「Google Dance」という別称を持ち、ほぼ毎月1回のペースで行われ、その時同時に順位の変動も起こっていた。

いつからか、順位変動はEverfluxという月数回の更新に取って代わられてしまった。

また、バックリンク系インデックスの更新の数日前のEverfluxの時に、アルゴリズム変更やフィルタ導入の大規模な更新が行われている。

  • 順位変動は、PageRankやバックリンクの更新とは別のタイムスケジュールになっている
  • 今では、順位の変化はEverflaxで起こっている

ランキング系インデックス

データセンターの更新推移を調査すると、キーワード検索の順位に非常に関係が深い、特別構文の「allintitle:」allintext:」「allinanchor:」なども、個別に、かつ規則性をもって変化していることが見て取れる。

上記の検索子で見えるインデックスを、SEO塾では便宜的にランキング系インデックスと称しておく。

なお、念のため、ランキング系インデックスとは、キーワード検索や特別構文検索の時の、総数(分母)とアルゴリズム・フィルタ適用後の順位(分子)を見ている。

分母が同じでも、アルゴリズムかフィルタによって、分子が変わっているのが分かる。
さらに、分子が同じでも、特別構文検索によって、その順位にいたる経路が違っていることも分かる。

Sandbox Effect解消直後の、フィルタを感じさせないインデックスもあれば、別のフィルタを匂わせるものもあれば、今まで評価してきた特定の条件を切り捨てているようなインデックスもある。

  • allintitle、allintext、allinanchor、site:サイトURI キーワード、site:サイトURI inanchor:キーワードなどを、見えるランキング系インデックスと称しておく
  • もちろん、見えないPageRank、見えないバックリンクなどは、ランキング系インデックスであることは言うまでもない
  • 検証は、見えるもので行うのであるから、便宜的なネーミングでしかないことを注釈しておく

Goomani用google.txt(2006-02-14一通り版)

Goomani用google.txt(完全版)

マニュアルとセミナーで、コンサルティングとセルフSEO。株式会社アルゴリズム運営のSEO塾

Yahoo!で突然、順位がダウンした! トップページが消えた!!
Googleで、何をやっても順位が上がらない! ディレクトリ丸ごとページが検索されなくなった!!

SEO業者にまかせていたのに、ペナルティを受けてしまった!
SEO業者のリンク集一括登録や、有料リンクも効果なし!!

最高最強最新のSEO、SEO塾のGoogle上位表示は、失敗しない「SEO対策」を提供します。



© 2009 ヤフーの変動リカバリーとグーグルの順位アップなら、SEO塾/(株)アルゴリズムの検索エンジン対策

株式会社アルゴリズム運営のSEO塾