[ 管理人編集 ]
Googleのサーバ・データセンター
Googleのサーバ
Google 会社情報: テクノロジーには、キーワード検索に対して、Google側の処理の仕組みが解説してある。
- ウェブ サーバー
- ユーザーの検索したいキーワードを受け取る
- インデックス サーバー
- 世界中のWebページをインデックス付けして格納
- キーワードごとの順位付けを生成
- ドキュメント サーバー
- Webページのスナップショットであるキャッシュを格納
- 検索結果画面に表示されるタイトルとスニペットを生成
- ウェブ サーバー
- 順位付けされた検索結果画面を表示
インデックスとキャッシュの違い
キャッシュはドキュメント サーバーにあって、検索結果画面に表示されるタイトルやスニペット(要約文)とセットになっている。
キャッシュが古いものに後戻りするケースが多いし、先日は文字化け事件も起こったが、あくまでもインデックスとは別物、つまり順位付けデータとは一線を画していると考えるべきである。
ドキュメント サーバーがトラブっても、順位には影響がなかったことから、判断されると思う。
インデックス サーバーこそがGoogle Danceの源
世界中のユーザーがアクセスするわけだから、負荷を分散しなければならない。
専門用語では、DNSラウンドロビン、ロードバランサなどという仕組みで、複数のデータセンターのどれかにランダムにアクセスするようになっている。
Googleのデータセンター
Google データセンター Webサーバーの IP アドレス一覧。Google Data center list.を参照させていただいている。
| 98 | 99 | 103 | 104 | 105 | 106 | 107 | 147 | DNS | |
|---|---|---|---|---|---|---|---|---|---|
| 216.239.37 | .99 | .104 | .106 | .107 | .147 | va | |||
| 216.239.39 | .99 | .104 | .106 | .107 | dc | ||||
| 216.239.53 | .99 | .104 | .106 | .107 | in | ||||
| 216.239.57 | .98 | .99 | .103 | .104 | .105 | .106 | .107 | .147 | cw |
| 216.239.59 | .99 | .104 | .105 | .106 | .107 | .147 | gv | ||
| 216.239.63 | .99 | .104 | bp | ||||||
| 64.233.161 | .99 | .104 | .105 | .106 | .107 | .147 | od | ||
| 64.233.163 | .99 | .104 | nz | ||||||
| 64.233.167 | .99 | .104 | .106 | .107 | py | ||||
| 64.233.171 | .99 | .104 | .105 | .106 | .107 | .147 | rn | ||
| 64.233.179 | .99 | .104 | .106 | .107 | hs | ||||
| 64.233.183 | .99 | .104 | nf | ||||||
| 64.233.185 | .99 | .104 | .106 | .107 | wr | ||||
| 64.233.187 | .99 | .104 | jc | ||||||
| 64.233.189 | .104 | ||||||||
| 66.102.7 | .99 | .104 | .105 | .106 | .107 | .147 | mc | ||
| 66.102.9 | .99 | .104 | lm | ||||||
| 66.102.11 | .99 | .104 | .106 | .107 | kr | ||||
| 66.249.81 | .99 | .104 | bx | ||||||
| 66.249.83 | .99 | .104 | .106 | .107 | wx | ||||
| 66.249.85 | .99 | .104 | |||||||
| 66.249.89 | .99 | .104 | .106 | .107 | |||||
| 66.249.93 | .99 | .104 | .106 | .107 | ug | ||||
| 72.14.203 | .99 | .104 | .106 | .107 | ro | ||||
| 72.14.205 | .99 | .104 | .106 | .107 | qb | ||||
| 72.14.207 | .99 | .104 | .106 | .107 | eh | ||||
| 98 | 99 | 103 | 104 | 105 | 106 | 107 | 147 | DNS |
上記表中の右、DNS欄の「va」とは、「gfe-va.google.com」の略。以下、左側に「gfe-」、右側に「.google.com」を加える。
ホスト名とIPアドレスの関係は、gfe-va.google.comは216.239.37.104、gfe-va2.google.comは216.239.37.99、gfe-va3.google.comは216.239.37.147、となっている。以下同様。
バックリンク系インデックス
最近のGoogleの更新、Google Danceとは、バックリンク(リンク元)をチェックしているが、この目に見えるバックリンク数は、現在では順位に関係がなくなっている。
またPageRankは、バックリンクや関連ページと同時、あるいは単独で更新されているが、これも目に見えるPageRankとして順位には関係がない。
- バックリンク(リンク元)、PageRank、関連ページを、SEO塾ではバックリンク系インデックスと称する
- バックリンク系インデックスは、同時あるいは別個に更新している
- バンクリンク系インデックスの変化を、Google更新と呼び習わしてきている
- バックリンク系インデックスの目に見える更新は、順位に関係していない
Google DanceからEverflaxへ
歴史的には、Googleの更新は「Google Dance」という別称を持ち、ほぼ毎月1回のペースで行われ、その時同時に順位の変動も起こっていた。
いつからか、順位変動はEverfluxという月数回の更新に取って代わられてしまった。
また、バックリンク系インデックスの更新の数日前のEverfluxの時に、アルゴリズム変更やフィルタ導入の大規模な更新が行われている。
- 順位変動は、PageRankやバックリンクの更新とは別のタイムスケジュールになっている
- 今では、順位の変化はEverflaxで起こっている
ランキング系インデックス
データセンターの更新推移を調査すると、キーワード検索の順位に非常に関係が深い、特別構文の「allintitle:」allintext:」「allinanchor:」なども、個別に、かつ規則性をもって変化していることが見て取れる。
上記の検索子で見えるインデックスを、SEO塾では便宜的にランキング系インデックスと称しておく。
なお、念のため、ランキング系インデックスとは、キーワード検索や特別構文検索の時の、総数(分母)とアルゴリズム・フィルタ適用後の順位(分子)を見ている。
分母が同じでも、アルゴリズムかフィルタによって、分子が変わっているのが分かる。
さらに、分子が同じでも、特別構文検索によって、その順位にいたる経路が違っていることも分かる。
Sandbox Effect解消直後の、フィルタを感じさせないインデックスもあれば、別のフィルタを匂わせるものもあれば、今まで評価してきた特定の条件を切り捨てているようなインデックスもある。
- allintitle、allintext、allinanchor、site:サイトURI キーワード、site:サイトURI inanchor:キーワードなどを、見えるランキング系インデックスと称しておく
- もちろん、見えないPageRank、見えないバックリンクなどは、ランキング系インデックスであることは言うまでもない
- 検証は、見えるもので行うのであるから、便宜的なネーミングでしかないことを注釈しておく
Goomani用google.txt(2006-02-14一通り版)
Goomani用google.txt(完全版)




