2005-12-04
302リダイレクトでGoogleハイジャック - スパマーのサイト乗っ取り
HTMLのステータスコード 301と302
HTMLのステータスコードについては下記ページや、Googleなどで検索してほしい。
今回問題なのは、次の301と302である。
| ステータス・コード | 意味 | |
|---|---|---|
| 301 | Moved Permanently | 恒久的に別のアドレスへ移動 |
| 302 | Moved Temporarily | 一時的に別のアドレスに移動 |

AとBは同じページ(コンテンツ)。
301は、Aはもう存在しないから、これからはBにアクセスしてね。
302は、Aは都合でBに移動したから、今だけはBにアクセスしてね。でも、いつかAにもどるんだよ。
302リダイレクトと検索エンジン
さて、閲覧ユーザーにとっては、301でも302でも、どーでもいいことである。
しかし、個々のページを、バックリンクなどの順位付け情報を付加してデータベースに蓄えている検索エンジンでは、扱いによって大ごとになってくる。
Googleハイジャックとは
一般には、上記ポインタの記事では分かりにくいとおもう。そこで、拡大解釈して整理してみた。

本来は、301であれ302であれ、最初からふたつとも存在していて、それぞれバックリンクを得ているはずはない。
しかしスパマーは、Googleのバグ?をうまく活用するわけだ。
スパマーが管理しているページAを対象に、特別なやり方で302リダイレクトを仕込み、ページBに転送した時に、下図のようなおかしい現象が発生する場合があるというのだ。

つまり、ページBが獲得しているバックリンクを略奪しているわけだ。
これは、Googleが302を「一時的」と受け止め、リダイレクト先のページBのバックリンク情報もページAに蓄積して行くからである。
なお、通常のhtaccessなどの302転送を設定したままでは、ページAにアクセスしてもページBに飛ぶ。
Googlebotだけに302を認識させるのか、アンカーの書式に仕込むのか、ここでは追求しない。
さて、一般的な301リダイレクトでは、転送元のバックリンク情報などをページAからページBへ移動させていると想像される。

ちなみにYahoo!では、302でも301と同じように、上図のようにページAのバックリンク情報をページBへ移動させるということである。
Googleの302問題
実は、ドアウェイなどのスパムなどで、複数のページAを、リダイレクトでページBに飛ばすわけだが、これを封殺するために、Googleではリンク元重視のアルゴリズムになっている。
つまり302は、メタタグRefreshやJavaScriptのrefreshと同等の扱いになるわけだ。
リダイレクト(メタタグ、JavaScript) :邪道のSEOスパム ::SEO塾
GoogleとYahoo!の302の扱いは、そのままアルゴリズムの違いだろうし、MSNでもGoogle同様の302ハイジャック問題があるということで、検索エンジンの順位付けを垣間見る思いである。
まだまだある サイト乗っ取り?
Alexaは、サイトのトップページのスナップショットを撮っているが、ここにもハイジャックの痕跡が残っている。

どれも同じサイト(スパムかつアダルト)が背景に写っていて、該当サイトが小窓の中に表示されている。
一般のブラウザでは、こうはならないので、Alexaの(および他の)ロボットを欺いているのだろう。
- Related Info for: yahoo.co.jp
- Related Info for: myspace.com
- Related Info for: imdb.com
- Related Info for: mop.com
- Related Info for: mixi.jp
- Related Info for: ebay.de
2006-05-18追記
Alexaのスナップショット乗っ取りは、解消しているようだ。
2005-12-04 12:52 AM | コメント (0) | トラックバック (3) [ 管理人編集 ]
