2006-05-22
Big Daddy症候群 - [追記] URL正規化あるいはwww有り無し問題
短期集中エントリー:GoogleのBig Daddy問題を研究する
今回は追記。
Bigdaddyの課題の一つがクリアされている件について。
URL正規化(url canonicalization)再録
Big Daddy症候群 - 新型データセンター導入の経緯と背景には、Googleのデータセンター入れ替えの理由の一つとして、次のように記述している。
URL正規化
url canonicalization(カノニカライゼイション)
- http://www.hyperposition.com/
- http://www.hyperposition.com
- http://hyperposition.com/
- http://hyperposition.com
- http://www.hyperposition.com/index.html
- http://hyperposition.com/index.html
当SEO塾サイトを例に取ると、上記の6通りのURIに対しどれも同じページを表示するが、これはサーバやブラウザによってURLが正規化されたりして、どれも同一のものと認識されているからである。
ところが、Googleは時として違うものとして認識し、バックリンク情報などが分散して、順位付けに不利益が生じている。
またもっと大きな問題は二つあり、上記の同一ページ表示がリダイレクトを絡めて実現している場合は、リダイレクト嫌いのGoogleが少しおかしい処理をするケースが出てくる。
もう一つは、詳細は省くが、URI乗っ取りというスパムの温床ともなっている。
さらには、wwwありとwwwなしの両方でインデックス - SEO以前の問題には、次のように。
wwwありとなしでは、違うサイトと認識される
論より証拠。
それぞれをブラウザで表示して、PageRankとバックリンクを確認してみて欲しい。
wwwありの方はPageRankは5で、バックリンクもあるが、wwwなしの方は、PageRankが表示されず、バックリンクもない。
つまり、wwwありとなしと、違うサイトとして検索エンジンには認識されるということである。
Bigdaddyの成果
2006-05-22現在、Googleではwww有り無し問題は解決されているのかもしれない。
1-1と2-1では、同じバックリンク数を表示している。
また、1と2はともにPageRank5である。
このことから、Googleではwww有り無しは同一のものとして、つまり正規化してインデックスしていると言えそうである。
ただし、依然としてYahoo!では、www有り無しは別物として扱われていることに注意しなければならない。
2006-05-22 04:02 PM | コメント (2) | トラックバック (0) [ 管理人編集 ]
