2005-01-04
検索の舞台裏 : MSN サーチのしくみ
最近アップされたのか、気付かなかっただけなのか、新MSNのとても重要なページを発見した。
ウェブ検索ヘルプ
実際に、現物に当たって欲しいが、ポイントだけピックアップしてみる。
検索の舞台裏 : MSN サーチのしくみ
何とも、意味深のタイトルであり、またGoogleも意識しているように思える。
Yahoo!(YST)も、結構充実したページを用意しているのだが、いかんせんYahoo! Japanは翻訳して載せてくれていないので、どうしようもない。
Yahoo! Help - Search Help
各コンポーネントの役割について
なかなか、親切に新MSNの機能を分類して解説してくれるようだ。
- MSNBot:ロボット巡回
- インデックス ジェネレータ:インデックス追加
- クエリ サーバー:キーワード検索とアルゴリズム
MSNBot
1 度に 1 リンクずつ Web をクロール
まず、MSNBotはWebページのリンクをたどってクロールすると書かれている。
また、Webページの増加と更新に対応するように書かれている。
インデックス ジェネレータ
50 億のページを整理
ページの取得システムを作成することが、インデックス ジェネレータの仕事である、と書かれている。
コンテンツをさまざまなカテゴリとキーワードに関連付けるが、その方法は、
- ページ内でのある語の使用回数
- ページ内でその語が使われている場所
- ページのタイトルにどの語が使われているか
などの要素を考慮して、ページ情報を有意な方法でカテゴリに分類するということである。
この時点で、独自の命令セットを使用して、インデックス内の各ページにランクを付ける。
ランク付けは多くの要素に左右されるが、そのうち最大の要素のいくつかは、
- サイトが書かれている言語
- サイトにリンクしている他のサイトの数
- コンテンツの質および量
一般に、
- 定期的に更新されるサイト
- コンテンツが豊富なサイト
- および他のサイトからのリンクが多いサイトは
そうでないサイトよりも高いランクが付けられる。
サイトのランクは常に変化している。
インデックスが再作成されるたびに、各サイトの現在のランクを確認し、最新のサイトおよびランク情報を使用してインデックスを再作成する。
クエリ サーバー
検索条件に最もよく当てはまる結果を表示
クエリ サーバーは、検索語句を分析し、これを各ページのランクと比較して、各ページが検索語句とどれほど関連性があるかを判断する。
新MSN対策のまとめ
詳しい新MSNのアルゴリズムは不明だが、一応、Microsoftの解説にしたがってWebサイトやページを作成するガイドラインを、再構成しておこう。
ロボットとインデックスとアルゴリズム
ロボット(MSNBot)は、リンクをたどってやってくる。つまり、どこか既に新MSNにインデックスされているページからのリンクが好ましいことになる。
また、上位表示のためには、キーワードの使用数や位置、そしてタイトルが重み付けられるようだ。
そして、コンテンツとしてのボリューム、他の同一カテゴリーサイトからのリンク数、更新頻度なども重要らしい。
Googleとの類似と相違
結局、Google対策とほとんど同じである。
ただ、SEO塾の検証では、意識的なSEOを施す場合は、Googleよりもコンテンツ性を重視する必要がある。
つまり、キーワード記述やアンカーコンテキストマッチなどでは、ポツンと孤立させたやり方では、あまり効果がない。
結局、後発であり、Microsoft独自の「Block-level Link Analysis」ということなのだろう。
追記
その後、Microsoftの検索エンジンアルゴリズムは、社内では「VIPS」と呼んでいることが分かった。
VIPS - 新MSNサーチのアルゴリズム
2005-01-04 04:11 PM | コメント (0) | トラックバック (0) [ 管理人編集 ]



