[ 管理人編集 ]
MSNサーチの検索順位 - RankNetアルゴリズム対策
逆襲のMicrosoft
執行役員兼MSN事業部長である塚本良江氏は、MSNは「3年計画で、まず今年中に楽天を追い越し、3年でヤフーと肩を並べる」とぶち上げている。
しかも、「インターネット検索を部分として捉え、デスクトップとWebとを総合的に検索する」とも…
- 2005-06-25に、新MSNサーチの日本語正式版が稼動、2005-07-04にはポータルMSNがリニューアルする。
- 2005-06-24には、MSN サーチ ツールバー with Windows デスクトップ サーチで、MSNサーチ検索・デスクトップ検索・IE6タブブラウザ化を実現!
MSNの目標:サーチエンジンとして
- Webページ検索
- Googleと同等、もしくはそれ以上が目標
- デスクトップ検索
- 対象は当然、自社Officeのドキュメントが中心
- 場所はさらに、自己パソコン内や、閉じた企業内ネットワーク内で
- シームレスな検索
- 場所として、Webページ、ローカルPC、企業内ネットワークなど
- インターフェイスとして、ブラウザから、Officeアプリケーションから、OSから(タスクバー、エクスプローラ)
MSNの目標:ポータルとして
- ユーザーのアクセス数で、日本国内最高を目指す
eコマースサイトのMSN対策
ほんとうに日本一になるのか、という問いはおいておくとして、資本と人材と営業力で攻勢をかけてくるわけだから、国内市場も大きな変動はあるだろう。
ユーザー層で、Yahoo! JAPANとかぶるMSNだけに、集客の面からMSN対策は必須である。逆に、MSNサーチに上位表示されなければ、相当のダメージが出てくることになる。
また、有料リスティングについては、 Overtureと2006年6月までの契約を延長しているが、adCenterで自社製を実装する方向だ。
とにかく、世界戦略では対Googleではあるが、日本国内ではYahoo! JAPANを標的にしている。
MSNの再確認
MSNサーチ
かつては、サーチエンジンとして、米Yahoo! 傘下にあるInktomiを使用。 有料リスティング (広告=スポンサーサイト) は、 これまた米Yahoo! 傘下のオーバーチュアと提携。
現在のサーチエンジンは、Microsoftの独自開発。2005-06-25に日本語正式版。
- MSNサーチ
http://search.msn.co.jp/
デザインやインターフェイスは、検索エンジンの世界標準であるGoogleに非常に近い。これがMicrosoftのやり方だ。当然、サーチエンジンとしての目標は、Googleに追いつき追い越せである。
ロボット
- msnbot/0.11 (+http://search.msn.com/msnbot.htm)
- msnbot/0.3 (+http://search.msn.com/msnbot.htm)
- msnbot/1.0 (+http://search.msn.com/msnbot.htm)
- msnbot/0.9 (+http://search.msn.com/msnbot.htm)
MSNのクローラのユーザーエージェント。
サイトの登録
Web クローラである MSNBot は、インターネット上のほとんどのページを見つけることができます。サイトが MSN サーチで表示されない場合は、アドレス (URL) を送信してください。ブログ
- msnsearch's WebLog
http://blogs.msdn.com/msnsearch/
MSNサーチのアルゴリズム
検索アルゴリズムは最新の統計学的手法を採用
スパムメール対策やGoogleに採用されていることで有名な「ベイズ理論」だが、Microsoftはこのベイズ理論の最高峰の人材を多く抱えている。
ベイズ理論の本質は、要するに、データベースの人間的な構築と抽出ということ。しかも学習して成長するらしい。
公表されているMSNサーチのアルゴリズムの柱は「VIPS」と「RankNet」であるが、どちらも視覚や脳神経などの人間の認識活動をシミュレートしようとしているところが特徴であり、また脅威である。
MSNサーチは、学習し成長する検索エンジンなのである。
VIPSアルゴリズム
「VIPS」は、「a Vision-based Page Segmentation Algorithm」の略で、Webページをブラウザで閲覧している人間の視覚をシミュレートするアルゴリズムのこと。
要点は、リンクというかハイパーテキストがWebページの大きな要因ではあるものの、それがどこに書かれているかをプログラムとして見抜き、コンテンツパーツに位置するものだけを抽出する技術である。
例えば、このページの左のサイドバーに並ぶナビゲーションは、ひと目でコンテンツとは違うと分かる。人間は、コンテンツを中心に閲覧している。
ナビゲーション、テキストやバナーの広告、トップページの下部の相互リンク、リンク集のサイト紹介ページ、などに位置するリンクは、重み付けから排除されることになるだろう。
Block-level Link Analysis
流説によると、GoogleのメインのアルゴリズムはPageRank、Yahoo!(YST)のアルゴリズムはHITS(Hyperlink-Induced Topic Search)と呼ばれているが、そのどちらもキーワード検索の関連性として、ページ単位の処理をしている。
これに対して、MicrosoftのVIPSアルゴリズムのプログラムは、「Block-level Link Analysis」と呼ばれ、ページ単位ではなく、ページの中のブロックレベルのリンク構造を解析して価値付けするということだ。
つまり、Microsoftは検索エンジンの新地平を切り開き、ページ対ページのリンク解析では不十分であり、書いてある内容によってページを複数のブロックに分け、リンク自体がどういった意味のブロックの中にあるのか解析し、リンク先の関連性を評価するというのである。
PageRankもHITSも、ページという分子レベルのアルゴリズムであるのに対して、VIPSのBlock-level Link Analysisは原子レベル、あるいは量子レベルのアルゴリズムであると。
このようなセマンティック(意味)解析をともなうアルゴリズムでは、古典的なスパムはほとんど無効となってしまいかねない。
まともに実装されて、稼動するのであれば、GoogleやYahoo!(YST)でかなり見受けられる不審な上位ページは、かなり消え去るはずだ。
RankNetアルゴリズム
ユーザーの検索はキーワードの入力によってなされるが、期待される抽出されるべきページは、どういうものであるべきか。MSNサーチは、独自の試みを開始している。
キーワードの関連性は検索ユーザーが作る?
MSNサーチは、ページのキーワード記述や、キーワードのアンカーテキストによるリンクだけでなく、実際の検索画面(SERPs)を見てクリックされるページのデータも蓄積するようだ。
さらに、MSNでいくつか検索してみると分かるが、公式サイトが上位表示される確率が非常に高くなっている。
そうではないキーワード検索においても、いずれはそうなるはずだ。
それぞれ違う複数のキーワードで検索しても、ある同一サイトをクリックする傾向をつかみ、それらのキーワードを関連付けるらしい。
よって、関連するキーワードを網羅的説明的に記述したコンテンツが上位表示される確率が高い。
よって、Googleの人気投票が被リンク数に依拠するとすれば、MSNの人気投票は、キーワード検索後のユーザーのクリック数、しかも複数のキーワードで、カウントされることになる。
この脱リンクのアルゴリズムは、スパムや過剰SEO全盛の現在において、非常に大きい意義を持っている。
MSN対策
昔のGoogle対策のように、キーワード書き込みやアンカーテキストのリンクだけでは不十分で、単独のキーワードだけでなく、関連するキーワードを複数使って、コンテンツを作り上げる必要がある。
さらには、実際のユーザーの検索活動の中で、サイトに訪問されることも大きな要因となっている。
では、キーワード検索してせっせと自サイトをクリックする、愚かなお受験SEOを発想する輩も出てくるだろうが、GoogleのAdWordsでも自作自演は見抜かれている例もあり、同一IPの短時間の多大なクリックはペナルティになるだろうと覚悟しておいた方がいい。またProxyも、最初から排除されているはずだ。
タイトルと、コンテンツパーツでの関連する複数のキーワード記述、これがMSN対策として最低限である。



