2005-04-17
HITS(Hyperlink-Induced Topic Search)の疑問をリストアップ
YSTのアルゴリズム、ページの順位付けルールなどは非常に分かりにくい。
困ったことだ。
経験則からは、Google的なアプローチでは、なかなか、それらしき真理に接近することはできない。
ちなみにGoogle的アプローチとは、キーワードをどのようにページに書き込むか、どういったタグが重み付けされているか、どうやってリンクをたくさん受けるようにするか、などなどである。
Update Tim(2005-04-01)によるYSTのインデックス入れ替えによって、検索されない、順位が下落している、Yahoo! JAPANからの訪問が激減、といったWebマスターの悲鳴があちこちで聞こえている。
今一度、YSTのアルゴリズムについて整理しておくことにする。
HITS(Hyperlink-Induced Topic Search)とは
HITSとは、Hyperlink-Induced Topic Searchの略、Jon Kleinbergが考案したアルゴリズムである。
キーワード検索の時に、Webページを特徴付けるハイパーリンクが重要視されているということ。
重要なページにリンクされているページは、やはり重要であるというアルゴリズムであり、PageRankと同様である。
特徴的なのは、ハブ(Hub)とオーソリティ(Authority)というコンセプト。
あるトピックについて、関連するページへ多くリンクを発しているページは情報連絡網(ハブ)として役に立つ。
また、上記のような数多くのハブページからリンクされているページは、そのトピックの情報について権威(オーソリティ)があると認められる。
そういった考え方が基本となっている。
ハブページは優良リンク集であり、オーソリティページは優良コンテンツである。
HITSアルゴリズムは、超単純化すると、ハブページ(サイト)からリンクを受ける量によってオーソリティ度が上下し、検索結果のランキングに反映するということになる。
つまり順位付けは、ハブページからのリンクの数によって決定される。
ハブとオーソリティの疑問
さて、ハブ・アンド・オーソリティの理屈は上記のとおりだが、だからといって何一つ分かったわけではない。
- 第三のページの存在
- Webページは、必ずハブかオーソリティのどちらかになるのか?
- ハブでもない、オーソリティでもない、どちらでもないページはありか?
- ハブの定義
- どれだけリンクを発したら、ハブになるのか?
- トピックにまとまりがないと、ハブにならないのか?
- 複数のトピックのハブになることがあるのか?
- ハブとは、Yahoo! JAPANのカテゴリのような、超有名サイトだけなのか?
- オーソリティの定義
- どれだけリンクを受けたら、オーソリティになるのか?
- 同じトピックのハブからのリンクだけが、オーソリティに加算されるのか?
- 順位付けの要因
- ハブページとオーソリティページでは、どちらがランキングで上になるのか?
- ハブページ対ハブページでは、順位付けの決め手は何か?
- ハブからの1つのリンクは、オーソリティページのキーワード書き込み何個分に相当するのか?
- 第三のページがあるとすれば、そこからのリンクは何の意味もないのか?
- キーワード検索の時に、そのキーワードに関係あるリンクのみが順位に影響し、無関係なリンクは順位に貢献しないのか?
ということで、HITSとかハブ・オーソリティと言葉を並べても、YSTで、Yahoo! JAPANのページ検索で、何をすれば上位表示されるのやら…
2005-04-17 09:56 PM | コメント (0) | トラックバック (0) [ 管理人編集 ]


