2005-11-10
キーワード詰め込みとキーワード出現率(密度) - ペナルティ発動の位相
Google更新のJagger 3に関して、GoogleGuyがkeyword stuffing(キーワード詰め込み)を対象に、細部でチェックしていると発言している。
キーワード詰め込み(Keyword Stuffing)
さて、キーワードの詰め込みとは、どういうものを指すのだろうか?
どこに、キーワードをたくさん書いたら、詰め込みといわれるのだろうか?
特定の場所、メタタグのdescriptionやkeywords、無関係な画像のalt属性、bodyの上の方、メニュー(ナビゲーション)、見出しや強調などの重み付けタグ…
そうではなく、ページ全体で一定数を上回るとアウトなのだろうか?
キーワード出現率(キーワード密度)
それとも、絶対数ではなく相対数で判定されるのだろうか?
時々、5%がボーダーラインだとか、まことしやかに風説が流布されている。
分かりやすく言うと、キーワードを100個書いても、ページ全体の単語数が2000語以上あるならば、セーフ?
逆に、キーワードが10個でも、単語数が150語程度ならば、アウト?
分母はどう計算するか
検索エンジン、Google、Yahoo!(YST)、MSNサーチは、すべてアメリカ産である。
英語ページでの出現率を計算する場合、分母となる単語数は、theやinなどの冠詞・前置詞も一語になるのだろうか?
それにしても、すべてスペースで区切られているから、分かりやすいのだろう。
日本語は形態素解析と言われているから、昔の「てにをは」、つまり助詞はどうなるのか?
漢字の数が多い熟語などは、アメリカ人の検索エンジンは、正しく理解できているのだろうか?
日本語辞書のでき・ふできによって、分母が変わり、また出現率も異同が出てこないだろうか?
馬鹿げた例え話
車がページで、シートクッションがキーワードと例えてみる。
セダンで、運転席・助手席・後部座席、各席1つずつで、シートクッションが5つだったらセーフ。と基準にされた場合。
座席が5つあるのだから、どこにシートクッションがあっても、5つ以内ならセーフ。という判断。(これが一般的なキーワード出現率)
このセダンで、運転席に2つ、助手席に3つ、後部座席はなし。この場合は、セーフかアウトか。
各座席で1つしかキャパがないとした場合は、運転席に2つ、助手席・後部座席はなし。これはアウト。
あるいは、人が座っている場合は、個数を問わない。
トランクにあるものは、即アウト。
色々、判定方法はある。
重み付けタグによる増幅
本当に、過度のキーワードの書き込みが問題化するとして、pタグの中の1個は1個となるが、emでは1個が1.2個になることはないだろうか?
strongが1.3個、h3が1.5個、h1が2個とか…
そこで、h1にキーワードを書いたら、順位が落ちたとか、隠しテキストが発覚してペナルティを受けたとか、これらは実は、ボーダーラインを超えたことが原因なのかもしれない。
見出しタグにキーワードを書くから、増幅されて、オーバー。
隠そうが隠すまいが、キーワードの数が多くなっているから、オーバー。
だから逆に、h1でも隠しテキストでも、ペナルティなしのサイトも、同時に存在することになる。それらは、ボーダーライン以下なのだろう。
ペナルティ発動の位相
ところで、編集人の体験上からは、ボーダーラインとして、キーワード出現率のような相対評価はないように思う。
つまり、1ページに3桁ほどのキーワードを詰め込んだ時、最初上がって、徐々に落ちたケースがある。
ここで、キーワード以外のテキストを追加しても改善はしなかった。
逆に、キーワードを減らしたり、強調や見出しなどのタグを除去していって、順位が上がりはじめた。
ということで、この場合のスパムのペナルティは、相対評価ではなく絶対評価であると判断している。つまりキーワード書き込みの絶対数、および重み付け増幅、これこそがボーダーラインとなっているのではなかろうか。
よって、キーワード出現率は対象外、キーワード詰め込みが、ペナルティ発動の位相となると想定するべきだろう。
なお、「重み付け増幅」は、かなり微妙な要素だが、今回はここまでにしておく。
2005-11-10 07:59 AM | コメント (0) | トラックバック (0) [ 管理人編集 ]
