www有り無し、index.html有り無し、CMSなどのURL正規化を
SEO以前の問題のひとつが、wwwの有りと無しの両方でインデックスされるという不都合である。
もうひとつは、Yahoo!やBingなどで、検索結果にindex.htmlが付くときのトラブルである。
wwwの有り無し、index.htmlの付く付かない、これはすべて違うURLとして扱われ、バックリンクなどのSEOスコアが正しく評価されていないことになる。つまり順位がダウンするのである。
これは、世界中で随時、蒸し返されている問題でもある。
www有り無し、index.html有り無しの具体例
下記URLは、すべて同じページ(コンテンツ)を表示する。
- http://www.hyperposition.com/
- http://www.hyperposition.com/index.html
- http://hyperposition.com/
- http://hyperposition.com/index.html
- http://www.hyperposition.com
- http://hyperposition.com
そして、たとえばGoogleのSERP(検索結果画面)に出てくるのは、
http://www.hyperposition.com/
もしくは
www.hyperposition.com/
だけである。
同じページ(コンテンツ)が、複数のURLで表示されることは、数多くの問題を抱え、そしてさまざまなトラブルが生じる。
では、これを防止し、リカバリーするのは、誰が負うべきなのか?
www有りと無しの問題解決
メインサイトや、他の管理サイトをブラウザーで表示して、PageRankとバックリンクを確認(特にYahoo!やBingで)してみて欲しい。
ドメインの名称
| (A) | (B) | (C) |
|---|---|---|
| www | hyperposition | com |
- (A):サード・レベル・ドメイン
- (B):セカンド・レベル・ドメイン
- (C):トップ・レベル・ドメイン
と呼ばれているらしい。
また、(A)は、プリフェックス(接頭辞)とも呼ばれ、管理人のVPSのドメイン設定では、これを付けないこともできるようになっている。
なお、基本的には、(A)(B)(C)の3セットが標準となる。
場合によっては、www有りと無しとで、違うサイトとして検索エンジンには認識されている。
htaccessによる改善
もし、レンタルサーバーなどでhtaccessが使用可能であるならば、下記のように記述してアップロードすると、どちらかに統一することができる。
なお、コピーアンドペーストすると、「\」は「\」になるかもしれないが、かまわない。
wwwありに統一
RewriteEngine on
RewriteCond %{HTTP_HOST} ^example\.com
RewriteRule (.*) http://www.example.com/$1 [R=301,L]
wwwなしに統一
RewriteEngine on
RewriteCond %{HTTP_HOST} ^www\.example\.com
RewriteRule (.*) http://example.com/$1 [R=301,L]
index.html付きの問題解決
まず、ホームページビルダーやDreamweaverなどで、サイトの内部リンクをすべて、index.html無しに替えていく。
外部リンクも、自分が管理できる範囲のすべてで、index.html無しにする。
htaccessによる改善
もし、レンタルサーバーなどでhtaccessが使用可能であるならば、下記のように記述してアップロードすると、常にindex.html無しでアクセスされるようになる。
Options FollowSymLinks
RewriteEngine on
RewriteCond %{THE_REQUEST} ^.*/index.html
RewriteRule ^(.*)index.html$ http://www.example.com/$1 [R=301,L]
メタタグでURL正規化
http://www.hyperposition.com/index.html のページ(トップページ)のhead要素に、次のように記述する。
<link rel="canonical" href="http://www.hyperposition.com/" />
「rel="canonical"」で検索して情報収集してみよう。
参照:rel="canonical"属性について - ウェブマスター ツール ヘルプ
ホームページの内部リンクでは、相対URL(パス)ではなく絶対URLを
たとえば、Dreamweaverやホームページビルダーなどを使って、このページからトップページへリンクを張ると
<a href="../index.html">トップページ</a>
となる。これを、「index.html」を抜いて内部リンクを設定する。
<a href="../">トップページ</a>
そして、ツールでの確認に大きく支障をきたすが、下記のように
<a href="www.hyperposition.com/">トップページ</a>
書き替えるのである。
Movable TypeやWordPressなどのブログツールでは、エントリーがどの階層にも出てくるので、絶対URLで記述する習慣があるだろう。
しかし、ホームページ作成ツールは逆に、相対パスで自動的にコーディングされてしまう。
サイトオーナーの作法として、絶対URLに統一するようにしよう。
「Webマスター向けTips | Bingナビ」から
Vol.8 リンクを役立つものにする
検索エンジンは、ページランクをURLに付けます。
Bingが「ページランク」とは、驚きだが、このページ冒頭の「www有り無し、index.html有り無しの具体例」のような例を挙げて、
しかし、それぞれのURLの記述形式が異なるため、検索エンジンは各URLを別々のページとして認識してしまいます。その結果、本来一つのページに集まるべきリンクジュースが各URLに分散されてしまい、サイト全体のリンクジュースを薄めることになります。正規化という概念は、ホームページに使用する正規のURL形式を一つ指定し、そのことを検索エンジンに伝える手段です。
まるでSEO業者のような解説である。
Vol.8 リンクを役立つものにする
正規化されたURLのリンク評価をより一層高めるために、内部リンクに絶対URLを使うようにしましょう。
href属性値に短い相対ディレクトリ(<a href="/media/contactus.htm">Contact us</a>)を記述するのではなく、リンク先ページの完全なURL(<a href="http://www.mysite.com/media/contactus.htm">Contact us</a>)を記述してください。
これが、検索エンジンのトレンドである。
CMSなどのメガサイトではパラメータに注意
同一コンテンツが、複数URLで表示されることは、ミラーリングや複製コンテンツなどと、いろいろ呼ばれているが、基本的にはスパムである。
また、検索エンジンの負担もある。
ユーザーも、アドレス欄を見て戸惑うかもしれない。
自分だけの、やりたい・やれる都合で、ユーザーや検索エンジンを翻弄しないこと。
なお、メガサイトなどがCMSで運営している場合、システム担当がURL正規化を軽く見ていると、検索エンジンから相手にされなくなることは間違いない。
URL正規化は、Web製作業者の試金石
たとえば「キーワード出現率」がSEO業者の踏み絵なら、この「URL正規化」はWeb製作業者の試金石である。
「キーワード出現率」を語るSEO業者や、「URL正規化」を知らないWeb製作業者には、要注意である。大きなトラブルに苛まれる可能性がある。
参照
連動連載
MarkeZine(マーケジン)にて2年ほど前に連載。
サイト内検索(by Googleカスタム検索)







