同一のページ(または同一のコンテンツ)に、複数のURLでアクセスできる場合があります。 それらは「重複コンテンツ」と呼ばれ、 そのまま放置していると、以下のような問題が起こる可能性があります。

(1) 検索サイトに、望ましくない方のURLが登録されてしまう
(2) 他サイトからのリンクが分散してしまう

今回は、
上記の問題が起こる場合の例
なぜ上記の問題が起こると困るのか? の理由
簡単に解決できる方法(rel="canonical"を使う方法)
をご紹介いたします。

同一ページに複数のURLでアクセスできる例:

同一のページに複数のURLでアクセスできる場合とは、 例えば、以下のような場合です。

●サーバの設定上、そうなっている場合:
http://example.com/
http://www.example.com/
http://www.example.com/index.htm
→ サブドメイン名の「www」があってもなくても表示可能だったり、ファイル名の「index.htm」を省略しても表示可能だったりする場合です。

●ページを生成するシステムの都合上、そうなっている場合:
http://www.example.com/page?id=123
http://www.example.com/page?id=123&category=456
http://www.example.com/page?id=123&session=KFYEPCGAT
→ ページを表示するには「id=123」だけで十分であっても、表示させるナビゲーションを選択したり、閲覧者を識別する目的などで余分なパラメータが付加される場合です。

●アクセス解析用の文字列が付加されている場合:
http://www.example.com/123.html
http://www.example.com/123.html?from=MailMag20090908
→ どこからアクセスされたのかを知るために、アクセス解析用の文字列を付加した場合です。

All Aboutでも、メールマガジンに掲載されているURLには、上記のようなアクセス解析用の文字列が付加されています。 そのため、同じページに複数のURLでアクセスできます。例えば、
http://allabout.co.jp/~/closeup/CU20090602A/
というURLに対して、
http://allabout.co.jp/~/closeup/CU20090602A/?NLV=NL000258-262
http://allabout.co.jp/~/closeup/CU20090602A/?NLV=NL000258-261
などのURLがあります。末尾の「?NLV=NL000258-261」の部分がアクセス解析用に付加された文字列です。

同一コンテンツに複数のURLでアクセスできる場合:

「同じページ」ではないものの、「同じコンテンツ」が複数のページで表示される場合もあります。 例えば、以下のような場合です。

●ある特定のコンテンツについて、
(1) パソコンでの閲覧用 → http://www.example.com/123.html
(2) 携帯端末での閲覧用 → http://m.example.com/123.html
(3) パソコンでの印刷用 → http://www.example.com/print/123.html
……がある場合。

上記の3ページの場合は、コンテンツの周囲に配置される「広告の有無」や「ナビゲーションの種類」が異なるだけで、「主な内容(コンテンツ)」は同じです。
All Aboutでも、「PC用ブラウザでの閲覧用ページ」のほかに、「携帯端末版ページ」や、「印刷用ページ」が用意されているコンテンツがあります。

閲覧用と印刷用ページの例
▲PCでの閲覧用ページ(左)と、印刷用ページ(右)の例

重複コンテンツがあると困る理由は……

これらのように、「同一のコンテンツに複数のURLでアクセスできる」場合、以下のような問題があります。

(1) 検索エンジン側が、登録するのに望ましいページを判断できない
(2) 他サイトからのリンクが分散してしまう

■検索エンジン側が、登録するのに望ましいページを判断できない

検索エンジンは、同一のコンテンツがあることを発見した場合には、どれか1つだけを登録しようとします。 その理由は、検索結果に同じ内容ばかりが列挙されてしまうのを防ぐためです。

「http://allabout.co.jp/」と「http://allabout.co.jp/index.htm」のような分かりやすい例ならともかく、 複数のパラメータが使われたURLや、サブドメインが異なる場合など、どのURLを登録に採用すべきか判断できないことがあります。 そのとき、場合によっては、サイト製作者が望んでいない方のURLが選択されてしまうこともあります。

例えば、「ブラウザ閲覧用」と「印刷用」の2バージョンを用意している場合、検索結果に表示されて欲しいのは(=検索エンジンに登録して欲しいのは)「ブラウザ閲覧用」のはずです。 「印刷用」が登録されてしまうと、広告やナビゲーションなどのないページに閲覧者を直接迎えてしまうことになりますから。
しかし、検索エンジン側がそのような事情まで考慮はできないでしょうから、「印刷用」が登録されてしまうかも知れません。

■他サイトからのリンクが分散してしまう

また、他サイトからのリンクが、複数のURLに分散してしまう問題もあります。
検索サイトは、検索結果の表示順を決定する要素の一つとして、「リンクされている数の多さ」を参考にします。 (「たくさんリンクされているページは、それだけ重要なことが書かれているのだろう」と判断します。)

同一のコンテンツに複数のURLでアクセスできてしまうと、リンクに使用されるURLが1つではなくなる(=分散されてしまう)可能性があります。 リンクが分散されてしまうと、「リンクされることによって得られる評価値」も、URLの数だけ分散してしまうことになります。
そのため、検索エンジン対策(SEO)としては少々不利です。

解決策

上記の問題を、簡単に解決できる方法が、検索サイト各社共通の仕様として用意されています。
それが、link要素を使って「rel="canonical"」という記述をHTMLに含めておく方法です。 たった1行の記述で、「どのURLを登録して欲しいのか」を検索エンジンに伝えることができます。

詳しくは、次のページで。