重複URLに張られたリンクの価値はオリジナルのURLに引き継がれるのか

今日のエントリはおなじみのGoogleのMatt Cutts(マット・カッツ)氏によるウェブマスター向けQ&Aビデオです。

質問は次のとおりです。

”外部リンクが重複したURLに張られていたとして、rel=”canonical”タグを使った場合リンクのパワーはオリジナルのURLに渡されるのか、それとも失われてしまうのか?”

理想的なのは、重複URLが発生しないようなサイト構成にすることだね。
それができないなら、重複するURLを301リダイレクトして代表のURLにまとめるのが最善の方法だ。
サイト構成の見直しも301もできないなら、そのときはrel=”canonical”を使うといい。
通常は、Googleは重複したページをまとめてくれるし、重複ページごとに張られたバックリンクも正規化したURLにまとめるようにしている。

でもサイト構成や301で対応できるならそうしたほうがいい。
正規化の処理をサーチエンジンに任せない方が確実だ。
僕たちは重複ページに張られたリンクをオリジナルのURLに統合するように努力はしているし上手に処理しているけれど、100%完璧というわけじゃないんだ。

早い段階で処理するためにもサイト構成を整えることや301リダイレクトを勧めるよ。

まずいちばん重要なのは重複URLが発生しないようにサイトを構成することです。
CMSを使っていると重複URLが発生しやすいですね。
たとえばページネーション(Pagenation)で複数ページに記事を分割しているとき、2ページ目に行ってから1ページ目に戻るとURLの末尾に“?p=1”のようなパラメータが付いてしまい1ページ目に対してもう1つのURLができてしまうというのはありがちなパターンです。

サイトの構成だけでは重複URLの発生を防げないときは、301リダイレクトでオリジナルのURLに転送し正規化します。

わかりやすい例で言ったら、wwwあり・なしの統一やindex.htmlあり・なしの統一ですね。
サイトの立ち上げと同時に301リダイレクトを設定しておくといいでしょう。
※Googleに関して言えばあり・なしの正規化は何もしなくてもほぼ自動的に対応してくれていますが、やっておいたほうが安心です。

サイト構成でも301でも対応できないときは、rel=”canonical”タグの出番です。

アクセス解析のためにトラッキング用のパラメータを付けているときなどは、リダイレクトできませんね(リダイレクトしたらパラメータが外れてしまいトラッキングにならない)。
ましてやサイトの構成でどうにかなるものでもありません。

こんなときは rel=”canonical”が役に立ちます。

僕はRSS、Twitter、メルマガでのURLを紹介する際にGoogle Analyticsでのトラッキングコードを付けて計測しています。
オリジナルのURLとあわせて最低でも1記事に対して4つのURLができあがります。
しかしrel=”canonical”のおかげで重複URLは発生してません。
正規化したURLにまとめられています。
公開直後はパラメータの付いたURLがインデックスされていることもあるのですが、しばらくすると修正されます。

Matt Cutts氏は完璧ではないと注意していますが、Googleに限って言えばrel=”canonical”タグは上手に働いているように思います(Yahoo!とBingは怪しいですけど)。

海外では重複URLに関するトピックがしばしば挙がるのですが、日本ではあまり見かけません。
これは重複URLの問題もさることながら、存在そのものを知らないサイト管理者が多いからではないかと推測しています。

重複URLが多いサイトは、クローラの訪問頻度も落ちることがありえるし同じようなページが多いサイトとして評価が下がるかもしれないというようなことをMatt Cutts氏は先日受けたインタビューの中で言っているので気を付けた方がいいでしょう。

重複コンテンツについてはこちらのエントリに概要をまとめてあります。
「重複コンテンツ・重複URL」のおさらい

SEOモードさんが最近投稿したこちらの記事も役立ちます。
重複コンテンツの問題を考える際の3つの観点