正規化

正規化とは?サイトのページURLを正規化する必要性と方法についてまとめてみた

「正規化」とは・・・そのまま直訳すると、データや表記を一定のルール(規則)に基づいて変形し、利用しやすくすること。
または、様々な表記方法が混在している状況(意味や内容は同じ)で、表記方法を統一的に定める事を指します。

非常に多くの分野で使われている言葉で、分野によって意味も大きく違っています。

で、、

今回の記事では、「URLの正規化」について解説していきます。

URLの正規化

URLの正規化とは・・・コンテンツ内容が全く同じ(又は、ほとんど同じ)なのに、複数のURLが存在する状況で、オリジナルのURLを明確にする事を指します。

これは、主に検索エンジンが対象で、検索エンジンに対して「こっちがオリジナルのURLですよ」と明示的に指定します。

コンテンツ内容が全く同じ(又は、ほとんど同じ)なのに、複数のURLが存在する状況というのは、下記に該当します。

  • 「WWWあり・なし」

    「例」
    ・http://www.viral-community.com/
    ・https://viral-community.com/

    上記のように、「www」があってもなくてもコンテンツ内容が一緒のケースです。

  • 「index.html(.php)あり・なし」

    「例」
    ・http://www.viral-community.com/index.html
    ・http://www.viral-community.com/

    上記のように、「index.html」があるか・ないかで「URL」に違いはあるけど、どちらもトップページを表すケースです。

  • 「PC用とモバイル(スマホ)用で、表示させるページ(URL)を分けている場合」
  • 「ECサイトの商品一覧ページ」

    例えば、サイト内で扱っている商品をアルファベット順で並べている「商品一覧ページ」があったとします。
    この時、別ページ(URL)に、値段別に商品を並べた「商品一覧ページ」があった場合、

    コンテンツ内容が全く一緒ではありませんが(順番が違うため)、順番が違うだけでその他の内容は一緒ですよね。
    このようなケースも、該当します。

上記に挙げているような状況下で、「オリジナルページはこちらです」と明確化する事が「URLの正規化」になります。

今回の記事では、この「URLの正規化」をおこなう理由と、その手順について順に解説していきます。

以下、目次になります。

  • 正規化をおこなう理由
  • 正規化をおこなう手順

正規化をおこなう理由

正規化をおこなう理由

上述している通り「URLの正規化」は、主に検索エンジンが対象で、検索エンジンに対して「こっちがオリジナルのURLですよ」と明示的に通知してあげます。

では、なぜこのように「オリジナルのURL」を明確化しなければならないのか・・・一番の理由は下記になります。

・被リンク等の「SEO」的に重要な要素を、一つのページ(オリジナルのURL)に統一化させるため。

※「SEO」についてはこちらで解説しています→SEO対策とは

例えば、同一コンテンツなのにページURLが二つあるケース(下記のWWWあり・なし)

・http://www.viral-community.com/
・https://viral-community.com/

この場合、上記二つのページは全く一緒のコンテンツなのに、検索エンジンからは別物として扱われ、さらに「wwwあり・なしのページ」それぞれに対しての「被リンク(SEO的に重要な要素)」も、別物として評価されます。

これは、SEO的にいえば非常に損をしている状態となります。
全く同じコンテンツなのに、検索エンジンからの評価が分散してしまったいるのですから。

検索エンジンからの評価が分散しているということは、それだけ検索順位も落ちてしまうということになります。

なので、もし「コンテンツが全く一緒のページ」が複数ある場合は、オリジナルとするページを決めて、オリジナル以外のページには、検索エンジンに対して「オリジナルのページは、”https://viral-community.com/” です(例)」と明示的に指定してあげる必要があるのです。

これが「URL」を正規化する、大きな理由の一つになります。

また、検索エンジンは「内容が同じ(又はほとんど同じ)ページ」を二つ以上、検索結果の上位に表示させることはありません。

まあ、普通に考えれば当然ですよね。

例えば、内容が全く一緒のページが、1位・2位・3位と表示されていたとします。

検索ユーザーからしたら、1位のみ必要であって、あとは不必要なページですよね。

このように、検索ユーザーを考慮したら、検索エンジンが「同じページを二つ以上表示させない」といった対応は、至極当然の事です。

検索結果 ダメな例

こういった事からも、サイトの管理者は必ず「サイト内に重複するページがある場合」は、URLの正規化をしておく必要があります。

正規化をおこなう手順

正規化をおこなう手順

当章では、具体的に「URLの正規化」をおこなう手順について解説していきます。

まず、「URLの正規化」をおこなう方法は複数存在します。
その中で、一般的かつ有効な手法を、今回は4つにまとめました(下記)

それぞれ、順に解説しています。

  • 【Googleウェブマスターツールで、使用するドメインを設定する】

    ※こちらは、事前に「Googleウェブマスターツール」にサイトを登録しておく必要があります。登録手順についてはこちらで解説しています→Google対策に必須!ウェブマスターツール(WebMasterTool)へのサイト登録と基本的な使い方

    では、手順に入っていきましょう。

    まず、「Googleウェブマスターツール」でURL正規化をしたいサイトの管理画面を開いて、画面右上にある「歯車のアイコン」を選択して、「サイトの設定」をクリックしましょう(下図参考)

    URL正規化 設定手順1

    「サイトの設定」画面(下図)が開いたら、「使用するドメイン」という項目があります。
    こちらで、「WWWあり・なし」どちらのドメインを優先的に扱うのかを指定できます。

    ※「ドメイン」に関してはこちらで解説しています→ドメインとは?2分で「ドメイン」を理解するためのまとめ記事

    下図であれば、例えば「URLをhttp://www.viral-community.comと表示」にチェックを入れれば、WWWありのドメインを優先的に扱います。

    URL正規化 設定手順2

    このように、「Googleウェブマスターツール」では、「wwwあり・なし」どちらのドメインをオリジナルとするかの指定ができます。

  • 【canonicalリンクを指定する】

    canonical リンク

    「canonical」とは、直訳すると「標準的」や「基準」と訳されます。

    上記から大体想像できますが、「canonicalリンク」を設定することで、オリジナルとなるページを(検索エンジンに対して)指定する事ができます。

    例えば、下記3つのページが存在するとします。

    ・https://viral-community.com/1.html
    ・https://viral-community.com/2.html
    ・https://viral-community.com/3.html

    この三つのページのコンテンツ内容が全く一緒だった場合で、1つ目(1.html)をオリジナルとしたい場合、

    「2.html」と「3.html」に、「canonicalリンク」を設定することで、解決することができます。

    具体的には、以下記述(例)を、<head>(ヘッダタグ)内に指定するだけです。

    「記述例」

    <link rel=”canonical” href=”https://viral-community.com/1.html”>

    これで、「1.html」をオリジナルページとして明確化する事ができます。

    ※「canonicalリンク」については、こちらも参考になります→canonical(カノニカル)とは?「link rel=”canonical”」タグの使い方をまとめてみた

  • 【301リダイレクトで、メインのページを指定する】

    301リダイレクト

    「301リダイレクト」とは、ユーザーや検索エンジンを正しいページに誘導するための仕組みになります。

    例えば、下記ページがあったとします。上がメインページで、下がそのコピーページだった場合

    ・https://viral-community.com/main.html
    ・https://viral-community.com/copy.html

    コピーページ(copy.html)へ、ユーザー(又は検索エンジン)がアクセスした時、「301リダイレクト」を設定する事で、メインのページ(main.html)へ、ユーザー(又は検索エンジン)を遷移させる事ができます。

    これは、「メインのページ(main.html)」がオリジナルページだと明確化する事にも繋がり、検索エンジンからの評価要素(被リンク等)も、オリジナルページのものとして統一化されます。

    ですが、「301リダイレクト」は(Web)サーバー側で設定できる機能なので、いくつか利用するにあたって条件があります(下記)

    これらの条件を満たしていれば、「301リダイレクト」を利用する事ができます。

    要は、「301リダイレクト」を利用するためには、「.htaccess」というファイルの設定(記述)をしなければならないので、そのためには上記の条件を満たしている必要があるという事です。

    ちなみに、レンタルサーバーを利用してサイトを運営している場合、ほとんどのレンタルサーバーで「301リダイレクト」は利用可能となっています(レンタルサーバーに関してはこちらで解説しています→レンタルサーバーを選定する際の9つの軸で、3つのおすすめサーバーを比較してみる

    具体的な「.htaccess」の設定(記述)手順に関しては、こちらで解説しています→301リダイレクトについて、必要性と設定手順をまとめてみた

  • 【Webサーバーのレスポンス(HTTPヘッダー)で canonicalリンクを指定する】

    「canonicalリンク」の利用については、上述していますが、当項目は利用手順が異なります。

    上述では、HTMLの<head>(ヘッダタグ)内に、「canonicalリンク」を指定していますが、当項目では、Webサーバー側の「HTTPヘッダー」に「canonicalリンク」を指定する手順になります。

    大きく違う点としては、「HTMLファイル」以外でも指定ができる事です(HTMLファイルに指定していないので)

    ですが、「301リダイレクト」と同様「.htaccess」ファイルに設定(記述)するので、いくつか利用するにあたって条件があります(下記)

    • 「Apache(アパッチ)」というWebサーバーを利用している
    • 「.htaccess」ファイルを、サイトを公開しているディレクトリに設定できる

    具体的に、「.htaccess」には下記のように記述してください。

    【記述例】

    ※前提として、「copy.html」のあるディレクトリに「.htaccess」を配置している必要があります。

    <FilesMatch “copy.html“>
    <IfModule mod_headers.c>
    <Header set Link “<http://●●●●.com/main.html>rel=\”canonical\”“>
    </IfModule>
    </FilesMatch>

    ※当記述例は、下記を参考にしています。
    F.Ko-Jiの「一秒後は未来」:.htaccessを使ってHTTPヘッダーにrel=”canonical”を指定する方法

以上、URLの正規化をおこなう4つの手順でした。

まとめ

今回の記事では、「URLの正規化」をおこなう理由と、その手順について順に解説してきました。

上述で、「URLの正規化」をおこなう方法を4つ挙げましたが、Googleのガイドライン上では、下記のように記載されています。

検索結果への、URLの表示をコントロールし、リンクの人気度などのプロパティを統合するには、ページの優先バージョンとして、canonical URL(使用するURL)を指定することをおすすめします。

正規化するために、robots.txtファイルを使用することはおすすめしません。

参照元:Google ウェブマスター向けガイドライン:正規化

上記から、「URLの正規化」をおこなうには、「canonicalリンク」の(HTMLのheadタグ内への)指定が、最も推奨されている事が分かります。

なので、基本的には「canonicalリンクの指定」をしておけば良いでしょう。

ただ、サイトの移転(別ドメインへの変更)を伴う場合は、「301リダイレクト」を設定するようにしましょう。

また、上記にもあるように「robots.txtファイルの使用」は推奨されていないので、注意してください(「robots.txt」についてはこちらで解説しています→robots.txtとは?「robots.txt」の書き方をまとめてみた

コメントを残す

メールアドレスが公開されることはありません。