「正規化」とは・・・そのまま直訳すると、データや表記を一定のルール(規則)に基づいて変形し、利用しやすくすること。
または、様々な表記方法が混在している状況(意味や内容は同じ)で、表記方法を統一的に定める事を指します。
非常に多くの分野で使われている言葉で、分野によって意味も大きく違っています。
で、、
今回の記事では、「URLの正規化」について解説していきます。
URLの正規化とは・・・コンテンツ内容が全く同じ(又は、ほとんど同じ)なのに、複数のURLが存在する状況で、オリジナルのURLを明確にする事を指します。
これは、主に検索エンジンが対象で、検索エンジンに対して「こっちがオリジナルのURLですよ」と明示的に指定します。
コンテンツ内容が全く同じ(又は、ほとんど同じ)なのに、複数のURLが存在する状況というのは、下記に該当します。
-
「WWWあり・なし」
「例」
・http://www.viral-community.com/
・https://viral-community.com/上記のように、「www」があってもなくてもコンテンツ内容が一緒のケースです。
-
「index.html(.php)あり・なし」
「例」
・http://www.viral-community.com/index.html
・http://www.viral-community.com/上記のように、「index.html」があるか・ないかで「URL」に違いはあるけど、どちらもトップページを表すケースです。
- 「PC用とモバイル(スマホ)用で、表示させるページ(URL)を分けている場合」
-
「ECサイトの商品一覧ページ」
例えば、サイト内で扱っている商品をアルファベット順で並べている「商品一覧ページ」があったとします。
この時、別ページ(URL)に、値段別に商品を並べた「商品一覧ページ」があった場合、コンテンツ内容が全く一緒ではありませんが(順番が違うため)、順番が違うだけでその他の内容は一緒ですよね。
このようなケースも、該当します。
上記に挙げているような状況下で、「オリジナルページはこちらです」と明確化する事が「URLの正規化」になります。
今回の記事では、この「URLの正規化」をおこなう理由と、その手順について順に解説していきます。
以下、目次になります。
- 正規化をおこなう理由
- 正規化をおこなう手順
正規化をおこなう理由
上述している通り「URLの正規化」は、主に検索エンジンが対象で、検索エンジンに対して「こっちがオリジナルのURLですよ」と明示的に通知してあげます。
では、なぜこのように「オリジナルのURL」を明確化しなければならないのか・・・一番の理由は下記になります。
・被リンク等の「SEO」的に重要な要素を、一つのページ(オリジナルのURL)に統一化させるため。
※「SEO」についてはこちらで解説しています→SEO対策とは
例えば、同一コンテンツなのにページURLが二つあるケース(下記のWWWあり・なし)
・http://www.viral-community.com/
・https://viral-community.com/
この場合、上記二つのページは全く一緒のコンテンツなのに、検索エンジンからは別物として扱われ、さらに「wwwあり・なしのページ」それぞれに対しての「被リンク(SEO的に重要な要素)」も、別物として評価されます。
これは、SEO的にいえば非常に損をしている状態となります。
全く同じコンテンツなのに、検索エンジンからの評価が分散してしまったいるのですから。
検索エンジンからの評価が分散しているということは、それだけ検索順位も落ちてしまうということになります。
なので、もし「コンテンツが全く一緒のページ」が複数ある場合は、オリジナルとするページを決めて、オリジナル以外のページには、検索エンジンに対して「オリジナルのページは、”https://viral-community.com/” です(例)」と明示的に指定してあげる必要があるのです。
これが「URL」を正規化する、大きな理由の一つになります。
また、検索エンジンは「内容が同じ(又はほとんど同じ)ページ」を二つ以上、検索結果の上位に表示させることはありません。
まあ、普通に考えれば当然ですよね。
例えば、内容が全く一緒のページが、1位・2位・3位と表示されていたとします。
検索ユーザーからしたら、1位のみ必要であって、あとは不必要なページですよね。
このように、検索ユーザーを考慮したら、検索エンジンが「同じページを二つ以上表示させない」といった対応は、至極当然の事です。
こういった事からも、サイトの管理者は必ず「サイト内に重複するページがある場合」は、URLの正規化をしておく必要があります。
正規化をおこなう手順
当章では、具体的に「URLの正規化」をおこなう手順について解説していきます。
まず、「URLの正規化」をおこなう方法は複数存在します。
その中で、一般的かつ有効な手法を、今回は4つにまとめました(下記)
それぞれ、順に解説しています。
-
【Googleウェブマスターツールで、使用するドメインを設定する】
※こちらは、事前に「Googleウェブマスターツール」にサイトを登録しておく必要があります。登録手順についてはこちらで解説しています→Google対策に必須!ウェブマスターツール(WebMasterTool)へのサイト登録と基本的な使い方
では、手順に入っていきましょう。
まず、「Googleウェブマスターツール」でURL正規化をしたいサイトの管理画面を開いて、画面右上にある「歯車のアイコン」を選択して、「サイトの設定」をクリックしましょう(下図参考)
「サイトの設定」画面(下図)が開いたら、「使用するドメイン」という項目があります。
こちらで、「WWWあり・なし」どちらのドメインを優先的に扱うのかを指定できます。※「ドメイン」に関してはこちらで解説しています→ドメインとは?2分で「ドメイン」を理解するためのまとめ記事
下図であれば、例えば「URLをhttp://www.viral-community.comと表示」にチェックを入れれば、WWWありのドメインを優先的に扱います。
このように、「Googleウェブマスターツール」では、「wwwあり・なし」どちらのドメインをオリジナルとするかの指定ができます。
-
【canonicalリンクを指定する】
「canonical」とは、直訳すると「標準的」や「基準」と訳されます。
上記から大体想像できますが、「canonicalリンク」を設定することで、オリジナルとなるページを(検索エンジンに対して)指定する事ができます。
例えば、下記3つのページが存在するとします。
・https://viral-community.com/1.html
・https://viral-community.com/2.html
・https://viral-community.com/3.htmlこの三つのページのコンテンツ内容が全く一緒だった場合で、1つ目(1.html)をオリジナルとしたい場合、
「2.html」と「3.html」に、「canonicalリンク」を設定することで、解決することができます。
具体的には、以下記述(例)を、<head>(ヘッダタグ)内に指定するだけです。
「記述例」
<link rel=”canonical” href=”https://viral-community.com/1.html”>これで、「1.html」をオリジナルページとして明確化する事ができます。
※「canonicalリンク」については、こちらも参考になります→canonical(カノニカル)とは?「link rel=”canonical”」タグの使い方をまとめてみた
-
【301リダイレクトで、メインのページを指定する】
「301リダイレクト」とは、ユーザーや検索エンジンを正しいページに誘導するための仕組みになります。
例えば、下記ページがあったとします。上がメインページで、下がそのコピーページだった場合
・https://viral-community.com/main.html
・https://viral-community.com/copy.htmlコピーページ(copy.html)へ、ユーザー(又は検索エンジン)がアクセスした時、「301リダイレクト」を設定する事で、メインのページ(main.html)へ、ユーザー(又は検索エンジン)を遷移させる事ができます。
これは、「メインのページ(main.html)」がオリジナルページだと明確化する事にも繋がり、検索エンジンからの評価要素(被リンク等)も、オリジナルページのものとして統一化されます。
ですが、「301リダイレクト」は(Web)サーバー側で設定できる機能なので、いくつか利用するにあたって条件があります(下記)
- 「Apache(アパッチ)」というWebサーバーを利用している
- 「.htaccess」ファイルを、サイトを公開しているディレクトリに設定(追加)できる(.htaccessについては、こちらで解説しています→【.htaccessとは?.htaccessで、できる事と設定手順についてまとめてみた】)
- 利用しているWebサーバー(Apache)が、「Mod-Rewrite」という機能をサポートしている(必須条件ではない)
これらの条件を満たしていれば、「301リダイレクト」を利用する事ができます。
要は、「301リダイレクト」を利用するためには、「.htaccess」というファイルの設定(記述)をしなければならないので、そのためには上記の条件を満たしている必要があるという事です。
ちなみに、レンタルサーバーを利用してサイトを運営している場合、ほとんどのレンタルサーバーで「301リダイレクト」は利用可能となっています(レンタルサーバーに関してはこちらで解説しています→レンタルサーバーを選定する際の9つの軸で、3つのおすすめサーバーを比較してみる)
具体的な「.htaccess」の設定(記述)手順に関しては、こちらで解説しています→301リダイレクトについて、必要性と設定手順をまとめてみた
-
【Webサーバーのレスポンス(HTTPヘッダー)で canonicalリンクを指定する】
「canonicalリンク」の利用については、上述していますが、当項目は利用手順が異なります。
上述では、HTMLの<head>(ヘッダタグ)内に、「canonicalリンク」を指定していますが、当項目では、Webサーバー側の「HTTPヘッダー」に「canonicalリンク」を指定する手順になります。
大きく違う点としては、「HTMLファイル」以外でも指定ができる事です(HTMLファイルに指定していないので)
ですが、「301リダイレクト」と同様「.htaccess」ファイルに設定(記述)するので、いくつか利用するにあたって条件があります(下記)
- 「Apache(アパッチ)」というWebサーバーを利用している
- 「.htaccess」ファイルを、サイトを公開しているディレクトリに設定できる
具体的に、「.htaccess」には下記のように記述してください。
【記述例】
※前提として、「copy.html」のあるディレクトリに「.htaccess」を配置している必要があります。
<FilesMatch “copy.html“>
<IfModule mod_headers.c>
<Header set Link “<http://●●●●.com/main.html>rel=\”canonical\”“>
</IfModule>
</FilesMatch>※当記述例は、下記を参考にしています。
・F.Ko-Jiの「一秒後は未来」:.htaccessを使ってHTTPヘッダーにrel=”canonical”を指定する方法
以上、URLの正規化をおこなう4つの手順でした。
まとめ
今回の記事では、「URLの正規化」をおこなう理由と、その手順について順に解説してきました。
上述で、「URLの正規化」をおこなう方法を4つ挙げましたが、Googleのガイドライン上では、下記のように記載されています。
検索結果への、URLの表示をコントロールし、リンクの人気度などのプロパティを統合するには、ページの優先バージョンとして、canonical URL(使用するURL)を指定することをおすすめします。
正規化するために、robots.txtファイルを使用することはおすすめしません。
上記から、「URLの正規化」をおこなうには、「canonicalリンク」の(HTMLのheadタグ内への)指定が、最も推奨されている事が分かります。
なので、基本的には「canonicalリンクの指定」をしておけば良いでしょう。
ただ、サイトの移転(別ドメインへの変更)を伴う場合は、「301リダイレクト」を設定するようにしましょう。
また、上記にもあるように「robots.txtファイルの使用」は推奨されていないので、注意してください(「robots.txt」についてはこちらで解説しています→robots.txtとは?「robots.txt」の書き方をまとめてみた)