search-engine

検索エンジンとは?検索エンジンの仕組みをまとめてみた

検索エンジンとは・・・インターネット上に存在する情報(Webサイト、画像、動画など)を、キーワードなどを用いて検索できるシステムの事です。

Googleや、Yahooがこの「検索エンジン」にあたります。

検索エンジン Yahoo Google

当ページを見ている方も、何か調べ物をしたい時や、困った時、GoogleやYahooで、キーワードを入力して、ネット上にある情報を検索すると思います。

例えば、「今日の天気」を知りたいと思った時は、下図のように ”今日の天気” と入力して、検索しますよね。

Google 検索画面

すると、下図のようにネット上にある「天気」に関する情報(Webページ)が検索結果として、表示されます。

Google 検索結果ページ

このように、私達ユーザーは、何かしら知りたい情報を「キーワード」として、検索窓に入力し、検索します。
検索エンジンは「そのキーワード」に紐づく、ネット上の情報を検索結果として表示するのです。

これが、検索エンジンの最も基本的な仕組みになります。

では、どのようにしてネット上にある無限大の情報を取得しているのか・・・また、どのようにして、それらの情報を順位付けし、検索結果として表示しているのか・・・

今回の記事では、これらの具体的な仕組みについてや、検索エンジンの最大手であるGoogleが、どのような理念で検索エンジンを運営しているのか。またGoogleの理念から「サイト運営者」が心がけるべき事を、順に解説していきます。

以下、目次になります

  • 検索エンジンの仕組みについて
  • 検索エンジンの最大手「Google」の理念について

検索エンジンの仕組みについて

検索エンジン 仕組み

上述している通り、検索エンジンは、ユーザーが入力した「キーワード」に紐づく、ネット上の情報を検索結果として表示する事が、主な役目になります。

当章では、この「検索エンジン」の仕組みを、大きく3つに分けて解説していきます(以下)

  1. 【世界中のWebサイトの情報を取得するクローラーについて】

    クローラー Googlebot

    検索エンジンは、世界中のWebサイトの情報を保持し、それらの情報の中から、検索キーワードに紐付いたWebサイトを、検索結果ページに表示します。

    では、どのようにして世界中のWebサイトの情報を取得しているのか・・・

    これは、検索エンジンの「クローラー」というプログラムが、常時動いていて、世界中のWebサイトを巡り巡っています。

    そして、訪れたWebサイトの情報を取得していってるのです。

    クローラーは、Webページ間を移動する際、ページに設定してあるリンク(link)を元に、そのリンク先ページヘ移動しています。

    なので、他のページからリンクを多く受けていればいるほど、クローラーは頻繁に訪れてきます。
    逆に、他のページから全くリンクを受けていない場合は、クローラーがやってくることはありません。

    なので、Webサイトを運営していて、自分のサイトを検索エンジンに登録したい場合は、まず他のサイトからのリンクを受けている必要があります。

    でないと、クローラーが訪れる事はありません。

    サイトの運営者であれば「SEO対策」をして、検索エンジンの上位に表示させ、アクセスを集めたい方も多々いるでしょう。

    自分のサイトを「クローラー」に認識してもらう事は、その最初のステップだといえます。

    クローラーに認識してもらって、検索エンジンにサイトを登録してもらわないと、「SEO対策」をしても意味がありませんからね。

    ※「クローラー」については、こちらでも詳しく解説しています→クローラーとは?「Googlebot」にクローリングさせたい場合とさせたくない場合の対処法

    次は、クローラーがWebサイトの情報を取得した後のステップになります。

  2. 【クローラーが取得してきたWebサイトの情報を、検索エンジン本体のデータベースにインデックスする】

    検索エンジン インデックス(index)

    クローラーが取得してきたWebサイトの情報は、検索エンジンの本体であるデータベースに登録される事になります(データベースとは、Webサイトの情報が格納される場所の事です)

    このことを、「インデックス」と呼びます。

    ※「インデックス」に関しては、こちらでも詳しく解説しています→インデックス(index)とは?Googleへのインデックスを促進するための6つの方法

    なので、検索エンジンは「インデックス」された情報の中から選出して、検索結果ページヘ表示しているのです。

    検索結果ページに表示されている「ページタイトル」や「URL」、「ページの説明文」といった情報は、全て検索エンジンのデータベースにインデックスされている情報といえます(下図参考)

    検索エンジン 結果ページ インデックス情報

    ※注意点として、クローラーが取得したWebページの情報が全てインデックスされるわけではありません。
    基本的には、ほとんどがインデックスされるのですが、Webページの質が著しく低い場合(文字数が極端に少ないなど)や、他のWebページのコピーコンテンツである場合はインデックスされない可能性があります。

    サイトの管理者であれば、検索エンジンが的確に「そのページ情報」を認識できるように、ページを作成する必要があります。

    例えば、コンテンツ情報を端的に表したタイトル(title)タグの設定、コンテンツ情報の概要を説明している「メタタグのdescription」の設定、コンテンツ内容を容易にイメージできる「URL」の設定や、「見出しタグ」の利用による「コンテンツ本文の文書構造(文書の階層構造)」を明確化し、検索エンジンにとって分かりやすい「コンテンツ本文」の設定をする。

    といった事に注意する必要があります

    次は、インデックスされている情報の中から、順位付けをし、検索結果ページヘ表示するステップになります。

  3. 【インデックスされたWebサイトを、独自のアルゴリズムによって順位付けし、検索結果ページに表示する】

    Google アルゴリズム

    検索エンジンは、インデックスされているWebページ群の中から、「検索キーワード」に紐づくWebページを選出し、選出したWebページ群内で、順位付けをしてから、検索結果ページへ表示しています。

    この際「順位付け」には、検索エンジン独自のアルゴリズムによって、順位付けがされています。

    要は、検索エンジンの「アルゴリズム」とは、”検索ユーザーの「検索キーワード」に対して、数千~数万あるWebページ群を順位付けするためのプロセス(処理内容)” の事を指します。

    ※アルゴリズムについては、こちらでも解説しています→アルゴリズムとは?Googleのアルゴリズムについてまとめてみた

    例えば、Googleでは、このアルゴルズムに使用する要素を「200」以上も定義しています。

    Googleの公式サイトでは以下のように記述があります。

    今日の「Google」のアルゴリズムは、本当に探している情報を推測することを実現する「200」を超える独自のシグナル、つまり「手がかり」を利用しています。

    これらのシグナルには、ウェブサイト上の語句、コンテンツの新しさ、お住まいの地域、PageRankなどが含まれます。

    参照元ページ:Google公式サイト:アルゴリズム 検索サービス

    上記からも、Googleでは、200以上もの要素を「順位づけ」する際の要素に定義している事が分かります。

    そして、これら200以上の要素それぞれに「重み付け」をして、アルゴリズム化しているのです。

    このように検索エンジンは、「独自のアルゴリズム」を介して、順位付けをおこなった上で、(Webページ群を)検索結果ページヘ表示しているのです。

    検索エンジン 検索結果ページ

    Googleは、この「アルゴリズム」の内容について公開していませんが、アルゴルズムの内容を推測し、どのような要素が重要視されているのかを予想して、サイトのページ情報(構成)を最適化して、上位表示を目的とした作業が「SEO対策」になります。

以上です。

検索エンジンの最大手「Google」の理念

検索エンジン Google

当章では、Googleの理念の紹介と、「Googleの理念」からサイトの管理者が心がけるべき事を解説していきます。

Googleは、理念の最初の項目に「ユーザーの利便性」について挙げています(下記)

1. ユーザーに焦点を絞れば、他のものはみな後からついてくる。

 Googleは、当初からユーザーの利便性を第一に考えています。

参照元:Google理念:Googleが掲げる10の事実

さらに、Googleの共同創業者である「ラリー・ペイジ」は、自社の検索エンジンに対して下記のように述べています。

共同創設者でCEOの「ラリー・ペイジ」はこう述べたことがあります。

「完璧な検索エンジンとは、ユーザーの意図を正確に把握し、ユーザーのニーズにぴったり一致するものを返すエンジンである」

Googleの、すべてのテクノロジーに共通する目標は、ユーザーができる限り簡単に、求めている情報を見つけられ、すべき作業を完了できるようにすることです。

参照元:Google会社情報:Googleのサービス

これらの事から、Googleの検索エンジンは、「検索ユーザー」を第一に考えた運営をしている事が容易に想像できます。
 
Googleでは、検索エンジンのアルゴリズムを年に500回以上もの頻度で、更新を続けています。
平均すると、一日に1~2回のペースで、アルゴリズムが変更されているのです(更新回数についての参照元は、こちらです→海外SEO情報ブログ

なので、今この時点でも「ユーザーの利便性」を第一に考えた思想のもとに、検索エンジンは改良されているのです。

そこで、Webサイトの管理者である「コンテンツの提供側」は、Googleの思想にマッチするコンテンツ制作をするよう心がける必要があります。

特に、検索エンジン上で「上位表示」を目指すには、検索ユーザーの知りたい情報や課題を正確にイメージし、それらを他のどのページよりも、分かりやすく役に立つコンテンツとして提供することが必要になります。

なので、SEO対策で重要なのは、検索エンジンと検索ユーザー双方を意識する事です。

SEO対策では、「検索エンジン」のみがフォーカスされやすいですが、最も重要なのは「検索ユーザー」にとって価値のあるコンテンツを作成し続ける事だと認識しておきましょう。

コメントを残す

メールアドレスが公開されることはありません。