【How Search Works /検索の仕組み】Googleが構築する検索の仕組みからサイトのあるべき姿を考えてみよう!
投稿日:2018/06/19 (更新日:)
Googleが運用している「How Search Works /検索の仕組み」というサイトにGoogleの検索アルゴリズムやGoogleの検索結果やサービスに対する考え方が記載されています。
サイト運用やSEO対策を行う上で、Googleは非常に大きな存在です。
しっかりと成果や質を高めたいと考えているならば、Googleの考えを理解しておくことが必要になります。
「検索の仕組み」は知っておくべき
SEO対策やサイト運用を考えるならば、「Googleの検索の仕組み」は理解しておきたいところです。
検索の仕組みを理解したからといって、成功するとも限りませんがGoogleの検索エンジン上で評価されてサイト運用をしていくことになるので、Googleの考えやルールなどをしっかりと調べておくことは重要です。
内容として、
と項目は分けられて解説されています。
今回は、クロールとインデックス、アルゴリズムの項目を見て考察していきましょう。
クロールとインデックス
検索結果に表示されるファーストステップとして、クロールされてインデックス登録がなされなければいけません。
「クロールとインデックス」にこのような記述があるので引用して紹介します。
検索の道のりは、検索キーワードが入力される前に、数兆に及ぶページをクロールしてインデックスに登録することから始まります。
まさにその通りで、クロールされてインデックスをされることをまず考えなければいけません。
クローラーで情報を取得する
Googleはクローラーを使い、公開されているウェブページの情報をクロールして取得します。
「Googlebot」というクローラーはよく知られているでしょう。
クロールして取得したデータをGoogleのサーバーに蓄積していくことになります。
最初はサイトマップから
クローラーはリンクを辿る性質もありますが、基本的にリリースしたばかりのサイトや公開直後の状態ではリンクがないので「サイトマップ」から情報を取得します。
サイトマップに記載されているURLのリストからクロールされていきますので、サイトマップをしっかりと作成し送信することが重要です。
サイトマップを基に、
- サイトの情報
- サイトの変更点
- 無効なリンク
などを重点的に確認していきます。
クロール頻度はプログラムが決定する
クロール頻度はコンピュータが決定しているそうです。
フェッチアズグーグルなどで、クロールを促すことは可能ですが、普段のクロールする頻度はこちら側では関知できないようになっています。
クロール頻度に関して、
どのサイトをクロールし、各サイトからどのくらいの頻度で、どのくらいのページを取得するかは、コンピュータ プログラムが決定します。
Google では、サイトをクロールする頻度を上げる目的での金銭の支払いを受け付けていません。Google が目指しているのは、最適な検索結果を提供することだからです。
と記載があり、検索結果に影響するクロールを意図的に増やすことは不可能になっています。
インデックス登録して情報の整理をする
クロールされてインデックス登録がなされると、アルゴリズムに従って検索結果に反映されます。
アルゴリズムはブラックボックスになっていますが、検索キーワードの意図や目的を考えて構築、改善され続けています。
検索プロセスが複雑なことの説明として、
「犬」を検索する場合、必要なのは「犬」という単語が何百回も出現するページではありません。
おそらく求められているのは、写真や動画、または犬の種類の一覧表などでしょう。
と記載されており、キーワードの詰込みだけのページやユーザーにとって価値のないページ、目的や意図から外れているページを除外するように改善され続けています。
「アルゴリズム」検索結果を決めるシグナル
アルゴリズムについてすべてを明らかにするのは不可能ですが、どのような要素からアルゴリズムが検索の仕組みに利用されているかを知ることは重要です。
Googleの検索結果は、ユーザーが求めている情報を提供できる結果を表示することが目的です。
ユーザーが求めていない、価値がないサイトはGoogleにとっては必要がないものであるということです。
価値がないサイトも無数にあれば、価値があるサイトも少なくはありません。
それらから、Googleが価値がありユーザーが求めているサイトであると認識させることがSEOやサイト運用では必要になります。
「アルゴリズム」から引用しますが、200以上の独自のシグナルを利用し、その中には、
含まれていると記載されています。
検索の仕組みの資料
サイト内に「検索の仕組みの資料」というものがあり、ダウンロードできます。
その中の単キングに考慮される要素の例に関する記載を引用して紹介します。
- ウェブサイトのコンテンツのデータ鮮度
- 特定のサイトにリンクしているほかのウェブサイトの数とそのリンクの権限
- ウェブページ上の語句
- 検索キーワードの同義語
- スペルチェック
- サイト上のコンテンツの質
- ウェブページのURLとタイトル
- 最適な結果の種類は何か
- カスタマイズ
- そのユーザーとつながっている人がすすめている結果
あくまで、一部分になるでしょうが、コンテンツやサイトの質を多角的な視点から精査しているようです。
また、毎年500件以上の改良を加えてアルゴリズムを調整しているということです。
ですから、何かをすれば上がるなどの短絡的な考えではなくサイト自体の質や検索結果に表示された時にユーザーに求められている、役に立つサイトになっているかという部分をやはり意識していかなければならないでしょう。
Googleはユーザーに価値がある結果を提供したい
検索の仕組みとして、クロールされインデックスがされた後は、様々なアルゴリズムやデータを基に評価がされ調整されていきます。
それらは絶えず改善され続けており、より良いサイトやページをユーザーに届けることが目的で修正されます。
このことから考えても、細かいアルゴリズムやデータスコアを気にするより、まずはサイトの質を高めることが必要でしょう。
サイトの質でまずは、コンテンツです。
コンテンツに何の価値も面白みも役に立つ要素がないならば、ユーザーは二度と見ようとは思わないからです。
ユーザーに求めれれている要素、役に立つ要素を考えていけばコンテンツも、
- キーワードを詰め込んだだけ
- 文章量が多いだけ
- コンテンツ量が多いだけ
では、ダメなことがわかるでしょう。
キーワードに対して適切な回答を用意できているサイトやページになっているかをまずは前提として考えてサイトやコンテンツは製作し運用していくことが必要です。
これらがクリアできたうえで、はじめてリンクやドメイン、その他の部分を考えていかなければ、何も意味はありません。
SEO対策がなくても、ユーザーに見られた時に良いと思ってもらえるサイトこそがGoogleにもユーザーにも理想的だからです。