こんにちは、tikoです。
ネット上にメディアを形成するうえで欠かせない、「クロール」と「インデックス」について、JOJO風にわかりやすくご説明します。
あなたがいつも何気なく利用している検索エンジン。
「受け取る側」から、「発信する側」に回りたいのであれば、これを理解することは吸血鬼と戦うために、波紋法が必須なのと同様に「必須」です。
検索エンジンって何?普段どんな活動をしているの?
そんな超入門的な疑問は、この記事を読めば解決できるように書きました。
それではいきますね。
Contents
何故、グーグルの検索エンジンを理解する必要があるのか?
検索エンジンの理解は波紋法と同様に必須・・・と言いましたが、ここでいう「検索エンジン」とは、一般的な意味でもGoogle検索のこと。
それは何故なのか、説明していきますね。
ネットでの調べものは、検索が第一
あなたは普段、ネットで調べ物をするときにどんな手順をとるでしょうか。
おそらく、すぐに挙がるのは「検索」だと思います。
画像検索や動画検索など色々あるかと思いますが、知りたいことをキーワードにして、打ち込んだり、音声で入力したりして調べているでしょう。
もしかすると、あなたがこのブログにたどり着いたのも、検索からかも知れません。
それを実現しているのが、「検索エンジン」というプログラムなのです。
圧倒的シェアを誇るgoogle検索エンジン
ひとくちに検索エンジンといっても、Google、Yahoo、Bing、Gooなど、いくつかの種類があるかと思います。
なかでも、日本国内で数多くの利用率があると言われているのが、GoogleとYahooの二つです。
日本のネットユーザはおよそ9割が、この二つの検索エンジンを利用して調べ物をしています。
しかも!5年ほど前からYahooはGoogleの検索エンジンを採用しており、中身はほぼGoogle検索と同じなのです。(検索結果にYahooの提供サービスを優先的に表示させているなどの違いはありますが・・)
つまり、ユーザは90%以上の割合で、Google検索を利用しているわけです。
今や支配的シェアを誇るgoogle検索エンジンの動きを知ることは、あなたが情報発信を行っていく上で欠かせない、基本中の基本なのです。
これが、情報発信を行う上でネットを使うのであれば、検索エンジンの理解は必須、と冒頭で述べている理由です。
google検索は、どうやってあなたのサイトを検索結果一覧に表示しているのか?
さてさて、検索エンジンの実際の動きに入っていきます。
プログラムって、電子データ上のものでなかなかイメージしにくいですよね。
JOJO好きのあなたのために、例えを用いながらわかりやすく説明したいと思います。
検索エンジンは、ズバリ「重ちー」のような存在です。
引用元:ジョジョの奇妙な冒険第4部 「『重ちー』の収穫 その②」
言っている意味がワカらない・・と思われたあなた、オラオラはまだ早いですよ。
どういうことか説明する時間を頂けますかな。
クロール・・・検索エンジンがあなたのサイトを見つける流れ
検索エンジンは「クロール」という作業を通じて、ウェブ上のサイトの情報を収集しています。
この作業を行うのが、「クローラー」というプログラムです。正式にはGooglebotと呼ばれています。
はい、何のことやらわかりませんね。
そこで先ほどの話に戻ります。
重ちーのスタンドといえば・・・「ハーヴェスト」ですね。
引用元:ジョジョの奇妙な冒険第4部 「『重ちー』の収穫 その②」
※ゴミの中から情報を集めてくるわけではありません(笑)
軍隊型のスタンドで、散らばっているものを収集することが得意です。
「クローラー」とは、この「ハーヴェスト」に非常に似た存在であるといえます。
重ちー(検索エンジン)の手足となって、情報を収集してくるのが、このハーヴェスト(区ローラー)というわけです。
新規ページや、既存のページの更新の情報を集めて、検索エンジンに持って帰ってくるという作業(クロール)を、大人数で毎日24時間休まず行っています。
インデックス・・・検索エンジンがあなたのサイトをリンクデータとして蓄積する流れ
クロールされたページは、それだけでは検索結果に表示されません。
集められた情報は、検索エンジンのデータベースにいったん、貯めこまれます。
この作業を「インデックス」と言います。
「ページを更新したら、2時間でインデックスされた」のように使ったりしますね。
先ほどの例えで行くと、ハーヴェストが収集してきたものを、重ちーに囲い込まれたような状態ですね。
引用元:ジョジョの奇妙な冒険第4部 「『重ちー』の収穫 その①」
「クロール」と「インデックス」によってあなたのサイトは検索エンジンに認識されるようになる
このクロールとインデックス、ほぼセットで使われており、情報発信をする上ではこの「インデックスされる」という状態に持っていくことが第一です。
まずはクローラーに「ミツケタゾ!」してもらわなければ、話は始まらないということですね。
まとめ
最後におさらいしますと、
クロール・・・クローラーがあなたのサイトの情報を収集すること。
インデックス・・・クロールにより持ち帰った情報を、リンク先としてデータベースにまとめること。
ということですね。
ウェブ上では今日も、ハーヴェストのようなクローラーがちょこまかと走り回り、情報を集めているのです。
あなたの理解の助けになれば幸いです。
以上、検索エンジンを理解するうえで欠かせない、「クロール」と「インデックス」についての解説でした。