【超初心者向け】クロールとインデックスについてジョジョ風に説明します

こんにちは、tikoです。

ネット上にメディアを形成するうえで欠かせない、「クロール」と「インデックス」について、JOJO風にわかりやすくご説明します。

あなたがいつも何気なく利用している検索エンジン。

「受け取る側」から、「発信する側」に回りたいのであれば、これを理解することは吸血鬼と戦うために、波紋法が必須なのと同様に「必須」です。

検索エンジンって何?普段どんな活動をしているの?

そんな超入門的な疑問は、この記事を読めば解決できるように書きました。

それではいきますね。

何故、グーグルの検索エンジンを理解する必要があるのか?

検索エンジンの理解は波紋法と同様に必須・・・と言いましたが、ここでいう「検索エンジン」とは、一般的な意味でもGoogle検索のこと。

それは何故なのか、説明していきますね。

ネットでの調べものは、検索が第一

あなたは普段、ネットで調べ物をするときにどんな手順をとるでしょうか。

おそらく、すぐに挙がるのは「検索」だと思います。

画像検索や動画検索など色々あるかと思いますが、知りたいことをキーワードにして、打ち込んだり、音声で入力したりして調べているでしょう。

もしかすると、あなたがこのブログにたどり着いたのも、検索からかも知れません。

それを実現しているのが、「検索エンジン」というプログラムなのです。

圧倒的シェアを誇るgoogle検索エンジン

ひとくちに検索エンジンといっても、Google、Yahoo、Bing、Gooなど、いくつかの種類があるかと思います。

なかでも、日本国内で数多くの利用率があると言われているのが、GoogleYahooの二つです。

日本のネットユーザはおよそ9割が、この二つの検索エンジンを利用して調べ物をしています。

しかも!5年ほど前からYahooはGoogleの検索エンジンを採用しており、中身はほぼGoogle検索と同じなのです。(検索結果にYahooの提供サービスを優先的に表示させているなどの違いはありますが・・)

つまり、ユーザは90%以上の割合で、Google検索を利用しているわけです。

今や支配的シェアを誇るgoogle検索エンジンの動きを知ることは、あなたが情報発信を行っていく上で欠かせない、基本中の基本なのです。

これが、情報発信を行う上でネットを使うのであれば、検索エンジンの理解は必須、と冒頭で述べている理由です。

google検索は、どうやってあなたのサイトを検索結果一覧に表示しているのか?

さてさて、検索エンジンの実際の動きに入っていきます。

プログラムって、電子データ上のものでなかなかイメージしにくいですよね。

JOJO好きのあなたのために、例えを用いながらわかりやすく説明したいと思います。

検索エンジンは、ズバリ「重ちー」のような存在です。

引用元:ジョジョの奇妙な冒険第4部 「『重ちー』の収穫 その②」

言っている意味がワカらない・・と思われたあなた、オラオラはまだ早いですよ。

どういうことか説明する時間を頂けますかな。

クロール・・・検索エンジンがあなたのサイトを見つける流れ

検索エンジンは「クロール」という作業を通じて、ウェブ上のサイトの情報を収集しています。

この作業を行うのが、「クローラー」というプログラムです。正式にはGooglebotと呼ばれています。

はい、何のことやらわかりませんね。

そこで先ほどの話に戻ります。

重ちーのスタンドといえば・・・「ハーヴェスト」ですね。

引用元:ジョジョの奇妙な冒険第4部 「『重ちー』の収穫 その②」

※ゴミの中から情報を集めてくるわけではありません(笑)

軍隊型のスタンドで、散らばっているものを収集することが得意です。

「クローラー」とは、この「ハーヴェスト」に非常に似た存在であるといえます。

重ちー(検索エンジン)の手足となって、情報を収集してくるのが、このハーヴェスト(区ローラー)というわけです。

新規ページや、既存のページの更新の情報を集めて、検索エンジンに持って帰ってくるという作業(クロール)を、大人数で毎日24時間休まず行っています。

インデックス・・・検索エンジンがあなたのサイトをリンクデータとして蓄積する流れ

クロールされたページは、それだけでは検索結果に表示されません。

集められた情報は、検索エンジンのデータベースにいったん、貯めこまれます。

この作業を「インデックス」と言います。

「ページを更新したら、2時間でインデックスされた」のように使ったりしますね。

先ほどの例えで行くと、ハーヴェストが収集してきたものを、重ちーに囲い込まれたような状態ですね。

引用元:ジョジョの奇妙な冒険第4部 「『重ちー』の収穫 その①」

「クロール」と「インデックス」によってあなたのサイトは検索エンジンに認識されるようになる

このクロールとインデックス、ほぼセットで使われており、情報発信をする上ではこの「インデックスされる」という状態に持っていくことが第一です。

まずはクローラーに「ミツケタゾ!」してもらわなければ、話は始まらないということですね。

まとめ

最後におさらいしますと、

クロール・・・クローラーがあなたのサイトの情報を収集すること。

インデックス・・・クロールにより持ち帰った情報を、リンク先としてデータベースにまとめること。

ということですね。

ウェブ上では今日も、ハーヴェストのようなクローラーがちょこまかと走り回り、情報を集めているのです。

あなたの理解の助けになれば幸いです。

以上、検索エンジンを理解するうえで欠かせない、「クロール」と「インデックス」についての解説でした。

(Visited 763 times, 1 visits today)

シェアする

  • このエントリーをはてなブックマークに追加

フォローする