O R E P A S O:検索サーバーを使い切ろう

本文へジャンプ
S
M
L
Search by Google
menulavel
Valid CSS!
Spreadfirefox Affiliate Button
情報ボランティアの会(八王子)
anchor
ナビゲーター編
検索サーバーを使い切ろう
水先案内人
ネットサーフィン、探し物に、インターネットの水先案内人=検索サーバ。これを使わない手はありません。
「検索サーバ」が耳慣れない人も、Yahoo、Googleと言えばわかる筈。ソフトバンクの系列会社Yahooは検索サーバとしてスタートし、その後、ショッピング、オークション、ニュース、ブログとコンテンツを追加して行き、ポータルサイトとしてその位置を確たるものしたのです。
インターネットは世界中のコンピュータがひとつのネットワーク上で繋がっています。
しかし、目の前のパソコンから、世界中のコンピュータにアクセスできると言っても、自分が探しているホームページがどこにあるか分らなければ、必要な情報を得ることはできません。
さらに、そのホームページは、日夜ならぬ秒単位で増え続けています。そんな膨大なホームページの中から必要な情報を手作業で見つけ出すのは至難の技です。
そこで、それを支援し容易にしてくれるのが検索サーバです。

検索サーバの種類
検索サーバの基本機能はホームページの情報を何らかの手段で集めてデータベースとし、利用者が何かキーワードを入力すると、その条件に合ったホームページがリストアップされるというものです。
検索サーバによって、情報の集め方、分類の仕方は多様ではあリますが、大きくは、ロボット系とディレクトリー系に分かれます。
ロボット系:一定の間隔で、世界中のホームページに自動的にアクセスしてデータを集め、インデックスを生成します。 (プログラムで自動的に動いてるので検索ロボットと呼ばれる)。

Google http://www.google.com/
goo http://www.goo.ne.jp/
MSN Live Search http://www.live.com/
などが有名。 Googleが他の会社と違うのは、ソフトウェアの会社ではなく、まず、ハードウェアの会社で、ハードとソフトの一体開発をやっているという点でしょう。 Google本社には50万台くらいのサーバがあると言われています。

ディレクトリー系:検索サーバに登録されたホームページをカテゴリーごとにディレクトリ形成して分類します。

YAHOO!Japan http://www.yahoo.co.jp/
フレッシュアイ http://www.fresheye.com/
インフォシーク http://www.infoseek.co.jp/
などが有名で、ロボット系ディレクトリー系両方の機能を持ったものもあります。
検索対象は、
○画像
○動画
○音楽などマルチメディア
○ウェブキャッシュ
○地図
○ブログ、RSSなど新しいジャンルに対応したものなどがあります。
図

検索=キーワード
検索はサーバのハードディスク(個人用パソコンのハードディスクよりはるかに高速で大容量)に情報を蓄積し、専用の検索用ソフトで検索します。
「日本」とキーワードで検索すれば、「日本」という単語を含むホームページのリストが表示されます。
表示する順序はランクの高いもの順で、そのランク付けの基準となるものは「検索サイト」ごとに違います。メタタグのキーワード、ページタイトルはもちろん、文章内容、公共性、リンクされている数など様々な要因から決定されています。
ランキングが高いほど、自分の探しているキーワードに合致している「ハズ」で、「日本」の検索例で言えば、自己紹介に「生まれは日本です」とあるページより、見出し、歴史、地理として「日本」と入っているページの方がランクが高くなります。
コツとしては、「○○とは」と入力すると○○を解説しているページをヒットしやすくなります。

複数キーワード
単一のキーワードで検索すると5,000件20,000件のホームページがヒットしてしまうことがあります。
これら全てのホームページを見ることはできないし、意味がありません。
そこで、複数のキーワードで検索する方をおすすめします。
「日本」の検索例なら「日本 面積 統計」と、キーワードを複数にします。その方が短時間で必要な情報にたどり着きます。
また、キーワードを増やしすぎてヒット数がなくなってしまったら、少しずつ減らして検索しましょう。
複数キーワードのコツしては、「- ○○」とマイナスのキーワードを追加して「○○関連」のページを除く方法です。

この瞬間も検索サーバやポータルサイトの争奪戦が行われています。もっと便利で、使いやすい検索サーバの登場にも目を向けましょう。
※参考にexciteが提供しているリアルタイムの検索キーワードを表示するページを紹介します。
http://www.excite.co.jp/search_stream/filter_off/
●参考:検索サーバー:クローラ(Crawler)がホームページを巡回した記録
200x/02/25 12:10:01
 Mozilla(compatible; Googlebot/2.1; +http://www.google.com/bot.html)
 crawl-66-249-65-175.googlebot.com
200x/02/25 14:07:58
 Mozilla(compatible; Googlebot/2.1; +http://www.google.com/bot.html)
 crawl-66-249-72-65.googlebot.com
200x/02/26 13:41:36
 msnbot/1.0 (+http://search.msn.com/msnbot.htm) msnbot.msn.com
200x/02/27 14:11:32
 Mozilla(compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)
 lj2038.inktomisearch.com
200x/02/27 14:21:37
 Mozilla(compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)
 lj2038.inktomisearch.com
←BACK | NEXT→