SEM Vol.12|Webマスター向けTips | Discover Bing

Web マスター向け Tips

Vol.12 Sitemapでウェブの宝物を発掘

海賊の宝物の地図と、Sitemapは似ていると思いませんか? あなたのウェブサイトには金銀の宝が含まれていないかもしませんが(貴金属製品の取引サイトでなれければ)、良いコンテンツはそれを探している人にとっては宝と同然です。ところが残念なことに、ウェブサイトに埋もれていると、あなた以外に、誰にもそれが分からないのです! あなたがサイトの宝物を他の人と共有したければ、何がどこに埋まっているかを知らせてあげる必要があります。検索エンジンクローラー(別名ボット)がやって来るのを待ったり、検索者がたまたまブラウズして行きつくまで待つこともできますが、それには時間がかかりますし、あなたが提供できるすべてを見つけることができないかもしれません。ですから、Sitemapを利用して、検索ボットにあなたの宝物であるコンテンツを掘り起こしてもらうのです。

ここでひとつ確認しますが、sitemapと Sitemapを混同してはいけません。それは分かりますよね? それが分からなければ、これを覚えておいてください。このようなテキストでsitemapファイルについて言うときは、小文字のsitemapを使い、ユーザーがブラウズするためのHTMLベースのファイルを意味します。一般的にサイト内の全ページのリストを含むものです。

一方、大文字のSitemapを使う場合は、検索エンジンのボットが、クローリングとインデックス化のためにサイト内の最も重要であるページとディレクトリを特定し、ウェブマスターからのデータを抽出するために使うXMLベースのファイルを意味します。両方のサイトマップのファイルは、ファイル名(たとえば sitemap.xml や sitemap.htm)ではすべて小文字を使うことができます(おそらくそうすべきでしょう)が、テキストでXMLベースのものを指すときは、読み手がどちらのサイトマップを指しているかが分かるように、大文字を用います。この記事では、検索エンジンの観点から書いていますので、sitemapではなく、Sitemapにフォーカスしています。お分かりいただけますよね。(^_^)

良いSitemapは、検索エンジンのボットに、サイト内のコンテンツについて知らせます。それによって、ボットにコンテンツが確認され、運が良ければ(コンテンツがよく出来ていて、価値があると見なされれば)、インデックス化されます。コンテンツ探しをしているユーザーは、キーワードで検索エンジンを使い、目的のコンテンツの場所を突き止めます。良いSitemapが提供されていると、ボットが見つけたコンテンツを検索エンジンによってインデックス化される場合が多く、サイトのコンテンツが検索エンジン結果ページ(SERP)に表示される可能性が高まるのです。つまり、ページがインデックス化されていなければ、SERPに表示されないということです。

構造

あなたのサイトのルートディレクトリに保存されているSitemapファイルは、ページの具体的なURL(あるいは大規模サイトの他のSitemapファイル)の場所に関するリファレンスを含みます。たいていは、最終修正日、ページ毎の一般的な変更頻度、サイト内の他のコンテンツに比較した、特定のページの優先順位を記します。

Sitemapファイルのコンテンツがどういったものであるかを示す簡単な例です。

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
     <loc>http://www.mysite.com/default.htm</loc>
     <lastmod>2009-03-01</lastmod>
     <changefreq>monthly</changefreq>
     <priority>0.8</priority>
   </url>
   <url>
     <loc>http://www.mysite.com/contacts.htm</loc>
     <changefreq>yearly</changefreq>
     <priority>0.4</priority>
   </url>
</urlset>

<urlset>タグは現在のプロトコル標準を参照します。<url>タグと<loc>タグは各ページのエントリに必要な最小限のデータ、その他のタグ、<lastmod>、<changefreq>、<priority>は、オプションで追加できるデータです。これらオプションタグにデータエントリするためのフォーマットや属性を見るにはSitemaps XML 形式を参考にしてください。ここで気をつけて欲しいのは、あなたのサイトのすべてのページがSitemapにリストされる必要はないということです。ユーザーにとって価値のあるコンテンツを含むページだけで良いのです。

ファイルフォーマット

Bingは、XMLやgzipファイルとして送信されたSitemapファイルをサポートしていますが、HTMやHTMLファイルはサポートしていません(これらはSitemapではなく、sitemapだからです。さらに、よく出来たSitemapファイルのXML コンテンツはHTM ファイルのブラウザーで正しく表示されません)。エンドユーザーのためにブラウズできるHTMLベースのsitemapを作れば、その努力には感謝してくれるでしょうが、Sitemapとしてそれを再利用することはできません。Bingへ送信するためには、上に示すようなタグ構造を使って、これとは別にXMLベースのSitemapファイルを作る必要があります。

もうサイズは問題になりません

よくある宝探しの地図なら、宝物のありかを示すXは一箇所だけでしょう。しかしSitemapでは、サイトの宝物の場所をいくつも並べることができます。これまで、SEOコミュニティの常識では「多過ぎるのはありがた迷惑だ」と考えられてきました。検索エンジンの観点から、最も効果的なSitemapのサイズは約150以下のURLだと思われていたのです。それ以上あっても「クローラーは持っていけないし、そんなに早くないんだよ!」と。

このブログに数週間前に投稿された記事 Bing enhances support for large Sitemapsによると、現在、Bingは最高5万件の参照(URLまたは他へのリンクや入れ子になったSitemapファイル)を含むSitemapファイルをサポートしています。この進展は大規模サイトのウェブマスターにとっては福音です。彼らは、各コンテンツ組織の特定エリアをマッピングした複数の入れ子のSitemapファイルを作成し、それぞれを各コンテンツエリアのベースディレクトリに保存することで、最初の(indexの)Sitemapファイル(サイトのルートディレクトリに保存されているもの)を通じて、入れ子のSitemapファイルにリンクすることができます。ひとつの index の Sitemap は5万件の入れ子のSitemap ファイルにリンクし、それぞれが最高で5万件のURLを参照します。つまり、Sitemap テクノロジを使うことで、最高で25億件のURLを参照できるのです。そして、Bingのクローラー、MSNBotはそれらをすべて読み込みます。まさに宝の山です!

Sitemapの送信

ウェブマスターがSitemapをBingに送信する方法がいくつかあります。

  • Pingサービス。ブラウザーのアドレスバーを使って、BingにSitemapを直接送信することができます。以下のようにタイプします。
    • http://www.bing.com/webmaster/ping.aspx?
    • sitemap=www.YourURL.com/sitemap.xml
    • 例に示したYourURL.comの代わりに、あなたのSitemapの完全なURLを入れます。
  • Webmaster Center ツール。BingのWebmaster Center ツールにサインインすることで Sitemapsツールが利用できます(これらの無料ツール利用の登録がまだであれば登録して、あなたのサイトを分析し、最適化に役立つツールにどのようなものがあるかを確認する良い機会です)。SitemapのURLを直接サイトマップ送信用(Direct sitemap submission)のテキストボックスにコピーし、送信(Submit)を押すだけです。
  • Robot.txt ファイルのリファレンス。robots.txtファイルを通じて検索エンジンのボットに、クロールしないファイルやディレクトリを指示したり、インデックスされるのをブロックしている場合、そのファイルに一行加えます。一般的には最終行に以下のように記します。
    • Sitemap: http://www.YourURL.com/sitemap.xml
    • 例に示したYourURL.comの代わりに、あなたのSitemapの完全なURLを入れます。

検証

あなたのSitemapをBingに送信する前に、Sitemap検証ツールであなたが書いたXMLコードをチェックすることをおすすめします。結局のところ間違った宝探しの地図なんて無意味です。気に入ったSitemap検証ツール が探せたら、ページの指示に従います。エラーが見つかったら、修正してから送信しましょう。

BingにSitemapが送信されると、私たちはそのコンテンツを読んで、あなたのサイトに埋もれているコンテンツの宝物を探し出し、私たちのインデックスに新たに追加する可能性があるものとして評価します。あなたのサイトのコンテンツがインデックスされればされるほど、あなたのサイトを通り過ぎて他の港に辿り着いていたコンテンツの宝探しの船も、あなたのサイトで立ち止まり「これはぶったまげた。こいつを見てみろよ!」と、宝の山を見て叫ぶかもしれません。 それではまた・・・

-- Rick DeJarnette, Bing Webmaster Center