サイトマップファイルの中身
検索エンジン用サイトマップファイルの中身は、以下のような感じのXML形式になっています。
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url><loc>http://www.example.jp/</loc></url>
<url><loc>http://www.example.jp/info/</loc></url>
<url><loc>http://www.example.jp/diary/</loc></url>
<url><loc>http://www.example.jp/links/</loc></url>
</urlset>
上記は、必要最低限の要素を記述したサイトマップファイルです。
※詳しい仕様は、Sitemaps.orgの仕様ページなどを参照して下さい。
上記のサイトマップファイルには、このウェブサイトに合計4つのページが存在することが記述されています。 url要素(<url>~</url>)1つで「1つのウェブページ」を表現します。上記ではurl要素が4つ列挙されているので4ページです。非常に簡単な内容ですね。 このurl要素を必要なだけ列挙すれば、サイトマップファイルになります。100ページあれば100個記述し、1000ページあれば1000個記述します。
ただこれだけです。これだけのことを記述したファイルを用意することで、検索エンジンに対して、サイト内の全ページの存在を知らせることができます。 そうすることで、漏れなく全ページをクロールしてもらえるようになる(可能性がある)わけです。
各ページにはオプションの情報も含められる
上記のサイトマップファイル例では、「url要素」の中にはURL自体を記述する「loc要素」(<loc>~</loc>)しかありませんでした。 それだけでも十分サイトマップファイルとして機能しますが、オプションとして、以下のように記述することもできます。
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.jp/</loc>
<priority>0.8</priority>
<changefreq>daily</changefreq>
<lastmod>2007-08-22</lastmod>
</url>
<url>
<loc>http://www.example.jp/links/</loc>
<priority>0.5</priority>
<changefreq>monthly</changefreq>
<lastmod>2007-08-21</lastmod>
</url>
: : :
</urlset>
上記のサンプルでは、url要素中に次の4つの要素を記述しています。
- loc要素: URLを記載(先ほどのサンプルにもありました)
- priority要素: 重要度を記載(0.1~1.0の範囲で指定。1.0が最高)
- changefreq要素: 更新頻度を記載(dailyで毎日、monthlyで毎月)
- lastmod要素: 最終更新日を記載
このような情報も含めることができます。これらの情報をどれほど検索エンジンが参考にするかは分かりませんが、指定するのが面倒でなければ書いておくと良いでしょう。 (面倒ならloc要素以外の3つは省略して構いません。)
上記のサンプルでは、
- 「http://www.example.jp/」ページは、毎日更新(daily)で重要度は0.8、最終更新日は2007年8月22日
- 「http://www.example.jp/links/」ページは、毎月更新(monthly)で重要度は0.5、最終更新日は2007年8月21日
…だと記述しています。
ここでの重要度とは、「そのウェブサイト内での重要度」を相対的に表現しているだけなので、全部を1.0にしても意味がありません。 全ページの重要度を1.0にしても0.5にしても、他のウェブサイトと比較した場合のそのサイト自体の評価値に変化はありません。
このように、サイトマップファイルの内容は非常に簡単なものなので、テキストエディタを使って自力で作成することも容易です。 しかし、ページ数が多くなると手動で記述するのは大変なので、サイトマップファイルの作成サービスを利用すると良いでしょう。