(新)タイトルいつ決めるのさ

何かの参考にして頂ければ幸いです。

結局 はてなブログ のサイトマップはどれを登録すればいいのか ~ 2020年11月時点の情報をまとめてみた ~

ブログの状況把握のために Google Serarch Console を利用している方は多いと思いますが、どうも はてなブログ との相性が悪いのか、投稿した記事がなかなか Google Serarch Console に認識されず検索結果に載ってこないという事が以前からちょくちょく起こるようです。

9月くらいからまたうちのサイトで はてなブログサイトマップがうまく認識されなくなっているようで、新しく書いた記事はとりあえず手動で Google Serarch Console にインデックス登録のリクエストを出すようにしていました。ところが、10月中旬以降 Google Serarch Console 自体も改修中になっているらしく、新しく記事を書いて能動的にインデックスの登録をしようとしても「現在、インデックス登録の受付は停止しています」というメッセージが表示されて登録出来ない状態になっています。

改修が終われば再び使えるようになるそうですし、検索BOT の巡回はしているようなので放っておいてもいつかは検索エンジンに登録されるはずなのですが、最近書いた記事がいつまで経っても登録されないままという状態を少しでもどうにかしたいということで解決の方法を探ってみました。


Google Serarch Console に認識させて検索クローラーの巡回を促すためには「サイトマップ」と呼ばれるブログサイトの案内地図のようなものの登録が必要なのですが、はてなブログ の方でも色々改善を図ろうとしているのか、時々この「サイトマップ」の構造に変化があるようです。

直近では 4月頃に大きな変更があったようで、「sitemap_index.xml」の内部構造がガラッと変わりました。以前は「sitemap_index.xml」の中身は「sitemap.xml?page=1」「sitemap.xml?page=2」・・・というような構成になっており、それぞれのページ毎に 100件の URL が格納されてページが一杯になったら新しいページが追加されていくという形になっていましたが、2020年11月時点では下の図のような構成に変わっています。

サイトマップ構造

はてなブログ には今現在「sitemap_index.xml」と「sitemap.xml」という 2つのサイトマップが存在しているのですが、以前に「ツクモガタリ」様が はてなブログ の運営に問い合わせをなさったところ、「sitemap.xml」の方は過去に はてなブログサイトマップとして提供していた名残で互換性確保のために残してあるとのことで、今現在は「sitemap_index.xml」の方が はてなブログ の正式なサイトマップとなっているのだそうです。

今回の私は「sitemap.xml」と「rss」「feed」を登録した状態だったのですが、rss と feed の方は更新日か止まってしまっており、「sitemap.xml」の方は「取得出来ません」というエラーになって冒頭のようにサイトマップの更新が出来ていない状態になっていました。そこで「sitemap_index.xml」を改めて登録してみたところ、数日してまた記事がインデックス登録されるようになってくれたようです。また、「sitemap.xml」の方は 9月頃から中身の追加もされなくなっていたのですが、「sitemap_index.xml」を登録してからどういうわけかそちらの方も正常に記事が追加されるようになりました。

さて、先ほど「sitemap_index.xml」が はてなブログ の正式なサイトマップになっているようだと書きましたが、別に「sitemap.xml」の方も両方登録してたらなにがしかのデメリットがあるのかというとそういうわけでも無いようで、今は双方それぞれ Google Serarch Console で取得されています。最終読み込み日時と検出されたURL の数にも差があったりするので、このまま rss と feed も併せて 4つ登録しておくことにしました。


ついでなので実際に今現在のサイトマップがどのように書かれているのか、うちのサイトを例に具体例として載せておきます。それぞれ URL と最終更新日が記述されています。

・「sitemap_index.xml」・・・メインのサイトマップ


<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <sitemap>
  <loc>https://chateau-vulpes.com/sitemap_common.xml</loc>
  <lastmod>2020-11-05T19:26:46+09:00</lastmod>
 </sitemap>
 <sitemap>
  <loc>https://chateau-vulpes.com/sitemap_periodical.xml?year=2020&month=11</loc>
  <lastmod>2020-11-05T00:17:41+09:00</lastmod>
 </sitemap>
 <sitemap>
  <loc>https://chateau-vulpes.com/sitemap_periodical.xml?year=2020&month=10</loc>
  <lastmod>2020-11-03T15:31:04+09:00</lastmod>
 </sitemap>
                  ・
                  ・
                  ・
 <sitemap>
  <loc>https://chateau-vulpes.com/sitemap_periodical.xml?year=2013&month=7</loc>
  <lastmod>2020-08-07T15:46:42+09:00</lastmod>
 </sitemap>
 <sitemap>
  <loc>https://chateau-vulpes.com/sitemap_page.xml</loc>
  <lastmod>2020-11-05T19:26:46+09:00</lastmod>
 </sitemap>
</sitemapindex>

・「sitemap_common.xml」・・・トップページとaboutページのみ


<urlset>
<url>
<loc>https://chateau-vulpes.com/</loc>
<lastmod>2020-10-30T02:41:41+09:00</lastmod>
</url>
<url>
<loc>https://chateau-vulpes.com/about</loc>
<lastmod>2020-10-30T02:41:41+09:00</lastmod>
</url>
</urlset>

・「sitemap_periodical.xml?year=2020&month=11」・・・2020年11月分のサイトマップ


<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://chateau-vulpes.com/entry/SGDMY040UBKYY</loc>
<lastmod>2020-11-05T00:17:41+09:00</lastmod>
</url>
<url>
<loc>https://chateau-vulpes.com/entry/Wi-Fi%E4%B8%AD%E7%B6%99</loc>
<lastmod>2020-11-02T22:45:25+09:00</lastmod>
</url>
</urlset>

・「sitemap_page.xml」・・・はてなブログPro版専用の固定ページサイトマップ


<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://chateau-vulpes.com/serch_result</loc>
<lastmod>2020-09-14T16:05:32+09:00</lastmod>
</url>
<url>
<loc>https://chateau-vulpes.com/privacy_policy</loc>
<lastmod>2020-08-18T19:32:47+09:00</lastmod>
</url>
<url>
<loc>https://chateau-vulpes.com/contact_form</loc>
<lastmod>2020-06-15T23:03:30+09:00</lastmod>
</url>
</urlset>

のようになっています。