(新)タイトルいつ決めるのさ

何かの参考にして頂ければ幸いです。


▼ 当ブログはアフィリエイトサービスを利用しており、リンクにはプロモーションが含まれます ▼
当ブログではアフィリエイト広告により得た収益をブログの運営・維持に充てさせて頂いております。提携しております ASP につきましては「プライバシーポリシー」よりご確認下さい。
尚、企業様より商品またはサービスの提供を受けて掲載した記事につきましては、別途「PR・プロモーション」カテゴリに分類し、記事冒頭にその旨を分かりやすく記載するよう心掛けております。
当ブログ記事の記載内容や広告の掲載方法に関するご指摘がございましたら「こちらのフォーム」よりお問い合わせ下さい。

結局 はてなブログ のサイトマップはどれを登録すればいいのか ~ 2020年11月時点の情報をまとめてみた ~

ブログの状況把握のために Google Serarch Console を利用している方は多いと思いますが、どうも はてなブログ との相性が悪いのか、投稿した記事がなかなか Google Serarch Console に認識されず検索結果に載ってこないという事が以前からちょくちょく起こっているようです。

9月辺りからまたうちのサイトで はてなブログ のサイトマップをうまく認識してくれなくなっているようなので、新しく書いた記事はとりあえず手動で Google Serarch Console にインデックス登録のリクエストを出すようにしていました。ところが、10月中旬以降 Google Serarch Console 自体が改修中となっているらしく、新しく記事を書いて能動的にインデックスの登録をしようとしても「現在、インデックス登録の受付は停止しています」というメッセージが表示されて登録出来ない状態になっています。

改修が終われば再び使えるようになるそうですし、検索BOT の巡回はしているようなので放っておいてもいつかは検索エンジンに登録されると思いますが、最近書いた記事がいつまで経っても登録されないままという状態を少しでもどうにかしたいということで解決の方法を探ってみました。



Google Serarch Console に認識させて検索クローラーの巡回を促すためには「サイトマップ」と呼ばれるブログサイトの案内地図のようなものの登録が必要らしいのですが、はてなブログ の方でも色々改善を図ろうとしているのか、時々この「サイトマップ」の構造に変化があるようです。

直近では 4月頃に大きな変更があったようで、「sitemap_index.xml」の内部構造がガラッと変わりました。以前は「sitemap_index.xml」の中身は「sitemap.xml?page=1」「sitemap.xml?page=2」・・・というような構成になっており、それぞれのページ毎に上限 100件の URL が格納され、ページが一杯になったら新しいページが追加されていくという形になっていましたが、2020年11月時点では下の図のような構成に変わっています。

サイトマップ構造

はてなブログ には今現在「sitemap_index.xml」と「sitemap.xml」という 2つのサイトマップが存在しているのですが、以前に 「ツクモガタリ」様が はてなブログ の運営に問い合わせをなさった ところ、「sitemap.xml」の方は過去に はてなブログのサイトマップとして提供していた名残で互換性確保のために残してあるとのことで、今現在は「sitemap_index.xml」の方が はてなブログ の正式なサイトマップとなっているのだそうです。

今回の私は「sitemap.xml」と「rss」「feed」を登録した状態だったのですが、rss と feed の方は日付の更新が止まってしまっており、「sitemap.xml」の方は「取得出来ません」というエラーになって冒頭のようにサイトマップの更新が出来ていない状態になっていました。

そこで「sitemap_index.xml」を改めて登録してみたところ、数日してまた記事がインデックス登録されるようになってくれたようです。また、「sitemap.xml」の方は 9月頃から中身の追加もされなくなっていたのですが、「sitemap_index.xml」を登録してからどういうわけかそちらの方も正常に記事が追加されるようになりました。

さて、先ほど「sitemap_index.xml」が はてなブログ の正式なサイトマップになっているようだと書きましたが、別に「sitemap.xml」の方も両方登録してたらなにがしかのデメリットがあるのかというとそういうわけでも無いようで、今は双方それぞれ Google Serarch Console で取得されています。最終読み込み日時と検出されたURL の数にも差があったりするので、このまま rss と feed も併せて 4つ登録しておくことにしました。


ついでなので実際に今現在のサイトマップがどのように書かれているのか、うちのサイトを例に具体例として載せておきます。それぞれ URL と最終更新日が記述されています。

・「sitemap_index.xml」・・・メインのサイトマップ


<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <sitemap>
  <loc>https://chateau-vulpes.com/sitemap_common.xml</loc>
  <lastmod>2020-11-05T19:26:46+09:00</lastmod>
 </sitemap>
 <sitemap>
  <loc>https://chateau-vulpes.com/sitemap_periodical.xml?year=2020&month=11</loc>
  <lastmod>2020-11-05T00:17:41+09:00</lastmod>
 </sitemap>
 <sitemap>
  <loc>https://chateau-vulpes.com/sitemap_periodical.xml?year=2020&month=10</loc>
  <lastmod>2020-11-03T15:31:04+09:00</lastmod>
 </sitemap>
                  ・
                  ・
                  ・
 <sitemap>
  <loc>https://chateau-vulpes.com/sitemap_periodical.xml?year=2013&month=7</loc>
  <lastmod>2020-08-07T15:46:42+09:00</lastmod>
 </sitemap>
 <sitemap>
  <loc>https://chateau-vulpes.com/sitemap_page.xml</loc>
  <lastmod>2020-11-05T19:26:46+09:00</lastmod>
 </sitemap>
</sitemapindex>

・「sitemap_common.xml」・・・トップページとaboutページのみ


<urlset>
<url>
<loc>https://chateau-vulpes.com/</loc>
<lastmod>2020-10-30T02:41:41+09:00</lastmod>
</url>
<url>
<loc>https://chateau-vulpes.com/about</loc>
<lastmod>2020-10-30T02:41:41+09:00</lastmod>
</url>
</urlset>

・「sitemap_periodical.xml?year=2020&month=11」・・・2020年11月分のサイトマップ


<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://chateau-vulpes.com/entry/SGDMY040UBKYY</loc>
<lastmod>2020-11-05T00:17:41+09:00</lastmod>
</url>
<url>
<loc>https://chateau-vulpes.com/entry/Wi-Fi%E4%B8%AD%E7%B6%99</loc>
<lastmod>2020-11-02T22:45:25+09:00</lastmod>
</url>
</urlset>

・「sitemap_page.xml」・・・はてなブログPro版専用の固定ページサイトマップ


<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://chateau-vulpes.com/serch_result</loc>
<lastmod>2020-09-14T16:05:32+09:00</lastmod>
</url>
<url>
<loc>https://chateau-vulpes.com/privacy_policy</loc>
<lastmod>2020-08-18T19:32:47+09:00</lastmod>
</url>
<url>
<loc>https://chateau-vulpes.com/contact_form</loc>
<lastmod>2020-06-15T23:03:30+09:00</lastmod>
</url>
</urlset>

のようになっています。ご参考になりますでしょうか。