はてなブログ特有?サイトマップ問題
※2019/5/21現在、解決しました。本記事は当時の状況を説明したものです。
詳細はコチラにて。
どうにも困った問題があります。
「サイトマップ」という、そのブログの構造を端的に記述したデータが各種ブログサービスでは自動的に作成されるのですが、なぜかうまいこと作成されていない、という問題です。このサイトマップは、Googleなどの検索エンジンが、各種ブログなどの構造を素早く把握し、適切な検索結果が出るよう関連キーワードを調査したり、内容を精査して秀逸か否か、ページを判断するために使用されるものです。
例えば私のこのブログでは、日記、動画、学習(雑学)といったカテゴリーに区分している記事が数十あります。それらカテゴリーはあくまで「ブログ内での立ち位置」であって、検索エンジンには影響が少ないものだと思います。ここで検索エンジンは独自にブログ等を参照して周り(クロール)、クロール時に「この記事は○○というアーティストの音楽をレビューした記事だな、したら○○という検索をしてきたユーザーに対して検索結果として表示させよう」とか、そういった区分をしていくものだと思います。あ、「思います」というのは、あくまで私は専門家ではなく、素人目から見た「推測」の域を出ないためです悪しからず。もちろん、記事本文の内容もある程度は把握されるのでしょうけども、それら全てを把握しているものでもないでしょうし、効率的に考えて見ればある程度の「概要」と、関連ワード程度しか検索エンジンは重視していないんだと思います(だって全部把握してたらキリがないですもの。
で、このクロールを効率的に行うためには、ブログのトップページだけではなく、小ページ(実際に記事が記載されているページ)の所在(URL)がすぐに把握できるようしなければならないのですが…、なぜか私のブログ(いや、はてなブログ全体かもしれませんが)がおかしいことになっているのです。
具体的な状況を記載しましょう。
1)サイトマップは存在するが、端折りすぎ
はてなブログのサイトマップは自動的に作成されます。ブログのトップページアドレス(このブログではhttps://nishi-higashi.hatenablog.com/)の最後に「sitemap.xml」と記載すれば(このブログではhttps://nishi-higashi.hatenablog.com/sitemap.xml)、実際に内容が確認できます。
で、内容を確認すると…
いやぁね、私も専門家じゃないのでアレですけども、短すぎるんじゃないかと。記事のアドレス、一つもないし。ということでGoogle先生にこのサイトマップをご報告いたします。
先生、これが私のサイトマップです。
左端から「送信したアドレス」、「そのアドレスは一体何者か」、「送信日」、「送信前に最後にGoogleがチェックした日」、「ステータス」、「検出したアドレス数」です。先生曰く「バッチリ!検出したよ!」とお返事を頂いているのですが、どう見ても0。右に傾けど、左に傾けども0。ページが検出されていません!なんぞこれ。
2)謎のアドレスは何者だ
くそう、このままではアカン。なんとか手がかりを…そういえばサイトマップに何かアドレスが記載されていたな。ちょっとアクセスしてみよう。
内容は...
こ、これだ!私が求めていた、本来あるべきサイトマップ!
よし、これをGoogle先生にご報告しよう。
先生!こっちがモノホンでした!
Google先生「ちょっと何言ってるかわからない」
上段が今回送ったもの、下段が先程送ったものです。たぶん今回のものはアドレス末尾が「xml」ではないために、先生が首を傾げて「不明だわ」と言っているものだと思います。中身見れば分かるでしょ!とツッコミたくなる気持ちもありますが、そもそも先生が用意したルールに則っていないレギュレーション違反。こちらが悪いのです。
結局こいつは謎のアドレスでしかないのです。
以上が状況です。
あ、ちなみにモノホンのサイトマップがどういうものか、ということで調べてみます。サイトマップは別途、作成することができます(が、はてなブログは写真しかアップロード出来ないため外部で作成したサイトマップデータが使えないのです)ので、その外部サービスを利用してみます。
みんなだいすきterapadで表示いたしております。
うん、まぁ普通こうやってたくさん並ぶよね、アドレスが。記事アドレスのみならずカテゴリーのページまで載ってます。これが本当のサイトマップ。実に綺麗だ。
★なぜサイトマップが微妙な出来なのか考えてみる
サイトマップは存在するけどサイトマップじゃない原因を考えてみました。
私のブログは無料ユーザーとして開設したものであり、有料(PRO)ユーザーとはブログのテンプレートにある「違い」があります。それは「ブログトップページに掲載する形式」です。私(無料)の場合は記事全て(ただし「続きを読む」を設定している場合は別途、記事ページのリンクが貼られます)トップページ内に記載されますが、PRO(有料)の場合は「記事タイトルと本文の一部のみ掲載する」か、「無料同様、記事タイトルと本文全て掲載する」かがテンプレートによって選択出来るのです。この「タイトル&本文一部」の表示のみの場合には、もしかするとサイトマップが適正に表示されるのではないか...これが私の推測です。あくまで、推測です。
ちなみにネットでもこの件(サイトマップぇ...の件)に関する記事がずらっと出てきます。が、PROユーザーさんが多かったり、果ては「続けてたら治った!何だったんだろう!」みたいな歓喜極まる記事もそこそこあったり。当初からこの件については気付いていたのですが、「続けりゃ何とかなるさ」という軽い感じで続けていたものの、一行に変わる気配もないので、ちょっとしんみりしてます。お財布はグッタリしてます。
そんな感じで、ちょっと他ブログへ移行しようか真面目に検討中です。